Legaturi statistice intre variabile
-
Upload
adina-mihaela -
Category
Documents
-
view
317 -
download
4
Transcript of Legaturi statistice intre variabile
-
7/25/2019 Legaturi statistice intre variabile
1/25
1
CURS STATISTIC- Unitatea de nvarenr. 9
LEGTURI STATISTICE DINTRE VARIABILE
Cuprins:
1.Noiuni introductive privind legturile statistice dintre variabile.
2. Tipuri de legturi statistice
3. Metode simple de stabilire a existenei i a formei de legtur dintre fenomenele i
procesele economico-sociale
4. Metode analitice parametrice de msurare a legturilor dintre fenomene i procese
economico-sociale
5. Metode neparametrice de msurare a legturilor dintre fenomene
6. Teste de autoevaluare
7. Rspunsuri i comentarii la testele de autoevaluare.
8. Teme de control.
9. Rezumatul unitii de nvare.
10. Bibliografia unitii de nvare.
1. Noiuni introductive privind legturile statistice dintre variabile
Teoria economic actual, cu ajutorul creia caracterizm i analizm funcionarea
legturilor mecanismului economic, pune n eviden multiplele interdependene care se
manifestn activitatea economic. Fundamentarea deciziilor de politic economic i social
trebuie s in seama deastfel de dependene n egalmsurca fundamentarea deciziilor la
nivelul agentului economic. De aceea, selectarea dependenelor care au caracter de stabilitate
i msurarea acestora a constituit o preocupare prioritar a teoriei i cercetrii economice.
Asupra fenomenelor social-economice acioneaz o multitudine de factori, principali i
secundari, eseniali i neeseniali, cuantificabili i necuantificabili sau cuantificabili cu
aproximaie, care se gsesc ntr-o relaie de interdependen reciproc.
-
7/25/2019 Legaturi statistice intre variabile
2/25
2
2. Tipuri de legturi statistice
Legturile ce se pot forma sunt legturi stohastice, n care un fenomen este factor de
influenta, iar cellalt este efect. Statistica, printr-o gam larg de procedee i metode
specifice, poate studia manifestarea concret a acestor legturi, le poate exprima cantitativ i
msura intensitatea cu care se produc. Legtura (dependena) statistic se caracterizeaz prin
faptul c, la modificarea unui factor de influen, factorul influenat rspunde cu o distribuie
de valori.
Legturile statistice se pot clasifica astfel:
1) Dup natura relaiei de cauzalitate distingem:
a) legturi funcionale. Acestea se manifest ntre dou fenomene n care unul este cauza iarcellalt efectul. Se ntlnesc n natur, tehnic etc. Dac senoteaz fenomenul cauz cu x i
fenomenul efect cu y atunci relaia matematic este: y = f(x)
b) legturi statistice(stohastice) apar atunci cnd fenomenul efect este rezultatul combinrii
influenei mai multor cauze, care pot aciona n condiii egale sau diferite. Relaia matematic
este: y = f(x1,x2,..,xn), unde: x1, x2, ..., xn sunt valorile fenomenelor cauz care au
fost nregistrate; y = valorile fenomenului efect.
Exemplu
O legatura stohastica este legtura dintre capacitatea de cazare (xi) i valoarea ncasrilor din
activitatea hotelier (yi). ntre cele dou caracteristici exist o legtur statistic pentru c
asupra ncasrilor acioneaz i alte cauze: tarifele practicate, gradul de confort etc.
2) Dup numrul de caracteristici incluse n modelul de corelaie distingem:
a) legturi simple. Acestea au la baz dou caracteristici: una factorial, iar cealalt
rezultativ (celelalte caracteristici factoriale chiar dac sunt nregistrate se consider cu
aciune constant).
Exemplu
Un exemplu de legtura simpla este cea dintre suprafaa comercial i valoarea vnzrilor.
b) legturi multiple. Acestea au n vedere dependena unei caracteristici rezultative n funcie
de mai muli factori nregistrai sau dependena mai mulor variabile rezultative (y1, y2, .. ,
-
7/25/2019 Legaturi statistice intre variabile
3/25
3
yn) de o variabil factorial (xi). Ecuaiile de estimare sunt: y = f(x1, x2, x3,...,xn) i y1, y2,...,
yi,...yn = f(xi).
Exemplu
Un exemplu de legtura multipleste cea dintrevaloarea ncasrilor ce depinde de zona de
amplasare (x1), de categoria de confort (x2), de baza material (x3) etc.
3) Dup direcia legturii distingem:
a) legturi directe (pozitive): exist atunci cnd, pe msur ce se modific nivelul de
dezvoltare al caracteristicii factoriale, se modific n acelai sens i nivelul caracteristicii
rezultative.
b) legturi inverse (negative):au n vedere modificri n sens contrar nivelului de dezvoltare
(o variabil crete iar cealalt scade).
4) Dup forma de exprimare a variabilelor corelate distingem:
a) legturi de asociere. Acestea exprim relaia dintre dou sau mai multe caracteristici
exprimate calitativ (prin cuvinte) sau ntr-o caracteristic calitativ i una cantitativ
(exprimat numeric).
b) legturi de corelaie. Exprim relaia de interdependen dintre dou sau mai multe
caracteristici statistice exprimate numeric.
5) Dup forma de realizare a legturii distingem:
a) legturile liniareexprimate printr-o funcie liniar, de gradul intai;
b) legturile neliniareexprimate printr-o curb (exponenial, parabol, hiperbol etc.);
6) Dup timpul n care se realizeaz:
a) legturi sincrone:au loc n acelai timp i se pot urmri n dinamic pentru aceeai
perioad.
Exemplu
O astfel de legatura este legtura dintre dinamica desfacerilor de mrfuri i dinamica
ctigului mediu salarial.
b) legturi asincrone: influena caracteristicilor factoriale asupra variaiei caracteristicii
rezultative apare dup trecerea unei perioade de timp. Forma de realizare a legturii
corespunde funciei matematice de regresie (de estimare) care se alege pe baza graficului de
corelaie (corelogramei).
-
7/25/2019 Legaturi statistice intre variabile
4/25
4
3. Metode simple de stabilire a existenei i a formei de legtur dintrefenomenele i procesele economico-sociale
Pentru a caracteriza legtura dintre fenomene, se pot folosi mai multe procedee ce se
ncadreaz n categoria metodelor simple de caracterizare a legturilor. Aceste metode sunt
uor de aplicat i se bazeaz pe analiza calitativ a variabilelor corelate, oferind informaii
asupra naturii i trsturilor eseniale ale legturii cercetate.
Metodele simple de caracterizare a legaturilor stohastice sunt urmatoarele:
1)Metoda seriilor paralele interdependenteare la baz serii paralele de date, obinute prin
operaia de centralizare la nivelul unitilor simple sau complexe, fr a fi grupate. Se pot
folosi serii: de timp, de spaiu i atributive.Aceast metod ne ofer posibilitatea de a stabili
existena legturii i direcia de realizare a acesteia, prin analiza valorilor perechii x, y.
Aceast metod este mai puin sugestiv n cazul seriilor formate dintr-un numr foarte mare
de termeni i implic ntr-o msur important subiectivismul cercettorului.
2)Metoda grupriloreste o metod de sistematizare a datelor pe baza creia se pot cerceta
legturile (conexiunile) statistice. Se poate folosi gruparea simpl sau gruparea combinat.
Exemplu
Despre 22 de salariai ce activeaz n ramura comerului se cunosc datele:
Gruparea salariailor dupvechime
Numr salariaiValoarea ncasrilor
(mil lei)
< 5 2 80
5 - 10 5 83
10 - 15 7 85
15 - 20 5 87
> 20 3 89
Gruparea simpl presupune gruparea unitilor statistice dup o caracteristicprincipal de grupare i calculul i interpretarea mediilor pariale sau a mrimilor relative
pariale pentru caracteristica rezultativ. Gruparea combinat se bazeaz pe mprirea
unitilor statistice n grupe concomitente dup variaia a dou caracteristici de grupare (x,y),
iar rezultatele gruprii se prezint ntr-un tabelul combinat cu dubl intrare (vezi capitolul II).
Metoda gruprii trebuie utilizat doar n cazul unui numr mare de observaii statistice, cnd
aplicarea metodelor analitice de calcul nu se poate face fr o grupare prealabil a datelor
nregistrate.
-
7/25/2019 Legaturi statistice intre variabile
5/25
5
I-legtu
r
directII-legtur
inversI-legtu
r
directII-legtur
invers
3) Metoda tabelului de corelaie presupune utilizarea unui tabel combinat cu dubl
intrare care ne sugereaz existena legturii, direcia de realizare a ei i unele aprecieri
empirice privind intensitatea legturii prin analiza modului n care frecvenele comune (nij) se
distribuie n rubricile interioare ale tabelului. Dac frecvenele n ij tind a se concentra ctre
cele dou diagonale trasate n tabelul urmtor,legtura ntre xii yjva fi intens. n schimb,
dac se mprtie la ntmplare n reeaua tabelului, legtura este slab sau poate lipsi. n
concluzie, procedeul tabelului de corelaie este o combinare a metodei gruprii cu
principiile de construire i interpretare a unei reprezentri grafice.
xi \ yj y1, y2, .... yj ... yp Total
xr
xr-1
:
xi
:
x2
x1
nij
nr
nr-1
:
ni
:
n2
n1
Total n1, n2, .... nj ... np
4) Metoda grafic. Graficul de corelaie se mai numete corelogram. Pentru
construcia acestuia se utilizeaz sistemul de axe rectangulare, unde pe axa OX se nscriu
valorile caracteristicii principale de grupare (x), iar pe axa OY valorile caracteristicii
secundare de grupare (y). Intersecia abscisei cu ordonata se concretizeaz printr-un numr de
puncte ce se dispun sub form de nor, numrul punctelor fiind egal cu numrul de uniti
statistice luate n calcul. Dup modul de distribuire a punctelor n reeaua graficului, printre
acestea se traseaz vizual o dreapt sau o curb ale crei ecuaii se cunosc. n cazul n care
curba sau dreapta se traseaz pe prima diagonal, legtura este direct, dac se traseaz peceade a doua diagonal, legtura este invers.Metoda grafic se utilizeaz ca metod empiric
pentru alegerea funciei matematice ce se analizeaz n cazul regresiei i corelaiei statistice.
4. Metode analitice de msurare a legturilor dintre fenomene
Metodele analitice iau n consideraie valorile reale ale varibilelor corelate i parametriicorespunztori acestora. Acestea poart denumirea de metode parametricei sunt:
-
7/25/2019 Legaturi statistice intre variabile
6/25
6
1) metoda regresiei;
2) metoda covarianei;
3) metoda raportului de corelaie;
4) metoda coeficientului de corelaie;
5) metoda analizei dispersionale.
1)Metoda regresieireprezint o metod statistic de analiz a legturii dintre variabile cu ajutorul
unor funcii, numite funcii de regresie. Funcia de regresie se alege printr-o modalitate empiric
folosind graficul de corelaie (corelograma) siprin aplicarea testelor de semnificaie (de exemplu:
testul F de analiz dispersional). n funcie de numrul de variabile incluse n model,
distingem: regresie unifactorial (o varibil factorial xi i o variabil rezultativ yi) i
regresie multifactorial (mai multe variabile factoriale i o singur variabil rezultativ).
a)Regresia unifactorial liniarare la baz ecuaia dreptei (funcia de gradul nti):
ix bxay i+=
De menionat c dependena liniar dintre yi i xi se consider o dependen
stohastic n care unei valori xi i pot corespunde mai multe valori yi. Funcia yxi =
valorile ajustateale lui yi dup ecuaia dreptei i presupune nlocuirea valorilor empirice cu
valori teoretice obinute prin calcul n urma aplicrii unei metode sau unui model de calcul
statistic; xi = variabila factorial; yi = variabila rezultativ; a, b = parametrii ecuaiei de
regresie care pot fi interpretai n sens geometric i n sens statistic. Parametrul a
exprim n sens geometric ordonata la origine i poate lua att valori pozitive, ct i valori
negative. Are caracter de mrime medie, n sensul c valoarea sa arat la ce nivel ar fi ajuns
valoarea caracteristicii yi dac toi factorii mai puin cel nregistrat xi ar fi avut o
aciune constant.Parametrul b exprim n sens geometric panta liniei drepte i poart
denumirea de coeficient de regresie. Msoar cu ct se modific n medie variabila rezultativ
(yi) dac variabila factorial (xi) se modific cu o unitate (semnul lui b ne indic direcialegturii).Parametrii a i b se determin din sistemul de ecuaii normale obinut prin metoda
celor mai mici ptrate, care se bazeaz pe minimizarea ptratelor abaterilor dintre valorile
individuale nregistrate i valorile teoretice (corespunztoare funciei). Aceast funcie
obiectiv presupune identificarea punctului de extrem (are n vedere determinarea parametrilor
funciei) si verificarea dac punctul de extrem este minim sau maxim (se realizeaz prin
semnul derivatei de ordinul II dac este pozitiv (semnific minim) dac este negativ
(semnific maxim). Relaia de minimizare este: 2xi )yy( i = minim. Pentru tendina liniar
-
7/25/2019 Legaturi statistice intre variabile
7/25
7
a legturii avem: = 2ii )bxay(f = minim. In functia de mai sus condiia de minim a unei
funcii de dou derivabile se anuleaz cnd derivatele pariale, n raport cu cei doi parametri
(a, b), sunt: 0)1)(bxay(2da
dfii == si 0)x)(bxay(2
db
dfiii ==
=+
=+
ii2ii
ii
yxxbxa
yxbna; i = n,1 . Rezolvand sistemul se calculeaza termenul liber, a, si panta
dreptei, b, dupa metoda determinantilor, astfel:
==
=
2i
2i
iii2ii
2ii
i
2iii
ii
)x(xn
yxxxy
xx
xn
xyx
xy
aa
;i= n,1
==
=
2i2i
iiii
iii
i
iii
i
)x(xn
yxyxn
yxx
xn
yxx
yn
bb
; i = n,1
Interpretarea pantei: daca b > 0 legtura de corelaie este direct (pe msur ce
cresc valorile lui xicresc i valorile ecuaiei de regresie calculate); daca b < 0 legtura de
corelaie este invers (pe msur ce crete valoarea caracteristicii factoriale (xi) scade valoarea
caracteristicii rezultative (yi) si daca b = 0 cele dou variabile sunt independente i yxi= 0.
Funcia de regresie exprim statistic modul n care caracteristica rezultativ (yi) se modific,
dac ar influena numai caracteristica factorial (xi), iar ceilali factori sunt considerai cuaciune constant.
a) y b) y
yxi= -a +bxi yxi= a - bxi
tg x tg x
a < 0 i b > 0 legtur direct a > 0 i b < 0 legtur invers
figura 1.1 figura 1.2
c) y d) y
yxi= a yxi= bxi
a > 0 i b = 0 lipsa legturii a = 0 i b > 0 legtur funcional
figura 1.3 figura 1.4
-
7/25/2019 Legaturi statistice intre variabile
8/25
8
Fig. 1 Interpretarea geometric a parametrilor
Regresia unifactorial liniar se utilizeaz n urmtoarele cazuri:pentru un numr mic de
informaii negrupate, dar prezentate sub forma a dou serii paralele interdependente (x i i yi) caz
prezentat anterior sipentru un numr mare de informaii sistematizate pringrupare simpl(x i,yi, nivalori cunoscute) sigrupare combinat(yj, ni, nj, nij, xivalori cunoscute).
Pentru cazul (1) (grupare simpl) sistemul de ecuaii normale se determin prin analogie
cu cel prezentat anterior, cu deosebirea c se va ine seam de frecvenele comune (ni) pentru
cele dou varibile xii yi. Sistemul de ecuaii normale este:
=+
=+
iiii2iii
iiiii
nyxnxbnxa
nynxbna
2iii
2ii
iiiiiiii2i
)nx(nxn
nyxnxnynxa
=
2iii
2ii
iiiiiiii
)nx(nxn
nynxnyxn
b
=
Pentru cazul (2) (grupare combinat) rezultatele se prezint ntr-un tabel combinat cu
dubl intrare, iar sistemul de ecuaii se determin prin analogie cu cel de la cazul (1):
=+
=+
K
i
m
jijji
K
ii
2i
K
iii
m
jjj
K
iii
K
i
m
jij
nyxnxbnxa
nynxbna
Din rezolvarea sistemului de ecuaii normale se obin formulele uzuale de calcul al
parametrilor a i b. Legturile dintre fenomene nu se bazeaz mereu pe modele simple de
regresie pentru c pot exista mai multe variabile factoriale i o singur variabil rezultativ de
forma: y = f(x1, x2,,xi, , xn). Asemenea legturi poart denumirea de modele de
regresie multifactoriale care au la baz funcia: liniar, exponenial, hiperbolic, parabolic.
2) Metoda covarianei se utilizeaz pentru msurarea intensitii legturilor de tip
statistic ntre dou sau mai multe variabile la nivelul ntregii colectiviti.Covarianaeste un
indicator sintetic de corelaie simbolizat prin cov(x,y), se obine ca o medie aritmetic a
produselor abaterilor variabilelor fa de media lor conform relaiei:
yx
n
1iii
)y,xcov(
)yy)(xx(n
1)y,xcov(
= = . Semnul indicatorului arat direcia legturii: plus (legtura
direct), minus (legtura indirect), iar covariana nul ne indic lipsa legturii de corelaie
(variabilele sunt independente). Covariana are ca neajuns faptul c depinde de unitile n
care se msoar variabilele aleatoare.
3)Metoda raportului de corelatie
-
7/25/2019 Legaturi statistice intre variabile
9/25
9
Pentru stabilirea intensitii legturii dintre dou varibile (x i, yi) se calculeaz un
indicator sintetic de corelaie numit raport de corelaie simbolizat cu Rx/y. Acesta permite
msurarea gradului de intensitate a realizrii legturii dintre caracteristica considerat factor
de influen (xi) i caracteristica rezultativ (yi), indiferent de forma legturii: liniar sau
neliniar.Calculul se bazeaz pe descompunerea variaiei totale (dispersiei) a caracteristicii
rezultative y astfel:
)yy( 0i = )yy( ixi + )yy( 0xi
abaterea ntmpltoare
abaterea sistematic
Prin nsumare i ridicare la ptrat se obine:
=+= 20xxi
2
0i )]yy()yy[()yy(
ii
++ 2
00
2
)())((2)(0
yyyyyyyy iiii xxxixi
n
)yy(
)yy(
20i
20i
=
=
n
)yy(
)yy(
2xi
2xi
i
i
+
+
n
)yy(
)yy(
20x
20x
i
i
2y =2
ry +
2
xy
Dispersia total: arat
influena tuturor factorilor
eseniali i ntmpltori
care determin
variaia total a variabilei
rezultative yi
Dispersia rezidual: arat
acea parte din variaia
variabilei rezultative yi
datorat aciunii factorilor
ntmpltori
Dispersia sistematic:
arat influena factorului
xi asupra variaiei
caracteristicii
rezultative yi
Raportul de corelaie se determin pornind de la regula de adunare a dispersiilor
(prezentat anterior), utiliznd coeficientul de determinaie ( 2 x/yR ) i coeficientul de
nedeterminaie ( 2 x/yK ): 100R 2y
2x/y2
x/y
= si 100K
2y
2r/y2
r/y
= . Raportul de corelaie se
calculeaz ca rdcin ptrat din coeficientul de determinaie astfel:
=
/
/
=
=
=
==
n
)yy(
n
)yy(
1
)2(
1
)1(
RR2
0i
2xi
2y
2r/y
2y
2r/y
2y
2y
2x/y2
x/yx/y
i
)3(
2
0
2
)(
)(1
yy
yy
i
xi i ; i = n,1
-
7/25/2019 Legaturi statistice intre variabile
10/25
10
Formula de calcul simplificat a raportului de corelaie se determin astfel:
n
)y(y
yxbyay1R
2
i2i
iii2i
x/y
=
; i = n,1 . Raportul de corelaie ia valori n intervalul [0,1]
= 0 lips de legtur (varibilele sunt necorelate) 0 legatur foarte slab sau poate lipsi
Ry/x[0,1] = 1 legtur de tip funcional, variabila yi depinde n
exclusivitate de variabila xi
1 legtur puternic, intens
n cazul legturilor de tip invers, semnul raportului de corelaie este dat de ctre semnul
coeficientului de regresie (b). n funcie de informaiile folosite n calcul i de modelul lor de
sistematizare, raportul de corelaie se calculeaz n urmtoarele dou cazuri:1) Numr mic de informaii, n care se dau valorile xi, yi, caz n care Ry/xse calculeaz
dup formulele 1,2,3, explicitate anterior;
2) Numr mare de informaii:
a) se dau valorile lui xi, yii nifrecvenele lor comune:
=
i2
i
i2
xi
x/yn)yy(
n)yy(1R i ; i = n,1
=
i
2ii
i2i
iiiiii
2
i
n
)ny(ny
nyxbnyany1 ; i = r,1
b) se dau valorile lui xi, frecvenele dup variabila xi(ni), frecvenele dup variabila
yj(nj) i frecvena comun nij:
=
=
j2
0j
ij2
xjx/y
n)yy(
n)yy(1R i
=
j
2jj
j2j
ijjijjj
2
j
n
)ny(ny
nyxbnyany1 ; j = m,1 ; i = K,1
4)Metoda coeficientului de corelaie
Coeficientul de corelaie este un indicator sintetic prin care se msoar legtura dintre
dou variabile (xi, yi) statistice a cror distribuie este asimptotic normal sau normal.
Calculul coeficientului de corelaie se bazeaz n forma iniial pe produsul abaterilor normale
normate (pentru un numr de date individuale negrupate):
-
7/25/2019 Legaturi statistice intre variabile
11/25
11
y
iy
x
ix
yyZ
xxZ
=
=
Coeficientul de corelaie se calculeaz ca o medie a produselor abaterilor normale
normate:
yx
iiy
i
x
i
x/yn
)yy)(xx(
n
yyxx
r
=
=
; i = n,1
Dac n relaia (1) vom nlocui:n
xx i= ;
n
yy i
= ; i = n,1 ;
n
)xx( 2ix
= i
n
)yy( 2iy
= se obine relaia: ry/x=
])y(yn][)x(xn[
yxyxn
2i
2i
2i
2i
iiii ; i = n,1 (2)
Folosind covariana: ry/x=ii yx
ii )y,xcov(
Interpretare:
1) ry/x [-1,1] apreciem din punct de vedere al semnului direcia legturii i din
punct de vedere al mrimii intensitatea legturii.
Dac: ry/x = 0 legtura lipsete i variabilele xii yisunt independente;
ry/x 0 legtura dintre cele dou varibile este slab;
ry/x= 1 legtur de tip funcional (fie direct dac semnul coeficientului este
pozitiv, fie invers dac semnul coeficientului este negativ);
ry/x 1 variabilele sunt puternic corelate, legtura fiind intens.
2) ry/x = Ry/x se aprecieaz c legtura de corelaie este de forma liniar, ceea ce
nseamn c se poate folosi fie coeficientul, fie raportul de corelaie.
3) Valoarea coeficientului de corelaie depinde de forma liniei de regresie, motiv pentru
care acest indicator este semnificativ pentru corelaiile de tip liniar i mai puin semnificativ
pentru corelaiile de tip neliniar (n cazul din urm folosindu-se raportul de corelaie).
4) n cazul legturii liniare se mai poate calcula ca o medie geometric a coeficienilor
de regresie (b) astfel:
y/xx/yx/y bbr =
-
7/25/2019 Legaturi statistice intre variabile
12/25
12
unde:
2i
2i
iiiiy/x
2i
2i
iiiix/y
)y(yn
yxyxnb
)x(xn
yxyxnb
=
=
; i = n,1
Coeficientul de corelaie se calculeaz n funcie de datele folosite n analiz i de moduln care au fost sistematizate informaiile. Astfel:
a) - numr mic de informaii n care se dau valorile lui xi, yi sub forma a dou serii
paralele; ry/xse calculeaz dup formula (1), (2) i (3) prezentate anterior.
b) - numr mare de informaii, cunoscndu-se xi, yi i frecvenele lor comune (ni)
=
yxi
iiix/y
n
n)yy)(xx(r ; i = n,1
unde:
====i
i2
iy
i
i2
ix
i
ii
i
ii
n
n)yy(;
n
n)xx(;
n
nyy;
n
nxx ; i = n,1
nlocuind n formula (1) a lui ry/xse obine:
])ny(nyn][)nx(nxn[
nynxnyxnr
2iii
2ii
2iii
2ii
iiiiiiii
x/y
= ; i = n,1
c) se cunosc valorile lui xi, yj, ni, nj, nij, obinute prin gruparea combinat, rezultatul
fiind prezentat ntr-un tabel combinat cu dubl intrare i atunci relaia de calcul devine:
])ny(nyn][)nx(nxn[
nynxnyxn
r2
jjj2jj
2iii
2ii
jjiiij
i
ji
j
ij
x/y
= ;m,1j
n,1i
=
=
5)Metoda analizei dispersionale. Raportul de determinare
O modalitate eficient folosit n caracterizarea conexiunilor este metoda analizei
dispersionale(metoda coeficientului de determinare), care se poate folosi n mai multe cazuri
i anume: la verificarea independenei unui fenomen comercial sau turistic, la verificarea
stabilitii mediei i dispersiei pentru mai multe eantioane succesive, la verificareadependenei unui fenomen comercial sau turistic de factorii si de influen . Dac analiza
dispersional se utilizeaz dup aplicarea corelaiei statistice, atunci aceasta este considerat o
metod prin care se testeaz semnificaia curbei (funciei) de regresie explicitate.Analiza
dispersional are la baz metoda gruprii, prin care unitile observate se separ n grupe dup
variaia caracteristicii de grupare (considerat factor de influen).Aplicarea acesteia are la baz
gruparea combinat (dup cele dou variabile x ii yj). Poate fi utilizat att ca metod simpl
de caracterizare a corelaiilor, prin care se stabilete dac variabila factorial influeneaz
semnificativ variabila rezultativ, dar i ca metod analitic de combinare a acesteia cu
-
7/25/2019 Legaturi statistice intre variabile
13/25
13
analiza regresiei. Analiza dispersional se poate utiliza n urmtoarele situaii: nainte de
aplicarea metodei corelaiei, caz n care se poate verifica gradul de semnificaie a factorului
considerat principal pentru producerea variaiei caracteristicii rezultative si dup utilizarea
metodei regresiei i corelaiei, caz n care se poateverifica corectitudinea funciei matematice
cu ajutorul creia s-au estimat valorile caracteristicii rezultative n raport cu variaia
caracteristicii factoriale.
Pentru prezentarea modelului analizei dispersionale prin care se testeaz forma de
legtur,pornim de la variaia total a varibilei (Y) care se descompune n urmtoarele trei
elemente: (yj- 0y ) = (yj- iy ) + ( iy - yxi) + (yxi- 0y ),
unde: 0y = media total a variabilei Y
yj= valorile variabilei Y
iy = mediile condiionate ale variabilei Y
Yxi= valorile ajustate ale variabilei Y n funcie de X
Calculul raportului de determinare se bazeaz pe descompunerea variaiei seriei de
date y1,,yT n funcie de influena factorilor inclui n modelul de regresie i factori aleatori
nenregistrai: = 2)( yySST i ; relaia anterioara cuantific dispersia seriei valorilor
variabilei endogene sub aciunea tuturor factorilor de inferen. Influena factorilor de
regresie este data de ==
22)( ii eyySSE . Pe baza abaterilor menionate se calculeaz
dispersiile medii corelate ale variabilei Y, respectiv dispersia total S2y, dispersia n postura
de estimaii ale dispersieitotale, adic: Pentru msurarea dependenei legturii ntre variabila
endogen i factorii de regresia se calculeaz raportul de determinare (R2).
SST
SSE
SST
SSRR == 12
Calculele necesare determinrii lui R2 sunt realizate din cadrul unei analize dispersionale
(ANOVA).
Tabel ANOVA pot fi folosite pentru modelul de regresie
Sursa variabilei Suma ptratelor Grade de libertate Media sumei ptratelor
Regresia rezidual SSR
SSE
K-1
T-K
MSSR=SSR/K-1
MSSE=SSE/T-K
TOTAL SST T-1
Rezultatele ANOVA pot fi folosite pentru construirea testului F
-
7/25/2019 Legaturi statistice intre variabile
14/25
14
MSSE
MSSRF=
F urmeaz o distribuie Fisher cu K-1 i T-K grade de libertate. Pentru un prag de semnificaie
se stabilete valoarea teoretic F;K-1;T-K
Dac:
F cal < F;K-1;T-K influena regresiei difer semnificativ de cea a factorilor reziduali;
deci modelul este valid.
F cal > F;K-1;T-K modelul este invalid.
De asemenea dac:
F calc > F teoretic atunci apreciem c legtura dintre X, Y este semnificativ i se pot
aplica n continuare i alte metode de calcul statistic pentru a cuantifica legtura dintre
X i Y.
Fcalc < Fteoreticlegtura nu este semnificativ, variabilele sunt necorelate.
Exemplu
n vederea estimrii cheltuielilor lunare pentru alimentaia public,
s-a efectuat o cercetare prin sondaj, pe baza unui eantion de 15%, selectat ntmpltor i
nerepetat din numrul total de persoane. Persoanele chestionate au fost mprite n cinci
grupe tipice, dup veniturile medii lunare nete. n urma nregistrrii i prelucrrii datelor, s-auobinut rezultatele:
Colectivitate general Colectivitate de selecie
Grupe tipice
de persoane dupvenituri lunare
(zeci mii u.m.)
Numrulpersoanelor
Cheltuieli medii
lunare pentru
alimentaie public(zeci mii u.m.)
Coeficientul
de variaieal cheltuielilor
pentru alimentaiepublic (%)
Numrulpersoanelor plasate
peste media
cheltuielilor pentru
alimentaie publicpe grupe
sub 70 1000 8 25 5070-74 1500 7 18 100
74-78 2000 11 20 15078-82 1200 15 15 95
peste 82 800 18 22 70Total 6500 - - 465
Se cereconsidernd c media cheltuielilor lunare pentru cele 6500 de persoane este 11,8 zeci
mii u.m.:
1. Precizai dac veniturile lunare reprezint un factor semnificativ al cheltuielilor medii
pentru alimentaia public; folosind a) regula de adunare a dispersiilor; b) testul F de
analiz dispersional, tiind c pentru P= 0,99;
-
7/25/2019 Legaturi statistice intre variabile
15/25
15
2. S se msoare intensitatea legturii dintre veniturile lunare i cheltuielile medii pentru
alimentaie public pentru persoanele din eantion, folosind un indicator de corelaie adecvat.
Rezolvare:
Calculam media generala si dispersiile din fiecare grupa aplicand regula de adunare adispersiilor:
zecimiiUM1111,211,8
12018180153001115071508
in
in
iy
y =++++
=
=
Deoarece dy% = -5%; n= 975 persoane este reprezentativ.
Regula de adunare a dispersiilor 2202
0 += ; =+= 4,1906,1434,52
0
%721004,19
06,14100
20
22 ===
R
Dispersiile de grup: ( ) 42122 === ii ; 6,1
22 = ; 1,5
2
4 = ; 7,152
5 =
Media dispersiilor de grup ( )i
34,5975
1207,151801,53008,42256,115042
2
1 =++++
==
i
ii
n
n
Dispersia dintre grupe: ( )
( ) ( ) ( ) ( ) ++++==
975
3001111225117150118 222
2
i
ii
n
nyy
( ) ( )06,14
975
12011181801115 22=
+++
Dac %722 =R , adic %282 =k . Pentru ca 22 kR > ; %28%72 > veniturile lunare
constituie factor semnificativ pentru cheltuielile cu alimentaia public. Pentru certitudine, se
va folosi testul F de analiz dispersional.
b) ===z
zy
x
xy
zy
xy
calcnnS
SF
2/
2/
2
/
2/
: ( ) :1
2
=
r
nyy ii =
rn
n
i
ii2
638970
5,5206:
4
5,13708== , Deoarece teoreticcalc FF > ; 62,4638 > , veniturile lunare
influeneaz semnificativ cheltuielile pentru alimentaia public.
-
7/25/2019 Legaturi statistice intre variabile
16/25
16
5. Metode neparametrice de msurare a legaturilor dintre fenomenele
economico-sociale
Aceste metode, pe lng faptul c pot stabili intensitatea legturii fcnd abstracie de
tipul de distribuie, permit msurarea intensitii legturii nu numai pentru caracteristicile
cantitative, dar i pentru cele calitative. Poart denumirea de metode neparametrice deoarece
nu iau n calcul ntotdeauna valorile variabilelor corelate i nici parametrii lor corespunzatori.
n concluzie, se folosesc n urmtoarele situaii: cnd distribuia variabilelor corelate nu e
normal sau asimptotic normal;cnd nu este cunoscut forma de distribuie a variabilelor;
cnd variabilele corelate sunt asimetrice, deci prezint asimetriepronunat sicnd avem de-a
face cu variabile calitative i cantitative care n prealabil necesit o anumit cuantificare.
Metodele neparametrice uzuale sunt:
1) Coeficientul de asociere a lui Yulepresupune ntocmirea tabelului de asociere, care
este un tabel combinat cu dubl intrare utilizat pentru variabilele de tip alternativ (DA/NU;
F/M; etc.). Tabelulul de asociere este format din dou rnduri i dou coloane:
n11 n12
n21 n22
n care n captul rndurilor se trec valorile celor dou caracteristici asociate, iar n interiorul
tabelulului se trec frecvenele corespunztoare lor.
Exemplu:Dac avem n vedere dou variabile statistice x i i yi i considerm c
sunt variabile de tip alternativ, atunci asocierea dintre xi i yi se prezint astfel:
yi
xiDA NU Total
DA
NU
n11
n21
n12
n22
n11+ n12
n21+ n22
Total n11+ n21 n12+ n22
(n interiorul tabelului se consemneaz concomitent rspunsurile privind cele dou variabile
corelate xi i yi). Pentru stabilirea valorii numerice a coeficientului de asociere care s
indice existena i intensitatea legturii, se calculeaz coeficientul lui Yule conform relaiei:
12212211
12212211
nnnn
nnnnQ
+
= ; unde Q [-1,1]
Dac: Q = 0 lipsa de asociere ntre xi i yi
Q 0 asociere redus ntre xii yi
Q 1 asociere puternic ntre xii yi
-
7/25/2019 Legaturi statistice intre variabile
17/25
17
Q = 1 asociere perfect ntre xii yi
Produsul n11 n22= arat gradul de realizare a legturii ntre caracteristicile corelate x i i
yi si produsul n12 n21 = arat lipsa legturii dintre cele dou variabile. Avantajul
utilizrii: se poate calcula cu mult rapiditate, utilizndu-se i n cazul cnd datele provin de la
uniti statistice complexe.
2) Coeficienii de corelaie a rangurilor
Coeficienii de corelaie se calculeaz nlocuind valorileindividuale ale variabilelor cu
numrul lor de ordine numit RANG. Rangurile se atribuie dup ce n prealabil s-au ordonat
datele individuale ale celor dou variabile n ordine cresctoare, astfel nct va trebui s
vedem dac exist concordan ntre rangurile caracteristicii factoriale de la 1 n i rangurile
caracteristicii rezultative de la 1 n. Avantajul utilizrii acestora:
1) pot fi utilizai cu succes i n cazul unor distribuii asimetrice;
2) pot fi utilizai pentru un numr restrns de uniti pentru care nu se poate verifica
reprezentativitatea datelor pariale.
a) Coeficientul de corelaie a rangurilor Spearmaneste o aplicaie a coeficientului de
corelaie liniar simpl la distribuiile celor dou iruri de ranguri. [3]
Acesta se calculeaz parcurgnd urmtoarele etape:
1) se identific cele dou variabile corelate xii yi;
2) se acord ranguri de regul cresctoare n aceeai manier att pentru variabilaxi ct i
pentru variabila yi;
Rangurile sunt numere de ordine care evolueaz n progresie aritmetic cu raia egal cu 1.
3) se determin diferena dintre ranguri (di) i se ridic la ptrat;
4) se aplic formula de calcul:nn
d61r
3
2i
S
=
[-1,1] ce msoar intensitatea legturii dintre
rangurile celor dou variabile corelate, unde: di = diferena dintre rangurile variabilei xi i
rangurile variabilei yi: Rx-Ry si n = numrul perechilor de valori corelate.Dac: rS = 0 ntre rangurile lui xi respectiv yi nu exist legtur (independen,
statistic);
rS 0 legtur foarte slab sau poate lipsi;
rS 1 legtur puternic;
rS = 1 legtur funcional.
b) Coeficientul de corelaie a rangurilor Kendall; pentru a-l determina se folosesc
valorile variabilelor corelate pentru care se acord ranguri. Etapele de lucru sunt:
-
7/25/2019 Legaturi statistice intre variabile
18/25
18
1) se identific variabilele corelate xi i yi;
2) se ordoneaz cresctor variabila xi i, n coresponden cu aceasta, se trec valorile
corespunzatoare variabilei yi;
3) se acord ranguri cresctoare n aceeai manier ca i la coeficientul Spearman;
4) se determin concordana notat cu P i discordana notat cu Q;
5) se calculeaz scorul sau diferena (S = P Q);
6) se aplic formula de calcul:)1n(n
S2rk
= unde: S = P Q [-1, 1]
Concordana (P) este mereu pozitiv i reprezint numrul de ranguri superioare fiecarui
rang considerat al variabilei yi. Discordana (Q) este mereu negativ i reprezint numrul de
ranguri inferioare fiecrui rang considerat al variabilei yi. Coeficientul rangurilor calculat
dup formula lui Kendall este de obicei mai mic dect cel calculat dup formula lui
Spearman, avnd aceeai interpretare.
Exemplu
Pentru exemplificare, presupunem c notele nregistrate la examenul de bacalaureat i media
nregistrat la examenul de admitere la Colegiu Comer pentru 10 candidai se caracterizeaz
prin datele:
Mediabacalaureat (xi)
Mediaadmis
(yi)
Ranguri
Rxi( ) Ryi( )
2
id P Q S
7,007,077,757,807,908,008,158,65
9,259,80
6,906,506,007,207,106,807,257,30
7,807,60
12345678
910
42165378
109
90440900
11
67744432
00
31021000
00
36723432
-1028 37 7 29
Pentru a caracteriza legtura dintre media la bacalaureat i media la admitere folosind metode
neparametrice, vom determina cei trei coeficieni prezentai anterior. (Yule, Spearmen,
Kendall). Pentru coeficientul de asociere Yule, se ntocmete tabelul de asociere, stabilind
poziia fiecrui candidat fa de media celor 10 candidai: 137,810
37,81
n
xx i === si
Asocierea dintre xi i yi, n raport cu media, va fi:
-
7/25/2019 Legaturi statistice intre variabile
19/25
19
yi
xiSub y Peste y Total
Sub x n11= 4 n12= 2 6
Peste x n21= 0 n22= 4 4
Total 4 6 10
116
16
2044
2044
nnnn
nnnnQ
12212211
122122111 ==
+
=
+
= [-1,1]
Se poate trage concluzia c asocierea dintre media la bacalaureat i media la admitere
este direct i foarte intens deoarece Q = 1. Se calculeaz coeficientul Spearman conform
relaiei: =
=
nn
d61r
3
3i
S 83,0101000
2861 =
. Apreciem c legtura dintre rangurile notelor la
bacalaureat i cele de la admitere este destul de intens, deoarece coeficientul se ncadreazntre 0,8 i 0,9. Calculnd coeficientul de determinaie (rs)
2= (0,83)2= 0,69 sau 69%, deci,
influena notelor la bacalaureat asupra mediei la admitere este n proporie de 69%, restul de
31% reprezint influena altor cauze (factori) care nu au fost luate (luai) n consideraie.
Se calculeaz coeficientul Kendall conform relaiei: 64,0)110(10
292
)1n(n
S2rk =
=
= care se
interpreteaz n aceeai manier ca i coeficientul Spearman.
6. Testul de autoevaluare 1
1. Un numr de 150 de studeni din dou centre universitare particip la un examen de burse
n strintate. Cei 100 de studeni din prima universitate obin un punctaj mediu de 88 puncte,
cu un coeficient de variaie de 8%, iar cei din a doua universitate obin un punctaj mediu de
96 puncte, cu o abatere standard de 0,65 puncte. n ce msur factorul de grupare centrul
universitar contribuie la variaia punctajelor obinute de studeni? n ce msur difer
semnificativ punctajul de la un centru universitar la altul?
2. Pentru zona de amplasare a 2 centre comerciale cu 10 si15 magazine, se cunosc datele:
Zona de amplasare Numr magazineProfitul mediu pe unmagazin (mil. RON)
Dispersia profitului
CentralPeriferie
1015
2026
1222
S se determine n ce proporie zona de amplasare influeneaz variaia profitului
3. Din datele furnizate de Ancheta Integrat n Gospodrii se cunosc urmtoarele date pentru
zece familii.
FamiliaVenituri lunare ce revin n medie pe o
perioad pe familie (zeci mii u.m)Cheltuieli pentru achiziionarea
produsului x (zeci mii u.m)
1 7,2 3,22 9,9 3,8
-
7/25/2019 Legaturi statistice intre variabile
20/25
20
3 8,5 4,04 11,8 5,55 19,2 6,26 10,9 4,17 13,4 5,4
8 12,5 5,99 11,5 6,010 16,1 6,3
Se cere: S se caracterizeze i s se msoare legtura dintre venituri i cheltuieli
folosind:
a) graficul de corelaie;
b) metoda regresiei;
c) metoda raportului de corelaie;
d) metoda coeficientului de corelaie;
7. Rspunsuri i comentarii la testele de autoevaluare
1. Rezolvare:
Se cunosc urmtoarele elemente pentru determinarea coeficientului de determinare
( )2R : 1001=n 881=y %81=
502 =n 962 =y 65,02 =
Coeficientul de determinare 2R :
%3010040,4722,14100
2
0
22 ===
R unde
Dispersia dintre grupe ( )2 :
( )( ) ( )
22,14150
5066,909610066,9088 22
1
1
2
02 =
+=
=
=
=m
i
i
m
i
ii
n
nyy
Media pe total colectivitate ( 0y )
67,90150
50,9610088
1
1
0 =+
=
=
=
=
m
i
i
m
i
ii
n
ny
y puncte
Media dispersiilor de grup:
18,33150
125,4977
150
10056,49504225,0
1
1
2
2==
+=
=
=
=m
i
i
m
i
ii
i
n
n
-
7/25/2019 Legaturi statistice intre variabile
21/25
21
Deoarece 08,0%81 = , 04,708,08888
08,0 11
1
11 ====
y
( ) ( ) 56,4904,7 2212
1
2
11 ==== , ( ) 4225,065,065,0 22
22 ===
Regula de adunare a dispersiilor:
40,4722,1418,33222 =+=+= ix
Pentru c coeficientul de determinare este 30%, nseamn c 30% din variaia
punctajului este explicat de centrul universitar, iar restul de 70% se datoreaz altor factori.
Deoarece 22 KR < apreciem c centrul universitar nu contribuie semnificativ la variaia
punctajelor obinute de studeni. Punctajele studenilor nu difer semnificativ de la un centru
la altul
2. Rezolvare: Notaii: =ix zona de amplasare; =in numr magazine; =iy profitul
mediu; =2i dispersia profitului. Pentru a determina n ce proporie factorul principal de
grupare influeneaz variaia profitului se determin coeficientul de determinare dup relaia:
%43,3210064,26
64,8100
2
0
22 ===
R . Dispersia dintre grupe:
( )( ) ( )
=+
=
=
=
=
25
156,23261076,2320 22
1
1
2
02
m
i
i
m
i
ii
n
nyy
64,825
4,866,129=
+
Media pe total colectivitate : 6,2325
590
25
15261020
1
1
0 ==+
=
=
=
=m
i
i
m
i
ii
n
nyy mil. RON/magazin Media
dispersiilor de grup: 1825
330120
25
15221012
1
1
2
2 =+
=+
=
=
=
=
m
i
i
m
i
ii
i
n
n
Regula de adunare a dispersiilor:
64,261864,8222 =+=+= i
i
si 22 KR + = 100 %57,672 =K (coeficientul de non-
determinare) 22 KR
-
7/25/2019 Legaturi statistice intre variabile
22/25
22
Diagrama de mprtiere
Scara: 0X 1 cm = 3 zeci mii u.m. (venituri)
0Y 1 cm = 1 zeci mii u.m. (cheltuieli)
b)
=+
=+
iiii
ii
yxxbxa
yxban
2
iix xxbaY i ++= 268,0799,1
=+
=+
83,63906,1576121
4,5012110
ba
ba
==
..268,026786,0..8,179885,1mumiizecib
mumiizecia Deci funcia de regresie este ix xY i += 268,08,1
c) ( )( )
83,0824,11
59,311
2
2
/ ==
=
yy
YyR
i
xi
xyi
sau
( ) 83,0
10
4,5084,265
83,639268,04,508,184,26511
22
2
2
/ =
=
=
n
yy
yxbyayR
i
i
iiii
xy
d)
( )[ ] ( )[ ]=
=
2222/
iiii
iiii
xy
yynxxn
yxyxnr
( )[ ] ( )[ ] 83,0824,0
4,5084,2651012106,157610
4,5012183,63910
22=
Algoritmul de calcul necesar determinrii abaterilor medii ptratice i a indicatorilor de
corelaieeste redat n tabelul urmtor:
Nr. crt. ix iy ( )2
xxi ( )2
yyi iiyx
0 1 2 3 4 51 7,2 3,2 24,01 3,3856 23,042 9,9 3,8 4,84 1,5376 37,623 8,5 4,0 12,96 1,0816 34,04 11.8 5,5 0,09 0,2116 64,95 19,2 6,2 50,41 1,3456 119,046 10,9 4,1 1,44 0,8836 44,69
7 13,4 5,4 1,69 0,1296 72,368 12,5 5,9 0,16 0,7396 73,759 11,5 6,0 0,36 0,9216 69,0
10 16,1 6,3 16,0 0,5876 101,43
Total121
ix 50,4
iy 111,96
( ) 2
xxi
11,824
( ) 2yyi 639,83
iiyx
7 2
Y
6 2
5 2
4 2
3 2
0 7 2 10 2 13 2 16 2 19 2 X
ix bxaY +=
xx
xx
xx
x x
-
7/25/2019 Legaturi statistice intre variabile
23/25
23
continuare tabelul
8. Teme de control
1. Identificai funcia de regresie liniarce modeleazlegtura dintre douvariabile utiliznd
metoda celor mai mici ptrate. Scriei funcia de regresie. Calculai i comentai interpretarea
coeficienilor funciei de regresie
2. Dintr-un sondaj efectuat pe un eantion de 7 gospodrii au rezultat urmtoarele date
despre fiecare gospodrie referitoare la veniturile zilnice din remunerare ale membrilor
gospodriei i cheltuielile zilnice ale gospodriei din tabelul urmtor
Venituri 40 30 20 50 60 40 30Cheltuieli 35 26 18 38 42 30 22
a. Reprezentai grafic legtura dintre cele douvariabile prin graficul de mprtiere;
b. Identificai funcia de regresie liniar ce modeleaz legtura dintre cele dou variabile
utiliznd metoda celor mai mici ptrate. Scriei funcia de regresie. Calculai i comentai
coeficienii funciei de regresie;
c.
Analizai intensitatea legturii dintre cele dou variabile printr-o metod parametric
adecvat.
d. Analizai intensitatea legturii dintre cele dou variabile printr-o metod neparametric
adecvat.
3. Dintr-un sondaj efectuat pe un eantion de 7 gospodrii au rezultat urmtoarele date
despre fiecare gospodrie referitoare la veniturile zilnice din remunerare ale membrilor
gospodriei i cheltuielile zilnice ale gospodriei, n tabelul urmtor:
Nr. crt. 2ix
2
iy ix xY i += 268,08,1 ( )2
ixi Yy
0 6 7 8 91 51,84 10,24 3,7 0,252 98,01 14,44 4,5 0,493 72,25 16,00 4,1 0,014 139,24 30,25 5,0 0,255 368,64 38,44 6,9 0,496 118,81 16,81 4,7 0,367 179,56 29,16 5,4 08 156,25 34,81 5,2 0,499 156,25 36,0 4,9 1,2110 259,21 39,69 6,1 0,04
Total1576,06
2ix 265,84
2iy 50,5
ixY 3,59
( ) 2ixi Yy
-
7/25/2019 Legaturi statistice intre variabile
24/25
24
Numar membrii 4 3 2 5 6 4 3Venit pe membru algospodariei
350 260 180 380 420 300 220
Calculai i comentai coeficienii funciei de regresie, reprezentai grafic legtura dintre cele
douvariabile prin graficul de mprtiere.
4. Despre un eantion stratificat de angajai de 5%, selectat ntmpltor, nerepetat din totalul
angajailor unei societi comerciale se cunosc datele:
Vechime(ani)
Numrulangajailor
Vnzri medii zilnice(mii RON)
Numr de angajai care se plaseazpeste media vnzrilor zilnice
sub 10 90 500 3010-20 150 640 8020-30 100 980 50
peste 30 60 25
TOTAL 400 - 185tiind c pentru grupa de angajai cu peste 30 de ani vechime, vnzrile maxime au
fost de 1.100 mii RON, abaterea maxim pozitiv a vnzrilor fa de media vnzrilor
acestei grupe a fost de 250 mii RON iar, pe total, valoarea modal a vnzrilor eantionului a
fost de 800 mii RON, cu un coeficient de asimetrie (Cas= -0,35), se cere:
1) S se stabileasc dac factorul principal de grupare (vechimea n munc) este
semnificativ pentru variaia vnzrilor medii zilnice, folosind coeficientul de determinare i
cel de nondeterminare.
2) S se caracterizeze i s se msoare corelaia dintre vechime i vnzrile medii
zilnice, folosind metoda regresiei bazat pe o funcie de regresie corespunztoare.
9. Rezumatul Unitii de nvare
Asupra fenomenelor social-economice acioneaz o multitudine de factori, principali isecundari, eseniali i neeseniali, cuantificabili i necuantificabili sau cuantificabili cu aproximaie,care se gsesc ntr-o relaie de interdependen reciproc. Legturile ce se pot forma sunt legturistohastice, n care un fenomen este factor de influenta, iar cellalt este efect. Statistica, printr-o gamlarg de procedee i metode specifice, poate studia manifestarea concret a acestor legturi, le poateexprima cantitativ i msura intensitatea cu care se produc. Legturile statistice pot fi simple saumultiple, directe sau inverse, de asociere sau de corelaie, liniare sau neliniare, sincrone sauasincrone. Pentru caracterizarea statistic a legturilor dintre variabile se pot folosi dou categoriide metode: metode simple (metoda grafic, metoda tabelului de corelaie, metoda gruprilor, metodaseriilor paralele interdependente) i metode analitice (metoda regresiei, metoda covarianei, metodaraportului de corelaie, metoda coeficientului de corelaie, metoda analizei dispersionale). n afarametodelor analitice menionate mai sus, ce intr n categoria metodelor parametrice, legturile dintre
variabilele statistice se mai pot analiza cu ajutorul metodelor neparametrice (metoda coeficientului de
-
7/25/2019 Legaturi statistice intre variabile
25/25
asociere al lui Yule, metoda coeficientului de corelaie a rangurilor Spearman i metoda coeficientuluide corelaie a rangurilor Kendall).
10. Bibliografia Unitii de nvare
1. Cristache, S.E., erban, D.,Lucrri aplicative de Statistic i Econometrie, Ed. ASE,
Bucureti, 2007, 433 pg. (191 - 416) ISBN 978 - 973 594 986 2;
2. Isaic Maniu, Al., Voineagu, V., Mitru, C., Baron, T., ian, E., Matache S., erban D.,
Voineagu, M., Statistic teoretic. Studii de caz i aplicaii, Ed. Economic, 255 pg. (189 -
219), Bucureti, 1998, ISBN 973-590-086-6;
3. Isaic Maniu, Al., Mitru, C., Voineagu, V., Statistica Pentru afaceri, ed. Economic,
Bucuresti 2003.