16513850-Formule-Statistica
Transcript of 16513850-Formule-Statistica
FORMULE STATISTICA
frecvenţa relativă
100⋅=∑ i
ii n
nf
ponderea sau greutatea specifică a unui element (xi) în totalul
colectivităţii (∑=
n
iix
1) se obţine pe baza relaţiei:
n1,i ,100
1
=⋅=∑
=
n
ii
ii
x
xf
Media aritmetică simplă se foloseşte pentru seriile în care fiecare
nivel al caracteristicii este purtat de o singură unitate statistică.
n
x...xxxx n321 ++++= sau
n
xx
n
1ii∑
== , n,1i = , n=volumul
colectivităţii
Media aritmetică ponderată se foloseşte în cazul seriilor cu
frecvenţe
m21
mn332211
n...nn
nx...nxnxnxx
+++++++
= sau ∑
∑
=
==n
1ii
n
1iii
n
nxx
formule de calcul simplificat a mediei aritmetice:
-pt. serii simple:a
n
)ax(x
n
1ii
+−
=∑
=
-pt. serii ponderate: an
n)ax(x
n
1ii
n
1iii
+⋅−
=∑
∑
=
=
a. Dacă se micşorează fiecare variantă a caracteristicii de un anumit
număr de ori ”k”, atunci media seriei se micşorează de acelaşi
număr de ori.
Se obţin următoarele relaţii:
-pt. serii simple:k
nk
x
x
n
1i
i
⋅=∑
=
-pt. serii ponderate: kn
nk
x
xn
1ii
n
1ii
i
⋅⋅
=∑
∑
=
=
b. Dacă frecvenţele seriei se micşorează de un număr „c” de ori,
atunci media aritmetică rămâne neschimbată.
Această proprietate se aplică numai seriilor cu frecvenţe.
xn
nx
nc
1
nxc
1
c
nc
nx
xn
1ii
n
1iii
n
1ii
n
1iii
n
1i
i
n
1i
ii
===⋅
=∑
∑
∑
∑
∑
∑
=
=
=
=
=
=
c. Suma algebrică a abaterilor nivelurilor individuale ale
caracteristicii de la media lor este egală cu zero.
∑ ∑ ∑∑ ∑∑∑
=⋅−=⋅−=−=−
=−
0n
xnxxnxxx)xx(
0)xx(
iiiii
i
formule de calcul simplificat al mediei aritmetice:
-pt. serii simple:ak
nk
ax
x
n
1i
i
+⋅
−
=∑
=
-pt. serii ponderate: ak
c
nc
n
k
ax
xn
1i
i
n
1i
ii
+⋅⋅
−
=∑
∑
=
=
Media, în cazul caracteristicii alternative
n
np 1=
Media unităţilor care nu poartă acea caracteristică se notează cu „q” şi
se determină astfel:
n
nnq 1−
=
aplicarea relaţiei de calcul a modului:
21
10 dxMo
∆+∆∆
⋅+= , unde:
x0 = limita inferioară a intervalului modal,
d = mărimea intervalului modal,
1∆ = diferenţa dintre frecvenţa intervalului modal şi frecvenţa intervalului
anterior celui modal,
2∆ = diferenţa dintre frecvenţa intervalului modal şi frecvenţa intervalului
următor celui modal.
Pe cale grafică, modul se determină pe baza histogramei
Metodologia de calcul a medianei este diferită după natura seriei
luate în calcul.
Pentru serii simple se întâlnesc două situaţii:
-seria are un număr impar de termeni, când mediana este acea variantă a
caracteristicii cu rangul 2
1n +, după ce în prealabil seria a fost ordonată
crescător, unde n = nr. termenilor.
: 2
nU iMe ∑= ;
Me
Me
0 n
NaUdxMe
−⋅+= , unde:
x0 = limita inferioară a intervalului median;
d = mărimea intervalului median;
Na = frecvenţa cumulată anterioară intervalului median;
nMe = frecvenţa reală a intervalului median.
Pe cale grafică mediana se determină ca şi în situaţia precedentă cu
ajutorul curbei frecvenţelor cumulate.
Quartilele
1Q
1Q
01 n
NaUdxQ
−⋅+=
2Q
2Q
02 n
NaUdxQ
−⋅+=
3Q
3Q
03 n
NaUdxQ
−⋅+=
x0 = limita inferioară a intervalului quattilic;
d = mărimea intervalului quartilic;
UQ1, UQ2, UQ3 = unităţile quartilice;
Na = frecvenţa cumulată anterioară intervalului quartilic;
nQ1, nQ2, nQ3 = frecvenţele reale ale intervalului quartilic.
4
nU i1Q ∑= ; Meii2Q U
2
n
4
n2U === ∑∑ ;
4
n3U i3Q ∑=
Decilele
1D
1D
01 n
NaUdxD
−⋅+=
2D
2D
02 n
NaUdxD
−⋅+=
D5 = Me = Q2
9D
9D
09 n
NaUdxD
−⋅+=
10
nU i1D ∑=
5
n
10
n2U ii2D ∑∑ ==
10
n9U i9D ∑= .
În cazul seriilor cu frecvenţe în care caracteristica este dată pe
variante, mediala se calculează în următoarele etape:
-se determină produsele iinx ;
-se calculează şirul produselor iinx cumulate, notate cu Li;
-se determină unitatea medială conform relaţiei: 2
nxU iiMl ∑= ;
-se caută locul unităţii mediale pe şirul Li, alegând un nivel egal sau mai
mare decât acesta;
-se identifică mediala ca fiind nivelul caracteristicii corespunzător unităţii
mediale.
În cazul seriilor cu frecvenţe şi caracteristica sub formă de intervale de
variaţie, mediala se determină tot prin calcul şi grafic.
Prin calcul se parcurg operaţiile:
-se determină produsele iinx ;
-se calculează şirul produselor iinx cumulate, notate cu Li;
-se determină unitatea medială conform relaţiei: 2
nxU iiMl ∑= ;
-se caută locul unităţii mediale pe şirul Li, alegând un nivel egal sau mai
mare decât acesta;
-se identifică intervalul medial, ca fiind intervalul caracteristicii
corespunzător unităţii mediale;
-se aplică formula medialei: Mlii
Ml
0 nx
LaUdxMl
−⋅+= , unde:
x0 = limita inferioară a intervalului medial;
d = mărimea intervalului medial;
UMl = unitatea medială;
La = produsul cumulat anterioar intervalului medial;
iMlinx = produsul iinx corespunzător intervalului medial.
Media cronologică simplă se calculează când momentele sunt egal distanţate
între ele.
Pentru seria n1-n21 x,x, , x,x , 1n
2
xx
2
xx
2
xx
x
n1n3221
cr−
+++
++
+
=−
.
Prin transformare, această relaţie devine:
1n2
xxxx
2
x
x
n1n32
1
cr−
++++=
−.
Media cronologică ponderată se calculează atunci când intervalele de
timp dintre termenii seriilor de momente sunt inegale.
În acest caz, mediile parţiale, din care se calculează media întregii
perioade, sunt ponderate cu durata perioadelor parţiale dintre termenii seriei,
notate cu ti.
1n21
1nn1n
232
121
crttt
t2
xxt
2
xxt
2
xx
x−
−−
+++
+++
++
+
=
Media armonică simplă: ∑=
i
h
x
1n
x
Media armonică ponderată: ∑∑
⋅=
ii
ih
nx
1
nx
Considerăm seria: n1-n21 x,x, , x,x .
-mediile mobile din câte 3 termeni:
3
xxxx 321
1
++= ,
3
xxxx 432
2
++= , ,
3
xxxx n1n2n
2n
++= −−− .
-mediile mobile din câte 4 termeni:
4
xxxxx 4321
1
+++= ,
4
xxxxx 5432
2
+++= , ,
4
xxxxx n1n2n3n
3n
+++= −−−
− .
Media progresivă
2
xxx s
progr+
= , unde:
x = media generală a seriei;
sx = media termenilor calitativ superiori mediei generale.
Media geometrică simplă:
nn21g xxxx ⋅⋅⋅=
Media geometrică ponderată:
∑ ⋅⋅⋅= i m21n n
m
n
2
n
1g xxxx
Media pătratică simplă:n
xx
2i
patr∑=
Media pătratică ponderată: ∑∑ ⋅
=i
i2i
patrn
nxx
• Indicatorii simpli ai dispersiei
Amplitudinea variaţiei
În mărime absolută
minmax xxAx −=
În mărime relativă
100minmax% ⋅
−=
x
xxAx , unde:
minmax , xx = nivelul maxim, respectiv minim al variabilei X;
x = nivelul mediu al variabilei X.
2. Abaterea individuală
În mărime absolutăxxd ii −=
În mărime relativă
100% ⋅−
=x
xxd i
i
• Indicatorii sintetici ai dispersiei
1. Abaterea medie liniară
-pentru serii simple:n
xx
n
dd i
ii
i ∑∑ −== , când
knnn n ==== ...21 ,
-pentru serii cu frecvenţe: ∑∑
∑∑ ⋅−
=⋅
=
ii
iii
ii
ii
i
n
nxx
n
ndd , când
nnnn ≠≠≠ ...21
2. Varianţa (dispersia)
-pentru serii simple:( )
n
xx
n
di
ii
i ∑∑ −==
22
2σ ,
-pentru serii cu frecvenţe:( )∑
∑∑
∑ ⋅−=
⋅=
ii
iii
ii
iii
n
nxx
n
nd22
2σ .
3. Abaterea medie pătratică (deviaţia standard)
pentru serii simple: ( )
2i
2
ii
2i
n
xx
n
dσσ =
−===
∑∑
-pentru serii cu frecvenţe:( )
2
22
σσ =⋅−
==⋅
=∑
∑∑
∑
ii
iii
ii
iii
n
nxx
n
nd
Intervalul mediu de variaţie
+
−=±
dx
dxdx , respectiv
+
−=±
σσ
σx
xx
. Coeficientul mediu de variaţie
100⋅=x
dν , respectiv 100⋅=x
σν
>ν<ν<<ν<
<ν<
tativa.nereprezen este media 50%larg sensin tivareprezenta este media 50%35%
tivareprezentamoderat este media 53%17%tivareprezentastrict este media %170
Proprietăţile dispersiei sunt:
• Dispersia unei distribuţii este egală cu diferenţa dintre media pătratelor
tuturor variantelor caracteristicii şi pătratul mediei.
222 )x(x −=σ
( )
22222
i
i
2
i
ii
i
i2i
ii
i
2
i2i
ii
ii
2
i2
xxxx2x
n
nx
n
nxx2
n
nx
n
n)xxx2x(
n
nxx
−=+−=
=+⋅−=+−
=⋅−
=∑∑
∑∑
∑∑
∑∑
∑∑
σ
Dispersia unui şir de valori constante este egală cu zero, • Dispersia calculată din abaterile variantelor caracteristicii faţă de
constanta „a” este mai mare decât dispersia calculată din aceleaşi variante
faţă de media lor cu pătratul diferenţei dintre medie şi constanta „a”.
-pentru serii simple:( )
2i
2i
2 )ax(n
ax−−
−=
∑σ ,
-pentru serii cu frecvenţe:( )
2
ii
ii
2i
2 )ax(n
nax−−
⋅−=
∑∑
σ .
• Dacă fiecare nivel al caracteristicii se micşorează de „k” ori, atunci
dispersia se micşorează de „k2” ori.
-pentru serii simple:2i
2
i
2 kn
k
xx
⋅
−
=∑
σ,
-pentru serii cu frecvenţe: 2
ii
ii
2
i
2 kn
nk
xx
⋅⋅
−
=∑
∑σ .
• Dacă se împarte fiecare nivel al frecvenţelor printr-o constantă „c”, atunci
dispersia rămâne neschimbată.
( )
∑
∑ ⋅−=
i
i
i
i2
i2
c
nc
nxx
σ
Aceste proprietăţi sunt folosite pentru calculul simplificat al
dispersiei. Din combinarea lor se ajunge la formulele care conduc la cea mai
mare simplificare a calculelor.
-pentru serii simple: 22i
2
i
2 )ax(kn
k
ax
−−⋅
−
=∑
σ,
-pentru serii cu frecvenţe: 22
i
i
i
i
2
i
2 )ax(k
c
nc
n
k
ax
−−⋅⋅
−
=∑
∑σ .
Indicatorii de asimetrie O primă imagine asupra gradului de asimetrie (As) al unei distribuţii o
putem face comparând media ei asimetrică cu modul.
MoxAs −=
Mox , 0As , asimetrie negativă, cu extinderea frecvenţelor spre
stânga.
Mox , 0As , asimetrie pozitivă, cu extinderea frecvenţelor spre
dreapta.
În mărimi relative se utilizează coeficientul de asimetrie a lui Pearson
(kas).
σMox
k as
−=
Dacă kas =0, Mox = , distribuţie simetrică
Dacă kas >0, Mox , distribuţie asimetrică spre dreapta
Dacă kas <0, Mox , distribuţie asimetrică spre stânga.
Pentru seriile moderat asimetrice, coef. de asimetrie trebuie să ia
valori cuprinse în intervalul (-0,3 ; 0,3). Pentru valori în afara acestui
interval se consideră că distribuţiile respective sunt puternic asimetrice.
coeficientul de asimetrie Yule (Cay).
12
12
qqCay
+−
= , unde: q2 = Q3 – Me
q1 = Me – Q1.
Dacă valorile Cay se apropie de 1,0± , atunci distribuţia este moderat
asimetrică, iar dcaă depăşesc 1,0± , atunci distribuţia este pronunţat
asimetrică.
) Indicatorii de boltire.. de boltire Pearson ( 2β ) şi coef. de boltire Fisher ( 2γ ).
22
42 µ
µβ = , unde: 2µ este dispersia.
( )∑
∑ ⋅−==
ii
ii
2
i2
2 n
nxxσµ , iar 4µ se determină după relaţia:
( )∑
∑ ⋅−=
ii
ii
4
i
4 n
nxxµ
Pentru o distribuţie normală (curba Gauss-Laplace), coeficientul de
boltire ia valoarea 3. Dacă 32 β , atunci distribuţia este leptocurtică, iar
dacă 32β , atunci distribuţia este platicurtică.
Coef. de boltire Fisher ( 2γ )
3322
422 −=−=
µµβγ , cu interpretarea:
dacă 32 =β , 02 =γ , distribuţie normală;
32 β , 02 γ , distribuţie leptocurtică;
32β , 02γ , distribuţie platicurtică.
6.2. Indicii simpli
• Indicele simplu al cantităţilor sau al volumului fizic care este determinat
după relaţia: 100q
qi
0
1q0/1 ⋅= ,
q1 = volumul fizic în perioada curentă
q0 = volumul fizic în perioada de bază
• Indicele simplu al preţurilor stabilit astfel:
100p
pi
0
1p0/1 ⋅=
p1 = preţul în perioada curentă
p0 = preţul în perioada de bază
• Indicele simplu valoric stabilit astfel:
100v
vi
0
1v0/1 ⋅= , dar v1=q1p1
v0=q0p0
100pq
pqi
00
11v0/1 ⋅=
Între aceşti indici se verifică relaţia:
0
1
0
1
00
11
p0/1
q0/1
v0/1
p
p
q
q
pq
pq
iii
⋅=
⋅=
6.2. Indicii simpli• Indicele simplu al cantităţilor sau al volumului fizic care este determinat
după relaţia: 100q
qi
0
1q0/1 ⋅= ,
q1 = volumul fizic în perioada curentă
q0 = volumul fizic în perioada de bază
• Indicele simplu al preţurilor stabilit astfel:
100p
pi
0
1p0/1 ⋅=
p1 = preţul în perioada curentă
p0 = preţul în perioada de bază
• Indicele simplu valoric stabilit astfel:
100v
vi
0
1v0/1 ⋅= , dar v1=q1p1
v0=q0p0
100pq
pqi
00
11v0/1 ⋅=
Între aceşti indici se verifică relaţia:
0
1
0
1
00
11
p0/1
q0/1
v0/1
p
p
q
q
pq
pq
iii
⋅=
⋅=
Indicii de grup
.a Indicele agregat
Indicele agregat simplu al producţiei se determină astfel:
100q
qI
0
1q0/1 ⋅=
∑∑
indicele agregat ponderat, calculat astfel:
100pq
pqI
00
11q0/1 ⋅=
∑∑
sisteme de ponderare
E. Laspeyres
100pq
pqI
00
01q0/1 ⋅=
∑∑
H. Paasche
100qp
qpI
10
11p0/1 ⋅=
∑∑
100pq
pqI
00
11v0/1 ⋅=
∑∑
variaţiei valorice Între aceşti indici se verifică relaţia:
p0/1
q0/1
v0/1 III ⋅=
În teoria indicilor se mai întâlnesc şi unele sisteme de ponderare care
ţin seama de ponderile din ambele perioade. Întâlnim astfel:
-indicele preţurilor calculat de Edgeworth
100)qq(p
)qq(pI
010
011p0/1 ⋅
++
=∑∑
-indicele ideal al lui Fisher.
∑∑
∑∑ ⋅=
01
11
00
01p0/1 pq
pq
pq
pqI
indicelui de grup al volumului fizicmodificarea absolută va fi
∑ ∑−=∆i i
0001q
0/1 pqpq
Pentru indicele de grup al preţurilor, modificarea absolută va fi:
∑ ∑−=∆i i
1011p
0/1 qpqp
În cazul indicelui de grup valoric, modificarea este:
∑ ∑−=∆i i
0011v
0/1 pqpq
În cazul influenţei factorilor exprimată în mărimi absolute se verifică
relaţia:
p0/1
q0/1
v0/1 ∆+∆=∆
b. Indicele mediu aritmetic ponderat
100pq
pqiI
i00
i00
q0/1
q0/1 ×
⋅=
∑∑
c. Indicele mediu armonic ponderat
100qp
i
1
qpI
i11q
0/1
i11
p0/1 ×=
∑
∑
6.4Sistemul indicilor calculaţi din mărimi medii
A. indicele de variaţie bifactorială;
B. indicele cu structură fixă;
C. indicele schimbării structurii.
A. indicele de variaţie bifactorială
∑∑
∑∑ ÷==
0
00
1
11
0
1xv.s n
nx
n
nx
x
xI
B. indicele cu structură fixă (Is.f)
∑∑
∑∑ ÷=
1
10
1
11xf.s n
nx
n
nxI
de Laspeyres
∑∑
∑∑ ÷=
0
00
0
01xf.s n
nx
n
nxI
C. indicele variaţiei structurii (Iv.s.).
Laspeyres,
∑∑
∑∑ ÷=
0
00
1
10x.s.v n
nx
n
nxI
Între aceste trei categorii de indici se stabileşte relaţia:x
.s.vx
f.sx
v.s III ⋅=
6.5 Gruparea indicilor dinamicii după felul bazei
Indici cu bază fixă
0
1q0/1 q
qi = ,
0
2q0/2 q
qi = , .... ,
0
1nq0/1n q
qi −
− = ,0
nq0/n q
qi =
Indici cu bază fixă
0
1q0/1 q
qi = ,
1
2q1/2 q
qi = , .... ,
2n
1nq2n/1n q
qi
−
−−− = ,
1n
nq1n/n q
qi
−− =
produsul indicilor cu bază mobilă
0
n
1n
n
2n
1n
2
3
1
2
0
1
q
q
q
q
q
q
q
q
q
q
q
q=⋅⋅⋅⋅⋅
−−
−
împărţind doi indici cu bază fixă
1
2
0
1
0
2
q
q
q
q
q
q=÷
6.6Ritmul variaţiei şi al sporului
A. indicatori absoluţi
B. indicatori relativi
C. indicatori medii.
A. Indicatorii absoluţi
Cuprind sporul absolut, care, după modul de alegere a bazei, este:
• spor absolut cu bază fixă ( x0/i∆ ) – se obţine ca diferenţă între fiecare
termen al sumei şi termenul ales drept bază de raportare. Considerând
seria: x0, x1, x2, ... , xn, sporul absolut cu bază fixă se va calcula astfel:
01x
0/1 xx −=∆ ; 02x
0/2 xx −=∆ ; .....; 0nx
0/n xx −=∆ sau
generalizând: 0ix
0/i xx −=∆
• spor absolut cu bază mobilă ( x1i/i −∆ ) – este diferenţa dintre fiecare termen
al seriei şi termenul anterior. În aceeaşi serie vom avea:
01x
0/1 xx −=∆ ; 12x
1/2 xx −=∆ ; .....; 1nnx
1n/n xx −− −=∆ sau
generalizând: 1iix
1i/i xx −− −=∆
Între sporurile absolute cu baza fixă şi cele cu baza mobilă se verifică
relaţiile:
-suma sporurilor cu baza mobilă este sporul cu bază fixă al ultimului an:
0n1nn231201 xxxxxxxxxx −=−++−+−+− −
-diferenţa dintre două sporuri absolute cu baza fixă consecutive este egală cu
sporul cu bază mobilă corespunzător:
2302o3 xx)xx()xx( −=−−−
B. Indicatorii relativi
1. Ritmul variaţiei (Rx) – exprimă viteză de variaţie exprimată în mărimi
relative. După modul de calcul, rimul variaţiei este de două feluri:
• Ritmul variaţiei cu bază fixă ( x0/iR ) – arată de câte ori a crescut sau scăzut
nivelul unui fenomen în decursul unei perioade de timp şi se calculează
astfel:
0
ix0/i x
xR = , n,1i =
• Ritmul variaţiei cu bază mobilă ( x1i/iR − ) – arată de câte ori a crescut sau
scăzut nivelul unui fenomen într-un moment faţă de momentul anterior.
1i
ix1i/i x
xR
−− =
Între ritmul variaţiei cu bază fixă şi cel cu bază mobilă se verifică
relaţiile:
-produsul ritmurilor cu bază mobilă este ritmul cu bază fixă al întregii
perioade:
0
n
1n
n
2
3
1
2
0
1
x
x
x
x
x
x
x
x
x
x=⋅⋅⋅⋅
−
-raportul a două ritmuri ale variabilei cu bază fixă este egal cu ritmul cu bază
mobilă corespunzător:
1
2
0
1
0
2
x
x
x
x
x
x=÷
2 Ritmul sporului (rx) – exprimă mărimea creşterii sau scăderii în decursul
unei anumite perioade de timp faţă de perioada de bază a unui indicator. Se
calculează:
• Ritmul sporului cu bază fixă ( 0/ixr ) – se calculează ca raport între sporul
cu bază fixă şi nivelul fenomenului considerat din perioada de bază,
astfel:
0
0i
0
x0i
x x
xx
xr
0/i
−=
∆= −
• Ritmul sporului cu bază mobilă ( 1i/ixr − ) – se calculează ca raport între
sporul cu bază mobilă şi nivelul fenomenului considerat din perioada
anterioară, astfel:
1i
1ii
1i
x1i/i
x x
xx
xr
1i/i
−
−
−
− −=
∆=
−
Relaţii între aceste ritmuri:
1Rr
1Rr
x1i/ix
x0/ix
1i/i
0/i
−=
−=
−−
C. Indicatorii medii
1. Sporul mediu ( x∆ )
1n
xx 0nx
−−
=∆ , unde:
xn = ultimul termen al seriei,
x0 = primul termen al seriei,
n = nr. termenilor seriei.
2. Ritmul mediu al variaţiei ( xR )
1n
o
nx
x
xR −=
Ritmul mediu al sporului ( xr )
1Rrxx
−= sau în procente: 100Rrxx
−=
A. Regresie şi corelaţie liniară
y = a + bx
-dacă b>0, indică o legătură directă
-dacă b=0, nu există legătură
-dacă b<0, indică o legătură inversă.
metoda celor mai mici pătratesuma pătratelor diferenţelor dintre valorile reale ale lui y şi valorile
teoretice date de ecuaţia de regresie să fie minimă.
=−∑ 2
i )yy( minim, respectiv
=−−∑ 2)bxay( minim.
=+
=+
∑ ∑ ∑∑ ∑
ii2ii
ii
yxxbxa
yxbna
Prin metoda lui Cramer sau a determinanţilor, parametrii a şi b se
determină astfel (pentru seriile simple):
2i
2i
iiii2i
2ii
i
2iii
ii
)x(xn
yxxyx
x x
x n
x yx
x y
aa
∑∑∑ ∑ ∑ ∑
∑ ∑∑
∑ ∑∑ ∑
−−
==∆∆=
2i
2i
iiii
2ii
i
iii
i
)x(xn
yxyxn
x x
x n
yx x
y n
bb
∑∑∑ ∑ ∑
∑ ∑∑
∑ ∑∑
−−
==∆∆=
serii cu frecvenţe, sistemul de ecuaţii normale devine:
=+
=+
∑ ∑ ∑∑ ∑∑
iiii2iii
iiiii
nyxnxbnxa
nynxbna
Determinarea parametrilor a şi b prin aceeaşi metodă conduce la
rezultatele:
2iii
2ii
iiiiiiii2i
i2iii
iii
i2iiii
iiii
)nx(nxn
nyxnxnynx
nx nx
nx n
nx nyx
nx ny
aa
∑∑∑∑ ∑ ∑ ∑
∑ ∑∑∑
∑ ∑∑ ∑
−−
==∆∆=
2iii
2ii
iiiiiiii
i2iii
iii
iiiii
iii
)nx(nxn
nynxnyxn
nx nx
nx n
nyx nx
ny n
bb
∑∑∑∑ ∑ ∑ ∑
∑ ∑∑∑
∑ ∑∑ ∑
−−
==∆∆=
Coeficientul de corelaţie
yx
iiy,x n
)yy()xx(r
σσ∑ −⋅−
= , unde:
xi = caracteristica factorială;
yi = caracteristica rezultativă;
y ,x = mediile celor două caracteristici;
yx ,σσ = abaterea medie pătratică a celor două caracteristici.
Dacă în această relaţie înlocuim pe y ,x , yx ,σσ cu expresiile lor dezvoltate şi
efectuăm simplificările posibile, se ajunge la formula:
∑ ∑ ∑∑∑ ∑∑
−⋅−
−=
])y(yn[])x(xn[
yxyxnr
2i
2i
2i
2i
iiiiy,x -pt. serii simple
∑ ∑ ∑∑∑∑∑ ∑∑∑
−⋅−
−=
])ny(nyn[])nx(nxn[
nynxnyxnr
2iii
2ii
2iii
2ii
iiiiiiiiy,x -pt. serii cu
frecvenţă
Raportul de corelaţie (η )
2yi
2y
σσ
η = , unde:
2yσ = dispersia valorilor reale ale variabilei y;
2yiσ = dispersia valorilor teoretice ale variabilei y.
În cazul unei legături liniare simple, ecuaţia raportului de corelaţie
devine:
∑ ∑∑ ∑ ∑
−
−+=
n
)y(y
n
)y(yxbya
2i2
i
2i
iii
η
În cazul seriilor cu frecvenţe:
∑ ∑∑
∑ ∑ ∑∑
−
−+=
i
2ii
i2i
i
2ii
iiiii
n
)ny(ny
n
)ny(nyxbnya
η
Raportul de corelaţie are valori cuprinse între 0 şi 1, cu următoarele
semnificaţii:
-η = 1 arată că între variabile există legătură;
-η = 0 între variabile nu există legătură.
Valoarea la pătrat a raportului de corelaţie prezintă raportul de
determinaţie:
2yi
2y2
σσ
η = şi arată ponderea influenţei factorului x asupra variaţiei
variabilei y.
B. Regresie şi corelaţie curbilinie
a. Regresie şi corelaţie de tip hiperbolic
ix
bay +=
=+
=+
∑ ∑ ∑
∑ ∑
ii
2i
i
ii
yx
1
x
1bxa
yx
1bna
Prin regula lui Cramer obţinem:
2
i2i
iii
2i
i
)x
1(
x
1n
yx
1
x
1
x
1y
a
∑∑
∑ ∑ ∑ ∑
−
−=
2
i2i
ii
ii
)x
1(
x
1n
yx
1y
x
1n
b
∑∑
∑ ∑ ∑
−
−=
Fiind vorba de o legătură curbilinie, intensitatea legăturii se determină
numai cu ajutorul raportului de corelaţie.
2yi
2y
σσ
η =
( )
( )n
yy
n
yy
x
1bya
2
i2i
2
ii
ii
∑∑
∑∑∑
−
−+=η
b. Regresie şi corelaţie de tip parabolic
parabola de gradul doi, y = a+bx+cx2
Parametrii a, b, c se determină prin metoda celor mai mici pătrate, din
sistemul:
=++
=++
=++
∑ ∑ ∑∑∑ ∑ ∑∑
∑ ∑∑
i2i
4i
3i
2i
ii3i
2ii
i2ii
yxxcxbxa
yxxcxbxa
yxcxbna
Intensitatea corelaţiei parabolice se măsoară cu ajutorul raportului de
corelaţie:
( )
( )n
yy
n
yyxcyxbya
2
i2i
2
ii
2iiii
∑∑
∑∑∑∑
−
−++=η
Regresie şi corelaţie multiplă
kkii22110xk,...,2x,1x xaxaxaxaay ++++++= , unde:
a0 = parametrul care exprimă influenţa celorlalţi factori consideraţi cu
acţiune constantă, în afară de factorii cauzali luaţi în calcul;
ai = coeficienţi de regresie multiplă care arată cu cât variază variabila
rezultativă, atunci când variabila factorială xi se modifică cu o unitate.
2y
2y
xk,...,2x,1xxk,...2x,1xy
σσ
η = .
7.1Corelaţia neparametrică
.1 Coeficientul de concordanţă Fechner
Coeficientul de concordanţă simplu
n
dck
−= , unde:
c = număr de concordanţe de semn ale abaterilor;
d = număr de disconcordanţe de semn ale abaterilor.
1iiiii xxxsau xxx −−=∆−=∆
1iiiii yyysau yyy −−=∆−=∆
n = numărul perechilor de valori corelateDacă unele diferenţe ix∆ sau iy∆ sunt nule, atunci nu se consideră nici
concordanţă, nici discordanţă, ci este exclusă din calcul.
Coeficientul de concordanţă ponderat
DC
DCk
+−= , unde:
C = suma produselor ii yx ∆∆ pozitive,
D = valoarea absolută a sumei produselor ii yx ∆∆ negative.
O altă variantă a coeficientului ponderat de concordanţă Fechner se
apropie de coeficientul de corelaţie Pearson şi se determină astfel:
∑ ∑∑
∆⋅∆
∆⋅∆=
2i
2i
ii
)y()x(
yxk
Coeficientul Fechner poate varia între -1 şi +1, cu semnificaţia unei
legături directe sau inverse mai mult sau mai puţin intense.
.2 Coeficienţii de corelaţie a rangurilor
Coeficientul Spearman
nn
d61
3
2
−−= ∑θ , unde:
d = diferenţele dintre rangurile celor două variabile;
n = nr. perechilor de valori xi, yi.
b. Coeficientul Kendall
)1n(n5,0
S
−=τ , unde:
∑∑ ==−= ii qQ pP QPS
pi = nr. rangurilor superioare ale variabilei yi ordonate după xi, care există
după fiecare rang;
qi = nr. rangurilor inferioare ale variabilei yi ordonate după xi, care există
după fiecare rang;
n = nr. unităţilor observate.
Acest coef. poate lua valori cuprinse între -1 şi +1, cu aceleaşi
semnificaţii.
Coeficientul de asociere
bcad
bcadQ
+−=
Valoarea coef. de asociere are ca interval de variaţie (-1;+1) şi se
interpretează ca oricare coef. de corelaţie.