-Material Statistica Generala

download -Material Statistica Generala

of 16

Transcript of -Material Statistica Generala

  • 7/22/2019 -Material Statistica Generala

    1/16

  • 7/22/2019 -Material Statistica Generala

    2/16

    2

    6.1 Legtura statistic noiuni eseniale i clasificare

    n varianta extins sau generalizat, legtura statistic a dou sau mai multevariabile reprezint influena unidirecional (reciproc), manifestat prindependene sau interdependene, care conduc la schimbarea nivelului de dezvoltarefinal. Aceast variaie unidirecional sau reciproc poate fi numit, fie variaie acaracteristicii dependente n raport cu o alt caracteristic independent, fiecovariaie sau legtur prezent ntre cele dou variabile. Variabila independenteste numit explicativ, cauzal sau factorial, n timp ce variabila dependentapare ca rezultativ, explicat sau ca efect. Legturile sau covariaiile dintre diversefenomene sau procese din natur i din societate se afl sub o permanent influena legilor dinamice sau de tip statistic. O lege dinamic, transpus simplificat,genereaz o legtur dinamic (cauzal), sintetic exprimat prin afirmaia: unei

    cauze xii corespunde un efect yi, respectiv unui nivel xi i corespunde un anumitnivel yi . O lege de tip statistic, esenializat ntr-o legtur de tip statistic, estecaracterizat prin formularea: variabila yi depinde de mai multe cauze x1,x2,,xi,xn. Rezult c legea statistic este caracterizat de o relaie de multicauzalitate,unele variabile explicative, independente, factoriale deinnd un caracter esenial,altele unul ntmpltor.Legtura dinamic dintre x i ydevine matematic o funcieunivoc sau unifactorialyi= f(xi), n timp ce legtura statistic se transform ntr-ofuncie multifactorialyi= f(x1, x2,, xi,,xn).n mod concret, coninutul relaiilorexistente ntre familia factorilor explicativi x1,x2,,xi,xn i efectulyidescrie: a) odependen statistic (legtur univoc sau dinamic); b)o interdependenstatistic (legtur biunivoc); c) o interdependen fals (aparent), care dezvluien profunzime o cauz comun; d) o dubl dependen compensat al rezultat final

    asupra lui y este nul; e) descrie un simplu paralelism variaional ntre cele douvariabile, ce las impresia unei legturi statistice (xk nefiind un factor al lui y).Dintre cele cinci cazuri descrise, numai primele dou merit i pot fi caracterizatenumeric, pentru a intensifica gradul de cunoatere al variaiei lui yi, n raport cufactorii x1,x2,,xi,,xn . Cazurile c, i d nu precizeaz pentru moment informaiicantitative relevante, iar cazul e este tipic pentru un paralelism variaional de scurtsau lung durat, lipsit de semnificaie n aprofundarea variaiei lui yi.n cazul unuiasemenea conglomerat dinamic de factori nu este posibil ca relaia dintre cauz iefect s poat fi constatat la fiecare manifestare (xiyi). Relaia dintre variabilaexplicativ i variabila explicat poate fi ns sesizat ca o tendin medie specificunui numr suficient de mare de manifestri, elemente, indivizi. Analiza legturilori stabilirea unei regresii sau corelaii d rezultate bune atunci cnd: a) exist unnumr suficient de mare de cazuri individuale (perechi xi, yi); b) distribuiaabaterilor este o distribuie normal sau aproximativ normal; c) abstractizareafactorilor se realizeaz succesiv. Legtura statistic, n forma ei generic numitcorelaie statistic, reprezint deci o reflectare ntr-oform numeric adecvat ainterdependenei dintre fenomenele, procesele, indicatorii diverselor fenomenecercetate, n ceea ce privete natura, forma, direcia (sensul) i gradul deintensitate. Tipologia legturilor statistice este una dintre cele mai diverse, avnd labaz o gam variat de criterii. Principalele clasificri se realizeaz n raport de:

    a) natura relaiei de cauzalitate [legturi funcionale, univoce sau de cauzalitate

  • 7/22/2019 -Material Statistica Generala

    3/16

    3

    simpl de tipulyi=f(xi),precum ilegturi statistice (stohastice saumulticauzale) detipulyi= f(x1,x2,...,xi,xn )];

    b) numrul caracteristicilor factori sau al variabilelor luate n analiz(legturistatistice simple, n care apare o singur variabil rezultativ, dependent,explicativ sau efect yii se abstractizeaz sau se izoleaz din mulimea de cauzeposibile numai una singur xi, numit i variabil independent sau explicativ,precum i legturi statistice multiple, n care efectul yieste rezultatul a dou saumai multe variabile factoriale, cauzale concomitente sau asincrone);

    c) tipul i natura caracteristicilor (legturi referitoare exclusiv la variabilelecantitative i asociaii statistice, nerestricionate dar specifice celor calitative);

    d) forma legturii dintre variabile [legturi liniare exprimate prin ecuaia uneidrepte (yi=a+bxi) i legturi curbilinii, exprimate prin ecuaia unei funcii

    exponeniale (yi=abx), parabolice (yi= a+bxi+

    2

    icx ), hiperbolice (yi=a+b 1

    xi

    ) etc. ];

    e) direcia sau sensul n care se produc (legturi directe sau de acelai sens ilegturi inverse sau de sens contrar);

    f) timpul efectiv n care se realizeaz (legturi sincrone sau concomitente ilegturi asincrone sau cu decalaj);

    g) coninutul relaiei dintre variabile(dependene i interdependene).n lipsa unor serii lungi de date, n practica statistic dependenele i

    interdependenele false, compensate sau paralele - cu sensul de legturi artificiale-se las greu identificate sau descoperite i necesit alturi de testri semnificative io analiza conceptual, structural i funcional economic i social.

    6.2 Regresiastatistic

    i valorificarea ei n contabilitatea practic

    n mod curent, pentru identificarea i caracterizarea sumar a legturilor statisticese utilizeaz urmtoarele metode elementare: metoda seriilor paraleleinterdependente, metoda gruprii, metoda tabelului de corelaie, metoda grafic saucorelograma, ultima fiind cea mai des folosit. Prima utilizare a conceptului deorigine latin regresie (regressio = ntoarcere) aparine lui Francis Galton i aaprut n Regression toward mediocrity in hereditary stature (1886), din lucrareaNatural inheritance (1889), unde cu ajutorul tabelului de corelaie i al seriilor demedii legate, prezint rezultatele prelucrrii observaiilor culese despre nlimeaprinilor i nlimea fiilor acestora n 928 cazuri, postulnd existena unei regresiictre valoarea medie: din prini cu talie superioar regreseaz copii cu talie

    inferioar i invers. De aici au aprut dou aspecte majore n teoriaregresiei:ecuaia matematic a regresiei i intensitatea diferit a tendinei deregresie, n grupuri diferite. Rspunsul matematic avea s fie dat de ctre KarlPearson, la primul aspect prin indicarea funciei liniare simple ca fiind singuraadecvat problemei lui Francis Galton i la al doilea aspect prin introducereacelebrului su coeficient de corelaie. n anul 1909, G.U.Yule a propus, n locultermenului de regresie, impropriu utilizat, un altul de estimare sau de ecuaie deestimare. S-a constatat ns, c ncercarea era tardiv, termenul de regresie intrasei se extinsese rapid n gndirea statistico-matematic, conform expresiilor analiza

  • 7/22/2019 -Material Statistica Generala

    4/16

    4

    de regresie, ecuaia de regresie, linia de regresie, coeficientul de regresie etc.Regresia statistic sau metoda regresiei selecteaz funcia, ce aparine unei clase defuncii matematice, care realizeaz cea mai bun descriere a variaiei lui y i,bazndu-se pe relaia existent ntre xi i yi, o relaie liniar de tipulyi=a+bxi.Determinarea rapid a parametrilor regresiei liniare se realizeaz prinintermediul metodei celor mai mici ptrate. Metoda este aplicabil numai acelorfuncii care sunt de form polinomial sau pot fi aduse la o form polinomialprintr-un artificiu de calcul. Prin mulimea punctelor care alctuiesc corelogramasau diagrama de corelaie se pot trasa practic o infinitate de drepte aparinndaceleiai clase de funcii. Pentru a determina parametrii funciei care se apropie celmai mult de mulimea punctelor din grafic se recurge la minimizarea sumeiptratelor diferenelor dintre punctele graficului Pi(xi,yi) i punctele situate pedreapta de regresie Pi(xi, yi = a+bxi). n ipoteza avansat a unei legturi liniare (y i

    depinznd liniar de xi), respectiv yi = y(xi) = a + bxi, condiia matematic impusdevine: 2( )( )ii xy y =minim, echivalent practic cu: 2( )i if y a bx =minim. Pentru a stabili valoarea parametrilor a i b care definesc ecuaia regresieiliniare, minimul funciei fse obine calculnd derivatele (pariale) de ordinul ntin raport cu cei doi parametrii menionai, derivate ce sunt egalate cu zero:

    2 ( )( 1) 0i if

    y a bxa

    2 ( )( ) 0i if

    y a bx bb

    Apoi, simplificnd cu 2, nmulind cu cei doi coeficieni (-1) i (-xi) i nsumnd

    ecuaiile pentru toate valorile caracteristicilor xi i yi se obine sistemul:

    1 1 1

    0n n n

    i i

    i i i

    a bx y

    1 1

    n n

    i i

    i i

    na b x y

    2

    1 1 1

    0n n n

    i i i i

    i i i

    ax bx x y

    2

    1 1 1

    n n n

    i i i i

    i i i

    a x b x x y

    Apelnd la metoda determinanilor, sistemul va avea urmtoarele soluiiredactate simplificat, fr a se mai preciza operatorului sum () limitele:

    2 2

    2 2

    2

    det

    ( )det

    y xi i

    x y x y x x x yi i i i i i i ia

    n xi n x xi ix xi i

    2 2

    2

    det

    ( )det

    n yi

    x x y n x y x yi i i i i i ibn xi n x xi ix xi i

  • 7/22/2019 -Material Statistica Generala

    5/16

    5

    Ecuaia de regresie cutat yi = a + bxi este identic, n final, cu:

    2

    2 2( )

    i i i i i

    i

    i i

    y x x x yYn x x

    2 2( )

    i i i i

    i

    i i

    n x y x y Xn x x

    Parametrul aeste lipsit de semnificaie, n schimb bsau coeficientul de regresiearat sensul (+ sau -) i mrimea influenei luixiasupra luiyi, respectiv sensuli mrimea reaciei finale a luiyila modificarea cu o unitate a lui xi: a) cnd b > 0exist o legtur direct;b) cnd b = 0 nu exist nici o legtur; c) cnd b < 0 existo legtur indirect. De multe ori, apar diferene ntre valorile reale yii valorileteoretice

    ix iY a bx , pentru acelai nivel al variabilei cauzale xi, diferene care

    exprim efectul celorlali factori (secundari), ce perturb relaia dintre xiiyi. Caurmare funcia de regresie liniar

    ix iY a bx sau f(xi)= ia bx exprim tendina

    medie de modificare liniar a lui y in funcie de xi. fiind dreapta care se apropie celmai mult de norul de puncte pe care l traverseaz n corelograma sa specific. Pentru a evalua capacitatea unei funcii liniare de a caracteriza variaia lui yi nraport cuxise utilizeaz unul din cei doi indicatori de apreciere a calitii funcieide regresie: coeficientul de determinaie D i coeficientul de eroare e.

    2

    21 100i

    i x

    i

    y YD

    y y

    ,unde D (0,100%).Cu ct D este mai apropiat ca valoare de 100%, cu attfuncia de regresie liniar

    ix iY a bx descrie mai fidel variaia lui yi. Valoarea lui

    D(%) exprim procentual acea parte din variaia lui y i care este surprins saucuprins n funcia de regresie liniar

    ix iY a bx , adic este explicat prin

    influena lui xi. Coeficientul de eroare se determin similar coeficientului de

    omogenitate, 2 / 100Co x , cu referire la dispersia dintre punctele reale icele teoretice situate pe dreapta

    ix iY a bx :

    2

    100

    y Yxi i

    ni

    ye

    ,unde e (0,100%).

    Cu ct e se apropie de valoarea zero, cu att este mai corect descriereamulimii de valori reale ale lui yiprin intermediul funciei de regresie liniare

    ix iY a bx . Tipul de legtur statistic descris anterior este o regresie liniar

    simpl. Complexitatea fenomenelor i proceselor analizate conduce la identificarea

    de legturi liniare multiple, funcia de regresie liniar multipl avnd la baz o

    relaie cauzal multifactorial (sub aciunea celor mfactori determinani):

  • 7/22/2019 -Material Statistica Generala

    6/16

    6

    0 1 1 2 2 ..., ,...1 2

    m mY a a x a x a xx x xm , unde:

    a0exprim influena altor factori (secundari) cu aciune constant n afara celorm factori analizai i cuprini n relaia de calcul i a 1,a2,,am reprezintcoeficienii de regresie liniar multipl i exprim cu ct a reacionat n finalvariabila yi la modificarea cu o unitate a valorii variabilelor xi corespondente(x1,x2,xm).

    Legtura liniar multipl se transpune grafic sub forma unei suprafeemultidimensionale, determinarea parametrilor a1,a2,,am, valorificnd aceeaimetod a celor mai mici ptrate, prin condiia de minim a funciei:

    2

    ( ) , ,...,1 21

    nf x y Yx x xi mj

    = minim i nlocuind pe

    0 1 1 2 2 ...

    , ,...1 2 m mY a a x a x a xx x xm

    se obine

    2

    0 1 1 2 2

    1

    ( ) ...n

    i j j m mj

    j

    f x y a a x a x a x

    = minim

    Calculnd apoi derivatele de ordinul nti (pariale), derivate ce sunt egalate nfinal cu zero, se obine sistemul de ecuaii:

    0 1 11 1 1

    20 1 1 1 1 11 1 1 1

    20 1 11 1 1 1

    n n nna a x a x ym mj jjj j j

    n n n na x a x a x x y xm mj jj j j jj j j j

    n n n na x a x x a x y xmmj mj mj j mjjj j j j

    K

    K

    M

    K

    Sistemul conine m+1 ecuaii normale i se soluioneaz prin diverse metode

    clasice (metoda Cramer, metoda simplex etc.). Dup identificarea, parametrizareai aprecierea calitii unei funcii liniare de regresie se impune evaluarea final aintensitii legturii statistice.Pentru gndirea econometric a stabili ct deputernic sau ct de intens este o legtur statistic este mai ales o problem deveridicitate (verosimilitate) a modelului ce descrie dependena sau interdependenaunor fenomene reale. O intensitate puternic este echivalent cu un nivel dencredere ridicat n deciziile ulterioare ce vor fi bazate pe funcia teoreticidentificat i parametrizat. Pentru a msura intensitatea legturii se determincovariana i coeficientul de corelaie, iar pentru verificarea liniaritii se apeleaz

    i la raportul de corelaie. Covariana, notat cov(x,y), se determin ca mediearitmetic a produselor abaterilor individuale ale variabilelor fa de media lor:

    1 1cov( , )

    x y i i

    n n

    i i

    d d x x y y

    x yn n

    Prelucrnd relaia anterioar n care: 1 11 1

    i i

    i i i i

    n n

    n ni i

    i i

    x y

    x x y y x yn

    se

  • 7/22/2019 -Material Statistica Generala

    7/16

    7

    ajunge la: cov( , )x y x yi i i ix y xy x y

    n n n

    Covariana este aadar egal i cu diferena dintre media produsului celor dou

    variabile (xy ) i produsul celor dou medii (x y ) i beneficiaz de proprietiimportante. Astfel, semnul covarianei arat sensul legturii, iar valoarea zeroindic inexistena acesteia (independena variabilelor). Limitele valorice alecovarianei sunt: -x y cov(x,y) x y , deoarece covariana are ca maximprodusul x y (atunci cnd ntre variabile exist o legtur liniar funcional).Aprecierea intensitii rezultatului obinut drept covarian rmne ns dificil,deoarece valoarea acesteia difer de la o aplicaie la alta.Dac relaia anterioar semparte la produsul x yse va obine:

    cov( , )x y x y

    x y x y x y

    x y

    saucov( , )

    1 1x y

    x y

    Aceast nou relaie stabilizeaz saulimiteaz noul indicator obinut n intervalul

    [-1,1]. Parametrul rezultat este denumit coeficient de corelaie (ry/x):

    cov( , )

    /

    x yry x

    x y

    1 1 1 1 1

    2 22 2

    1 1 1 1

    n n n n nd d x x y y n x y x yx y i i i i i i

    i i i i i

    n n n n n nx y x yn x x n y yi i i i

    i i i i

    Dualitatea n regresie permite calculul coeficientului de regresie pe baza mediei

    geometrice a coeficienilor de regresie sau a pantelor celor dou drepte de regresie:

    /ix y x iY a b x i /iy x y iX a b y , respectiv: / / /r b by x y x x y .

    O soluie practic este i relaia de calcul: // /r b x yy x y x , dac sedispune cu promptitudine de x i y . Coeficientul de corelaie (ry/x), ca parametru

    al distribuiilor normale bidimensionale ce caracterizeaz legtura ntre variabilaexplicativ xii variabila rezultativ yiaparine intervalului [-1,0) (0,1]. Pentrury/x=0 nu exist legtur statistic, variabilele xi i yi fiind independente.Interpretarea unui coeficient de corelaie se realizeaz succint n modulmatematic

    ( /ry x ) i conform acestei interpretri se consider corecte urmtoarele afirmaii:

    1.cnd /ry x (0;0,2] practic nu exist legtur statistic sau este foarte slab;2.cnd /ry x (0,2;0,5] legtura este slab i trebuie testat statistic;3.cnd /ry x (0,5;0,75] legtura este de intensitate medie;4.cnd /ry x (0,75;0,95] legtura este puternic;5.cnd /ry x (0,95;1] legtura este foarte puternic,determinist (funcional).

  • 7/22/2019 -Material Statistica Generala

    8/16

    8

    O problem important a regresiei liniare este testarea liniaritii legturii

    ca soluie exclusiv, n raport cu orice alt funcie neliniar (curbilinie).Testul de verificare a liniaritii const din confruntarea valoriicoeficientului (ry/x) i a raportului de corelaie (Ry/x). Dac cele dou valoricoincid (ry/x= Ry/x), atunci corelaia este exclusiv de liniar. Raportul decorelaie msoar intensitatea legturii indiferent de forma acesteia (liniarsau neliniar).Raportul de corelaie (Ry/x) este rezultatul extragerii unuiradical elementar (de ordin II ) din coeficientul de determinaie (R squared

    sau R2y/x):

    2

    2 1/ / 2

    1

    1

    n

    iy x y x n

    i

    y Yxi iR R

    y yi

    sau /y x

    R D , iar Ry/x (0,1].

    Dac 2

    1

    n

    i xiiy Y

    tinde ctrezero, raportul de corelaie tinde spre valoareamaxim (Ry/x=1). Dac ry/x Ry/x, atunci legtura nu este exclusiv liniar.

    6.3 Corelaia statistici valorificarea ei n contabilitatea practic

    Corelaia statistic sau conceptul generic al legturii statistice este reflectareantr-o form numeric adecvat a interdependenelor obiective dintre procese saufenomene. Corelaia include att asocierea ct i regresia, att legtura liniar ct ineliniar (curbilinie), att legtura simpl, ct i cea multipl, att parial ct itotal. Conceptul are o istorie iniial legat de tiinele naturii. Termenul corelaie,exprim relaia, legtura reciproc ntre dou sau mai multe lucruri sau fenomene.

    Etimologic provine din cuvntul de origine latin correlatio = relaie cu, fiindpreluat din tiinele naturii, de la principiul corelaiei aa acum a fost el formulat dectre naturalistul francez Georges Cuvier (1769-1832): orice fiin nzestrat cuorgane formeaz un ansamblu, un sistem unic i nchis, ale crui pri se leagmutual i concur la aceeai aciune definitiv printr-o reacie reciproc. Nici unadin aceste pri nu poate s se schimbe fr ca celelalte s nu se schimbe, i, prinurmare, fiecare din ele, luat separat, influeneaz i se leag de toate celelalte.(P.Fouqui, R Saint-Jean-Dictionaire de la langue filosofique). Cea de-a dou sursaparine lui Charles Darwin, care a folosit expresia variabilitate corelativ neleasca raporturi reciproce ntre pri diverse ale organismului. Tot Francis Galton estecel care a transpus corelaia cu semnificaia de raporturi reciproce ntre variabile nstatistica matematic: corelaiile se observ peste tot unde variaiile a dou

    fenomene sunt datorate n parte uneia i aceleiai cauze comune.(Correlations andtheir measurements).n practic, apar variate legturi neliniare sau curbiliniispecifice dependenelor dintre variabila explicativ xi i rezultativ yi. Dac prin

    corelogram s-a identificat o hiperbol: 1

    i

    xiY a b

    x , prin metoda celor mai mici

    ptrate rezult: 2

    1

    n

    i xii

    y Y

    =minim 2

    1

    1i

    i

    n

    i

    y a bx

    =minim, iar sistemul de

  • 7/22/2019 -Material Statistica Generala

    9/16

    9

    ecuaii util determinrii lui ai b este:1

    1 1

    n n

    na b yii ixi

    1 1 1

    21 1 1

    n n na b yi

    i i ix xxi ii

    Soluiile sistemului sunt cele prezentate n continuare:

    1

    det1 1 1 1 1

    2 2

    1 11 2( )2

    det1 1

    2

    yi xi

    y y yi i ix x xx xi i ii i

    nn xx x ii i

    x xi i

    a

    det 1 1 1 1

    1 11 2( )

    2

    det1 1

    2

    n yi

    y n y yi i ix x x xi i i i

    nnxx x ii i

    x xi i

    b

    Raportul de corelaie specific bazat pe o funciehiperboliceste egal cu:

    21

    11

    / 2

    1

    ny a bi xi i

    Ry x n

    y yii

    n situaia cnd corelograma identific o funcie exponenial: Yxi= abxifuncia

    este de forma: lgYxi= lga+ xi lgb, care, prin metoda celor mai mici ptrate:

    2

    1i

    n

    i x

    i

    y Y

    = minim 2

    1

    i

    nx

    i

    i

    y ab

    = minim, conduce la urmtorul sistem

    de ecuaii normale necesar calcului parametrilor a i b, prin valorile lg a i lg b :

    1 1

    lg lg lgn n

    i i

    i i

    n a x b y

    2

    1 1 1

    lg lg lgn n n

    i i i i

    i i i

    x a x b x y

    Soluiile sistemului sunt cele descrise n continuare:

  • 7/22/2019 -Material Statistica Generala

    10/16

    10

    lgdet

    2 2lg lg lganti lg anti lg

    2 2( )

    det 2

    y xi i

    x y x y x x x yi i i i i i i ian x n x xi i i

    x xi i

    lgdet

    lg lg lganti lg anti lg

    2 2( )

    det 2

    n yi

    x x y n x y x yi i i i i i ibn x n x xi i i

    x xi i

    Raportul de corelaie specific bazat pe o funcie exponenialeste egal cu:

    2

    11/ 2

    1

    n xiy abiiR

    y x ny yi

    i

    Dac funcia identificat n corelogram este o funcieparabolic (de gradul al-

    II-lea), 2ix i i

    Y a bx cx , dup aplicarea metodei celor mai mici ptrate:

    2

    1i

    n

    i x

    i

    y Y

    = minim 2

    2

    i i iy a bx cx = minim,

    se va obine un sistem de trei ecuaii, util determinrii parametrilor a,bic:2

    1 1 1

    n n n

    i i i

    i i i

    a b x c x y

    2 3

    1 1 1 1

    n n n n

    i i i i i

    i i i i

    a x b x c x x y

    2 3 4 2

    1 1 1 1

    n n n n

    i i i i i

    i i i i

    a x b x c x x y

    Soluiile sistemului sunt urmtoarele:2

    2 3

    2 3 4

    2

    2 3

    2 3 4

    det

    det

    i i i

    i i i i

    i i i i

    i i

    i i i

    i i i

    y x x

    x y x x

    x y x xa

    n x x

    x x x

    x x x

    ,

    2

    3

    2 2 4

    2

    2 3

    2 3 4

    det

    det

    i i

    i i i i

    i i i i

    i i

    i i i

    i i i

    n y x

    x x y x

    x x y xb

    n x x

    x x x

    x x x

    i

  • 7/22/2019 -Material Statistica Generala

    11/16

    11

    2

    2 3 2

    2

    2 3

    2 3 4

    det

    det

    i i

    i i i i

    i i i i

    i i

    i i i

    i i i

    n x y

    x x x yx x x y

    cn x x

    x x x

    x x x

    iar

    22

    11/ 2

    1

    ny a bx cxi i i

    iRy x n

    y yii

    Fiecare parametru a, b i c se determin efectiv, utiliznd regula lui Cramerpentru sisteme de tip 33 (trei rnduri trei coloane).Funciile neliniare saucurbilinii nu se reduc la cele prezentate anterior. Se mai pot identifica prin

    corelograme i funcii putere ( xiY a bxi

    ), logaritmice ( lg )Y a b xx ii etc.

    Semnificaia raportului de corelaie se verific prin testul F al a analizei

    dispersionale, comparnd valoarea lui

    2 2n n

    x xii ii=1 i=1calculat

    Y - y y - Y

    F =k -1 n - k

    :

    cu valoarea

    lui Ftabelat sau (Fteoretic), unde k = numrul grupelor i n = numrul unitilorstatistice.Raportul de corelaie este semnificativ cnd Fcalculat> Ftabelatpentru k-1 irespectiv n-kgrade de libertate i pentru un nivel de probabilitate riguros precizatde 0,95; 0,97 sau 0,99 i mai rar valori superioare. n corelaia multipl, specificdistribuiilor multidimensionale se utilizeaz un raport de corelaie generalizat(dreapta) care se particularizeaz n cazul a dou variabile explicative x1i x2(stnga):

    2n

    x ,x ,...xn1 2i=1y/x ,x ,...x 2nn1 2

    i=1

    y - Yi

    R = 1-

    y - yi

    i2 2 ry/x y/x y/x y/x x /x1 2 1 2 1 2

    y/x ,x 21 2x /x1 2

    r + r - 2 r r R =

    1- r

    Corelaia parial este o form de izolare a unei legturi statistice ntr-un context

    relaional mai larg.Acest tip de corelaie caracterizeaz intensitatea legturii ntr-o

    ipotez de meninere a influenei unei singure variabile explicativex1n raport cu o

    variabilrezultativ Yx.n cazul a dou variabile independentex1ix2explicative i

    a unei singure variabile independente Y, coeficientul de corelaie parial (de

    ordinul nti) se calculeaz astfel: neglijnd influena luix2saux1:

    / / /1 2 2 1( / ), 2 21 2

    / /2 2 1

    (1 )(1 )

    Y x Y x x x

    Y x x

    Y x x x

    r r rr

    r r

    sau/ 1 /2 2 1

    ( / ), 2 22 1/ /1 2 1

    (1 )(1 )

    YxY x x x

    Y x x

    Y x x x

    r r rr

    r r

    Abordarea n timp a corelaiei extinde noiunea n sine i structureaz trei tipuride corelaii temporale:

    a) autocorelaiasau corelaia intern ca legtur ntre valorile aceleiai variabile,

  • 7/22/2019 -Material Statistica Generala

    12/16

    12

    separate printr-un interval de timp;b) corelaia sincron sau legtura ntre valoarea variabilei explicative xi, luat

    ntr-un anumit moment i valoarea variabilei rezultativeyi, luat n acelai moment;c) corelaia asincron sau cu decalaj, ca legtur ntre valoarea variabilei xi

    (prompt sau nedecalat), atins ntr-un anumit moment i valoarea unei altevariabile yi (tardiv sau decalat), atins dup un interval de timp determinat.Ultima categorie permite calculul unui coeficientul de corelaie simpl cu decalaj

    (autori Morice E. i Charter F.), dup relaia:

    n

    t- hi=1

    x - x - y - yi

    r =h n - h x y

    , unde: t =

    numrul de termeni al seriei iniiale i h= numrul de termeni cu care se decaleazcea de-a doua serie. Pentru a fixa corect valoarea lui h se reprezint grafic celedou serii i se gliseaz un grafic peste cellalt (reprezentri la aceeai scar).

    Coeficientul rh arat practic legtura ntre primii termeni ai seriei factoriale xi iultimii termeni ai celeitardiverezultativeyi,xi: x1,x2,x3,...,xti yi:y1+h,y2+h, y3+h,...,yt+h.

    Identificarea rapid i selectarea unor factori eseniali apeleaz i la metodeneparametrice, ce presupun nlocuirea variantelor reale cu numere de ordine(ierarhizare, ranguri etc.) sau cu diferene ntre termeni consecutivi i prezintavantaje semnificative prin utilizare, cnd distribuia variabilelor corelate nu estenormal sau nu este cunoscut i n condiii de asimetrie a distribuiilor variabilelorcorelate, deoarece: a)permit obinerea rapid a confirmrii sau infirmrii existeneilegturii statistice (inclusiv a intensitii, dac se identific o corelaie); b) suntunica soluie n situaia concret a lipsei de date absolute compensat de existenaunor clasamente, ierarhii, diferene ntre variante succesive etc.; c) constituie soluii

    practice cnd una sau ambele variabile corelate sunt calitative.I.Coeficientul de asociere definit de Yule G.U. i Kendall M.G.drept o situaie n

    care una dintre variabilele calitative nu poate avea loc fr cealalt variabilcalitativ, dei cealalt poate avea loc fr ca prima s se fi produs este cea maisimpl soluie practic.

    Debutul determinrii este dat de prezentarea variabilelorxiiyicu variantelex1inon x1, respectivy1, i non y1ntr-un tabel sintetic:

    Tabel nr. 6.1.

    yixi

    y1 nony1sau y2

    Total

    x1 a b a+bnonx

    1sau x

    2 c d c+d

    Total a+c b+d a+b+c+dn condiiile notaiilor anterioare, relaia de calcul a acestui coeficient devine:

    Y =

    ad

    bc

    ad

    bc

    1

    1 sau Y =

    bcad

    bcad

    .Cei doi coeficieni Yule G.U. i Kendall

    M.G. respectiv Q i Ybeneficiaz de proprieti i deficiene asemntoare,dezavantajul lor major fiind acela de a nu face distincie ntre asociere complet, n

  • 7/22/2019 -Material Statistica Generala

    13/16

    13

    formele ei pozitiv i negativ, detaliat pentru cele trei situaii specifice (fie nforma pozitiv b=c, c=0 sau b=c=0, fie n forma negativ a=0, d=0 sau a=d=0).

    II. Coeficienii Charles Eduard Spearman (rssau ) i Maurice Kendall (rksau )presupun n prealabil acordarea de ranguri (umere de ordine), n funcie de poziiadeinut de unitatea statistic, dup ce s-a procedat la ordonarea lor cresctoare.

    a)Ipoteza logic ce st la baza coeficientului Spearman este aceea c n cazulunei legturi directe foarte puternice exist o concordan aproape deplin ntrerangurile celor dou variabile corelate, iar n cazul unei legturi indirecte foarteputernice apare o discordan total ntre aceleai ranguri. Relaia de calcul a

    coeficientului Spearman este rs sau 2 31

    1 6 :n

    ii

    n nd

    , unde: di = rangul

    dup xi- rangul dup yi (di= rg xi rgyi), n=numrul unitilor la care s-au studiatcele dou caracteristici sau numrul perechilor de valori corelate. La stabilirea

    rangurilor variabilelor corelate apar situaii variantele pot deine aceeai valoare icrora li se va acorda acelai rang. n aceast situaie se va urmri ca rangul valoriidistincte imediat urmtoare s corespund cu numrul de uniti analizate.

    b).Relaia de calcul a coeficientului Kendalleste rksau 20,5 ( 1) ( 1)

    S S

    n n n n

    ,

    unde:1 1

    i i

    n n

    i i

    S P Q

    sau suma algebric dintre numrul de ranguri superioare

    fiecrui rang (1

    nPi

    i

    ) i numrul de ranguri inferioare (1

    nQi

    i

    ) calculate pentru

    caracteristica rezultativ condiionat de caracteristica factorial (ordonat). De

    regul, coeficientul Kendall este mai mic dect coeficientul Spearman, respectivrk

  • 7/22/2019 -Material Statistica Generala

    14/16

    14

    2 :k C D C D ,unde:C = suma produselor pozitive ix iy i *xi

    *yi , D =

    valoarea absolut a sumei produselor negative ix iy i *

    xi *yi , iar k[-1,1]

    i devine egal cu zero, atunci cnd C = D.

    V. Un alt coeficient de concordanmai echilibrat metodologic i care nu atinge

    cu aceeai uurin 1, ca n cazul celorlali doi coeficieni descrii anterior (uneori

    icnd legtura descris nu este funcional), este coeficientulBravais-Pearson:

    13 2 2

    1 1

    nx yi i

    ikn n

    x yi ii i

    sau

    * *

    * *

    13 2 2

    1 1

    n

    i

    n n

    i i

    x yi ik

    x yi i

    6.4 Test de autoevaluare i aplicaiistatistice n contabilitate

    A) Test de autoevaluareA1) ntrebri clasice recapitulative(Completai spaiile goale)

    1.De ce coexist ambele noiuni,respectiv i regresie i corelaie?2. Care este esena metodei celor maimici ptrate?3.Cum se determin un coeficient deregresie i ce semnificaie are?4.Cum se determin i interpreteazraportul de corelaie?5.Care sunt principalele instrumente

    neparametrice n aflarea intensitiicorelaiei?6.Care sunt coeficienii de evaluare aasocierii dintre variabile ?

    7. Care este una dintre cele mai

    rspndite soluii practice de evaluarea unei corelaii cu decalaj ?

    A2) ntrebri tip gril

    (ncercuii litera rspunsului corect)8. Alegei testul de verificare a liniaritiilegturiistatistice dintre relaiile urmtoare:a) r= K; b) r = R; c) e = D; d) R

    2= K

    2.

    9. Identificai relaia corect de calcul pentrucoeficientul de corelaie: a) r = b(x):(y);

    b) r = (ad-cd):(ad+cd); c) r = 2s:[(n(n-1)].9.Dou variabile de stoc Xii Yi, ntre care s-aidentificat o legtur dein urmtoarele date:Tabel nr. 6.2Xi 4 6 8 10 12 15 20 21 26 28Yi 85 70 120 165 185 220 215 225 209 206I. Coeficientul de regresie: a)5,687; b)0,37449;c) 0,99704; d) 0,78182. II. Raportul de corelaie:a) 5,687; b) 0,37449; c) 0,99704; d) 0,78182.III.Coeficientul Sperman: a)5,687; b) 0,37449; c)0,99704; d) 0,78182.

    B) Aplicaii rezolvate1.Care este valoarea coeficientului de asociere dintre nota obinut de ctre 25 de

    studeni la proiectul statistic i situaia lor final la examen?Tabel nr.6.3

    yi

    xi

    y1 nony1

    Total RezolvareConform valorii

    Q =bcad

    bcad

    =0,77

    Legtura directi intens

    Qc=T=))()()(( cdbdcada

    bcad

    =0,38

    (slab)x1 11 2 13

    Y =

    bcad

    bcad

    = 0,47 (legtur slab)non x1 5 7 12Total 16 9 25

  • 7/22/2019 -Material Statistica Generala

    15/16

    15

    Not: x1=studeni cu un proiect bun (nota la proiect media grupei) i non x1=studeni cuun proiect slab (nota0 intens relativ (jumtate din puncte fiind pe dreapta din grafic).

    Grafic nr. 6.1

    Calculul parametrilor a i b ai legturii liniare directe, semnalate n grafic:

    Tabel nr.6.4

    Numr desalariai (xi)

    Cifra de afaceri(yimil. lei)

    2ix

    xi yi Y a bxx ii Sistemul de ecuaii teoretic:

    na b x yi i

    2

    ia x b x x yi i i

    devine practic:

    10 100 14a b 100 1060 145, 4a b

    i are ca soluii:a = 0,5ib = 0,09iar regresia liniar

    Y a bxx ii parametrizat

    este 0,5 0,0 9x iiY x

    6 1.0 36 6,0 1,047 1.1 49 7,7 1,138 1.2 64 9,6 1,229 1.4 81 12,6 1,3110 1.3 100 13,0 1,4010 1.6 100 16,0 1,40

    11 1.4 121 15,4 1,4912 1.6 144 19,2 1,5813 1.7 169 22,1 1,6714 1.7 196 23,8 1,76

    100

    ix

    14,0

    iy

    1062ix

    145,4

    i ix y

    14,00

    xiY

    Se poate apela la relaia de control iy = xiY , oricnd disponibil tabelar, pentru

    4

    6

    8

    10

    12

    14

    16

    0 .9 1 .0 1 .1 1 .2 1 .3 1 .4 1 .5 1 .6 1 .7 1 .

    CA

    SALARIATI

    0.9

    1.0

    1.1

    1.2

    1.3

    1.4

    1.5

    1.6

    1.7

    1.8

    4 6 8 10 12 14 16

    SALARIATI

    CA

    MagazineP1 (6;1,0)

    P2 (7;1,1)

    P3 (8;1,2)P4 (9;1,4)

    P5 (10;1,3)

    P6 (10;1,6)P7 (11;1,4)

    P8 (12;1,6)

    P9 (13;1,7)

    P10 (14;1,7)

  • 7/22/2019 -Material Statistica Generala

    16/16

    16

    a verifica acurateea calculelor. Suma termenilor reali este egal cu a termenilorteoretici (ajustai). Coeficientul de regresie b = 0,09 arat c la fiecare cretere alui xi cu o unitate (salariat), cifra de afaceri notat yi, se majoreaz cu 0,09milioane lei n exemplul analizat, coeficientul de determinaie D = 86,8%, ceea cetraduce o calitate satisfctoare funciei de regresie liniare parametrizate, iarvaloarea coeficientului de eroare (e) = 6,67%. Cum valoarea ry/x = Ry/x=0,9315885 i se poate afirma c ntre variabila numr de salariai i cifra deafaceri exist o legtur statistic de intensitate puternic, exclusiv liniar deforma: 0,5 0,0 9x ii

    Y x .

    C) Aplicaii propuse spre rezolvare1 Cinci magazine sunt ordonate cresctor n raport cu preul practicat:Tabel nr. 6.5

    Magazin Preul practicat(xi - lei / kg)

    Cantitatea vndut(yi-mii kg)

    1 10,0 9,02 12,0 8,83 15,0 8,24 18,0 8,05 20,0 8,0

    Aplicai metoda grafic de identificare a legturii statistice ntre xii y i, calculaiparametrii a i b ai modelului de regresie i interpretai semnificaia coeficientuluide regresie. Analizai calitativ funcia de regresie cu un coeficient de determinaie

    i de eroare i, n final determinai raportul de corelaie i coeficientul decorelaie. Verificai liniaritatea legturii prin testul Rxy = rxy.

    2.Pornind de la suprafaa comercial(xi) i vnzrile firmei (yi), din ultimele 6 luni,parametrizai o regresie ntre cele dou variabile de forma y i= a + bxi

    ,

    evalund

    intensitatea corelaiei i estimnd vnzrile la o suprafa de 250 i 300 mp:Tabel nr.6.6

    LunaI II III IV V VI

    Suprafaa comercial (mp) 50 70 80 120 140 210Valoarea vnzrilor(mii lei ) 480 600 820 1100 1400 2200

    3.Pornind de la un eantion alctuit din 50 de firme s-au obinut urmtoarele datedespre productivitatea medie i salariul mediu lunar:

    Tabel nr. 6.7Productivitatea medie135 produse / salariat

    Salariul mediu (11600 lei / salariat)TotalMai mic dect media Mai mare dect media

    Mai mic dect media 16 6 22Mai mare dect media 9 19 28

    Total 25 25 50Coeficientul de asociere de tip Yule este: a) 0,243; b) 0,980; c) 0,901; d) 0,698.