corelatie regresie

download corelatie regresie

of 30

Transcript of corelatie regresie

  • 8/13/2019 corelatie regresie

    1/30

    Corelaiai regresia liniarSorana D. BOLBOAC

  • 8/13/2019 corelatie regresie

    2/30

    Coninut Corelaia

    Definiie Formule de calcul Testarea ipotezelor

    Regresia liniar- Simpl- Multipl

    2

  • 8/13/2019 corelatie regresie

    3/30

    1. Direcia

    Pozitiv(+) Negativ (-)

    2. Gradul de asociere

    ntre 1 i 1 Valoarea absolutsemnificputerea asocierii

    3. Forma

    Linear Nelinear

    Corelaia: 3 caracteristici

    3

  • 8/13/2019 corelatie regresie

    4/30

    0.0

    6.7

    13.3

    20.0

    0.0 4.0 8.0 12.0

    C1 vs C2

    C1

    C2

    0.0

    40.0

    80.0

    120.0

    0.0 83.3 166.7 250.0

    C1 vs C2

    C1

    C2

    Pozitiv

    Valori mari ale lui X se asociazcuvalori mari ale lui Y

    Valori mici ale lui X se asociazcuvalori mici ale lui Y

    Valori mari ale lui X se asociazcu valori mici ale lui YValori mici ale lui X se asociazcu valori mari ale lui Y

    Ex. Viteza i acurateea

    Negativ

    Corelaia: 1. direcia

    4

  • 8/13/2019 corelatie regresie

    5/30

    0.0

    6.7

    13.3

    20.0

    0.0 4.0 8.0 12.0

    C1 vs C2

    C1

    C2

    0.0

    40.0

    80.0

    120.0

    0.0 4.0 8.0 12.0

    C1 vs C2

    C1

    C2

    Puternic

    Slab

    (nor de puncte difuz)

    Corelaia: 2. Gradul asocierii

    5

  • 8/13/2019 corelatie regresie

    6/30

    Linear Nelinear

    Corelaia: 3. Forma

    6

  • 8/13/2019 corelatie regresie

    7/30

    Tehnicstatisticcare msoar i descrie gradul

    de asociere lineardintre douvariabilecantitative continue normal distribuite

    Corelaia Pearson: Definiie

    Obs X Y A 1 1B 1 3

    C 3 2D 4 5E 6 4F 7 5

    Date

    X

    Y

    Grafic de tip nor de puncte

    7

  • 8/13/2019 corelatie regresie

    8/30

    Media

    lui X

    >Medialui Y >Medialui Y

    Medialui X

  • 8/13/2019 corelatie regresie

    9/30

    Media

    X

    >Medialui Y >MediaY

    Medialui X

  • 8/13/2019 corelatie regresie

    10/30

    Media

    lui X

    >Medialui Y >Medialui Y

    Medialui X

  • 8/13/2019 corelatie regresie

    11/30

    11

    Coeficientul de corelaie PearsonSimbol: r, R

    Ia valori ntre -1 i +1 indicnd puterea (interpretmvaloarea coeficientului) i direcia (interpretm semnulcoeficientului) asocierii lineare.

    Valoarea absolutindicputerea asocierii + (direct proporional)/- indic(invers proporional)direcia asocierii

    ( ) ( )

    =

    22YYXX

    YYXXr

  • 8/13/2019 corelatie regresie

    12/30

    Coeficientul de corelaie Pearson

    Asumpii:

    1.Erorile din date sunt independente2.Existo relaie de linearitate ntre cele douvariabile de interes

    3.Variabilele urmeazo distribuie normalbivariat

    12

  • 8/13/2019 corelatie regresie

    13/30

    Femur Humerus

    A 38 41B 56 63

    C 59 70

    D 64 72E 74 84

    Mean 58.2 66.00

    SSX SSY SP

    )( XX )( YY 2)( XX 2)( YY ))(( YYXX

    YXSSSS

    SP=r

    Coeficientul de corelaie Pearson

    13

  • 8/13/2019 corelatie regresie

    14/30

    Femur Humerus

    A 38 41 20.2 25 408.04 625 505B 56 63 2.2 3 4.84 9 6.6

    C 59 70 0.8 4 .64 16 3.2

    D 64 72 5.8 6 33.64 36 34.8E 74 84 15.8 18 249.64 324 284.4

    mean 58.2 66.00 696.8 1010 834

    SSX SSY SP

    )( XX )( YY 2)( XX 2)( YY ))(( YYXX

    r = 0.99

    Coeficientul de corelaie Pearson

    14

  • 8/13/2019 corelatie regresie

    15/30

    Coeficientul de corelaie Pearson: Interpretare

    O msura puterii asocierii: ct de puternic

    punctele din grafic se aglomereazn jurul uneilinii? O msura direciei asocierii: pozitivsau negativ?

    Reguli empirice de interpretare a coeficientului decorelaie: Colton [Colton T. Statistics in Medicine.Little Brown and Company, New York, NY 1974] :

    R [-0.25 to +0.25] Nu existnici o relaie R (0.25 to +0.50] (-0.25 to -0.50] relaie slab R (0.50 to +0.75] (-0.50 to -0.75] relaie

    moderat R (0.75 to +1) (-0.75 to -1) relaie puternic 15

  • 8/13/2019 corelatie regresie

    16/30

  • 8/13/2019 corelatie regresie

    17/30

    Coeficientul de corelaie al rangurilor Spearman

    Se poate aplica pe orice tip de variabile

    Nu necesitasumpia distribuiei normale bivariate acelor 2 variabile de interes

    Simbol:

    17

  • 8/13/2019 corelatie regresie

    18/30

    Coeficientul de corelaie al rangurilor Spearman

    Semnul coeficientului de corelaieSpearman indicdirecia asocierii

    (invers proporionale pentrusemnul -i direct proporionalpentru semnul +) dintrevariabilele investigate

    =1 relaia dintre cele douvariabile investigate estemonoton. N.B. Nu va da un

    coeficient de corelaie Pearsonegal cu 1.

    18

  • 8/13/2019 corelatie regresie

    19/30

    Coeficientul de determinare (r2/R2)

    Valoarea covariaiei raportat la volumul total al

    variaiei Procentul din variaia totalcare este explicat

    de variabilele independente

    Exemplu

    Dacr = 0.80 variabilele independente explic64% din variabilitatea variabilei dependente

    19

  • 8/13/2019 corelatie regresie

    20/30

    Proprietile coeficientului de corelaie

    O statisticstandardizat nu se modificdac

    schimbm unitile de msurale variabilelor.Valoarea este identicdaccorelm pe X cu Y

    sau pe Y cu X.

    Valoarea este destul de instabilpentru n micVulnerabil la valori extreme

    Are o distribuie asimetric

    20

  • 8/13/2019 corelatie regresie

    21/30

    Coeficientul de corelaie: exemplu

    Enciu A, Zamfir CZ, Nicolescu A, Ida A. THE ANALYSIS OFCORRELATIONS BETWEEN THE MAIN TRAITS OF WOOL

    PRODUCTION ON MILK BREED PALAS. Lucrritiinifice -Seria Zootehnie ????;57:50-54.

    21

  • 8/13/2019 corelatie regresie

    22/30

    Matricea de corelaie

  • 8/13/2019 corelatie regresie

    23/30

    Regresia linearsimpl

    Regresia linearmultipl

  • 8/13/2019 corelatie regresie

    24/30

    Regresia liniar: asumpii

    Erorile msurtorilor sunt independente

    Regresia depinde de identificarea corectamodelului relaional

    Nu existerori n msurarea valorilor variabileidependente

    Variaia valorilor lui Y este aceeai pentru toate

    valorile lui XValorile Y urmeazo distribuie normal

    24

  • 8/13/2019 corelatie regresie

    25/30

    Regresia liniar

    Dacexisto relaie de liniaritate ntre

    variabilele de interes putem identifica o ecuaiesimplpentru a prezice o variabilcunoscndcealaltvariabil

    Variabila rezultate este variabila Y, iar variabilapredictor este variabila X Exemplu: transformarea n grade Fahrenheit

    cunoscnd valoarea n grade Celsius:F = 32 + 1.8CAceastformuldo line perfect

    25

  • 8/13/2019 corelatie regresie

    26/30

    Ecuania dreptei

    Formula general: Y = a + bX Ecuaia de predicie: = a+ bX

    a = intercept, b = coeficientul dreptei, X = predictor

    a i b sunt constante ntr-o ecuaie; X i Y se modific

    26

  • 8/13/2019 corelatie regresie

    27/30

    27

    Panta i interceptul

    = a + bX Panta b: Cantitatea cu care valoarea Y se modificn

    momentul n care modificm valoarea lui X cu o unitate

    Interceptul a: valoarea lui Y cnd X este zero

    Panta este influenatde r, dar nu are aceeai semnificaieca i r

    Xx

    y

    SS

    SP

    s

    srb ==

    XbYa =

    28

  • 8/13/2019 corelatie regresie

    28/30

    http://onlinelibrary.wiley.com/doi/10.1111/j.1939-1676.2011.00812.x/pdf

    29

  • 8/13/2019 corelatie regresie

    29/30

  • 8/13/2019 corelatie regresie

    30/30

    De reinut!

    Evaluarea puterii asocierii dintre douvariabilecantitative continue (normal distribuite) corelaie

    Prezicerea unei variabile (Y) n funcie de o altvariabil(X) regresie