04 Evaluarea Unor Factori Prognostici - Corelatii Si Regresii

15
 Evaluarea existenţei, mărimii şi sensului influenţei factorilor prognostici Corelaţii şi regresii Introducere Numeroase caracteris tic i ale or ganismului uman, simptom e, semne, probe de laborator sau exp lor ri pa raclinice, sunt asociat e în perioadele de s n tate sau de boal . ă ă ă ă  Cunoaşterea acestor asocieri este ut il pe ntru pr even ia bolil or , pe ntru realizarea de ă ţ  prognostice, pentru diagnosticarea şi tratarea bolilor. Faptul c anum ite caract eristici se ă  asociaz nu înseamn îns c exist o rela ie de cauzalitate, adic faptul c o ă ă ă ă ă ţ ă ă  caracteristic o dete rmin pe cealalt . Cauzalitatea implic rela ii puternice, constan te , ă ă ă ă ţ  specifice, plauzibile, care urmea z o anumit secven temporar (cauza precede efectul), ă ă ţă ă  ş i pr ezint o rela ie între doz ş i ef ect. Pentru demonstrarea cauzalit ii sunt necesare ă ţ ă ăţ  numeroase studii de tipuri diferite, frecvent fiind necesare studii experimentale. Pen tru a ve dea dac dou caracteristic i cant itative continue sunt asociate, fie liniar, ă ă  fie dup o lege exponen ial , logaritmic sau polinomial , se utilizeaz corela ia. ă ţ ă ă ă ă ţ  Co efi cientu l de corela ie ne o fer m sura acestei asocieri. Coeficientul de corela ie arat ţ ă ă ţ ă m sura în care varia iile unei variabile sun t co relate cu varia iile altei variabile ă ţ ţ Pentr u a prezice o caracteristic în func ie de una sau mai multe ă ţ  caracteristici se utilizeaz regresia. Regresiile exprim dependen a ă ă ţ  caracte rist icilor sub forma unei ecua ii. Cea mai simpl reg resie este de forma y= ţ ă  a*x + b. Aceasta este o regresie linear simpl . Ea ne permite sa afl m y dac ă ă ă ă ştim valoarea lui x (a şi b sunt coeficien ii regr esiei). Valoar ea coeficien ilor ne ţ ţ  arat cu cât se modi fi c valoarea pr ezis pent ru f iecare modi fic are de o unitate a ă ă ă  caracte rist icil or pe care le ut iliz m pent ru pre dic ie. Regresiil e pot avea mai mult ă ţ  de o variabil , respectiv pot fi mul t mai co mplicate (pot fi p tr atice, exponen iale ă ă ţ  sau combina ii). Variabila (caracteristica) prezis se numeşte variabil ţ ă ă dependent ă. Variabilele (caracteristicile) utilizate pentru a prezice se numesc variabile independente sau explicative. Studiile care se fac pentru a evalua asocieri, leg turi între diverse ă  caracteristici, factori, boli, pot utiliza corela ii ş i re gr esii. În aceste studii ţ  observa ionale, datele se culeg o singur dat . ( ţ ă ă Ex. pentru a prezice greutatea oamenilor în func ie de î n l imea lor, se va m su ra la un num r mare de subiec i  ţ ă ţ ă ă ţ  în l imea şi greutatea lor. ă ţ  Pent ru a vedea dac între nivelul de tri gl icer ide şi ă  gr eutatea cor por al exist o rela ie linear (o cor ela ie) se va m sura pe ntru mai ă ă ţ ă ţ ă  mul i subiec i (ex. di n spi tale, care au patologi i ce nu interf er cu met abol ismul  ţ ţ ă  1

Transcript of 04 Evaluarea Unor Factori Prognostici - Corelatii Si Regresii

Page 1: 04 Evaluarea Unor Factori Prognostici - Corelatii Si Regresii

5/17/2018 04 Evaluarea Unor Factori Prognostici - Corelatii Si Regresii - slidepdf.com

http://slidepdf.com/reader/full/04-evaluarea-unor-factori-prognostici-corelatii-si-regres

Evaluarea existenţei, mărimii şi sensului influenţei factorilor prognostici

Corelaţii şi regresii

Introducere

Numeroase caracteristici ale organismului uman, simptome, semne, probe de

laborator sau explor ri paraclinice, sunt asociate în perioadele de s n tate sau de boal .ă ă ă ă  

Cunoaşterea acestor asocieri este util pentru preven ia bolilor, pentru realizarea deă ţ  prognostice, pentru diagnosticarea şi tratarea bolilor. Faptul c anumite caracteristici seă  

asociaz nu înseamn îns c exist o rela ie de cauzalitate, adic faptul c oă ă ă ă ă ţ ă ă  

caracteristic o determin pe cealalt . Cauzalitatea implic rela ii puternice, constante,ă ă ă ă ţ  

specifice, plauzibile, care urmeaz o anumit secven temporar (cauza precede efectul),ă ă ţă ă  

şi prezint o rela ie între doz şi efect. Pentru demonstrarea cauzalit ii sunt necesareă ţ ă ăţ  

numeroase studii de tipuri diferite, frecvent fiind necesare studii experimentale.

Pentru a vedea dac dou caracteristici cantitative continue sunt asociate, fie liniar,ă ă  fie dup o lege exponen ial , logaritmic sau polinomial , se utilizeaz corela ia.ă ţ ă ă ă ă ţ  

Coeficientul de corela ie ne ofer m sura acestei asocieri. Coeficientul de corela ie aratţ ă ă ţ ă 

m sura în care varia iile unei variabile sunt corelate cu varia iile altei variabileă ţ ţ

Pentru a prezice o caracteristic în func ie de una sau mai multeă ţ  

caracteristici se utilizeaz regresia. Regresiile exprim dependen aă ă ţ  

caracteristicilor sub forma unei ecua ii. Cea mai simpl regresie este de forma y=ţ ă  

a*x + b. Aceasta este o regresie linear simpl . Ea ne permite sa afl m y dacă ă ă ă ştim valoarea lui x (a şi b sunt coeficien ii regresiei). Valoarea coeficien ilor neţ ţ  

arat cu cât se modific valoarea prezis pentru fiecare modificare de o unitate aă ă ă  

caracteristicilor pe care le utiliz m pentru predic ie. Regresiile pot avea mai multă ţ  

de o variabil , respectiv pot fi mult mai complicate (pot fi p tratice, exponen ialeă ă ţ  

sau combina ii). Variabila (caracteristica) prezis se numeşte variabilţ ă ă 

dependentă. Variabilele (caracteristicile) utilizate pentru a prezice se numesc

variabile independente sau explicative.

Studiile care se fac pentru a evalua asocieri, leg turi între diverseă  

caracteristici, factori, boli, pot utiliza corela ii şi regresii. În aceste studiiţ  

observa ionale, datele se culeg o singur dat . (ţ ă ă Ex. pentru a prezice greutatea

oamenilor în func ie de în l imea lor, se va m sura la un num r mare de subiec i ţ ă ţ ă ă ţ   

în l imea şi greutatea lor.ă ţ    Pentru a vedea dac între nivelul de trigliceride şiă  

greutatea corporal exist o rela ie linear (o corela ie) se va m sura pentru maiă ă ţ ă ţ ă  

mul i subiec i (ex. din spitale, care au patologii ce nu interfer cu metabolismul ţ ţ ă  

1

Page 2: 04 Evaluarea Unor Factori Prognostici - Corelatii Si Regresii

5/17/2018 04 Evaluarea Unor Factori Prognostici - Corelatii Si Regresii - slidepdf.com

http://slidepdf.com/reader/full/04-evaluarea-unor-factori-prognostici-corelatii-si-regres

lipidic şi cu greutatea) nivelul de trigliceride şi greutatea corporal .ă ). Datele

strânse se vor reprezenta grafic, iar dac norul de puncte sugereaz rela ii lineareă ă ţ  

(form de elips ) se poate trece la realizarea corela iei, şi a regresiei.ă ă ţ

Scopul lucr rii:ă

• dobândirea abilit ilor necesareăţ realiz rii şi interpret rii corela iilor şi regresiiloră ă ţ  

liniare (simple şi multiple)

Utilitate:

• realizarea de corela ii şi regresii lineare pentruţ teza de doctorat, alte

cercet ri personale, etc.ă

• realizarea unui protocol de studiu pentru realizarea de corela ii şi regresii lineareţ

• în elegerea şi interpretarea studiilor care utilizeaz corela ii şi/sau regresiiţ ă ţ  

lineare pe care le ve i citi în calitate de clinicieniţ

Scenariu:S-a dorit realizarea unui studiu antropometric la nivelul nou-n scu ilor cu vârstă ţ ă gesta ional cuprins între 25 şi 35 de s pt mâni, din România pentru aţ ă ă ă ă  

determina rela iile dintre greutatea la naştere şi lungime, perimetrul cranian (PC)ţ  şi vârsta mamei. Studiul a fost desf şurat pe totalitatea nou-n scu ilor în Spitalulă ă ţ  

 Jude ean Satu-Mare în perioada Ianuarie – Decembrie 2004, cu vârsteţ  

gesta ionale cuprinse între 25 şi 35 de s pt mâni.ţ ă ă

Protocolul studiului

1. Scopul, obiectivele cercet rii (completa i în spa iile de mai jos)ă ţ ţScopul cercet rii:ăEvaluarea asocierii dintre greutatea la naştere şi lungime, perimetrul cranian,vârsta mamei la nou-n scu ii cu vârsta gesta ional între 25 şi 35 de s pt mâni.ă ţ ţ ă ă ăObiective (descrierea unui fenomen pentru căutarea de ipoteze privind existenţa unor factori

 prognostici / evaluarea existenţei unei legături între boală şi un factor de risc (sau între o variabilă

dependentă şi una sau mai multe variabile independente) / cuantificarea importanţei acestei legături / evaluarea cauzalităţii pentru această legătură):

• Evaluarea posiblităţii existenţei unor relaţii lineare între greutatea la naştere şi lungime, perimetrucranian, vârsta mamei

• Evaluarea existen ei unei leg turiţ ă  între greutatea la naştere şi lungime• Evaluarea existen ei unei leg turiţ ă  între greutatea la naştere şi perimetrul

cranian• Evaluarea existen ei unei leg turiţ ă  între greutatea la naştere şi vârsta mamei• Evaluarea existen ei unei leg turiţ ă  între greutatea la naştere şi lungime,

perimetrul cranian şi vârsta mamei• Cuantificarea importan ei acestor leg turiţ ă

2. Domeniu de cercetare (introduce i un X în c su a corespunz toare)ţ ă ţ ă

Descrierea unui fenomen de s n tateă ă

2

Page 3: 04 Evaluarea Unor Factori Prognostici - Corelatii Si Regresii

5/17/2018 04 Evaluarea Unor Factori Prognostici - Corelatii Si Regresii - slidepdf.com

http://slidepdf.com/reader/full/04-evaluarea-unor-factori-prognostici-corelatii-si-regres

Evaluarea unui procedeu diagnostic

Evaluarea unei abord ri teră apeutice

Cercetarea unor factori de risc şi/sau prognostici x

3. Tipul studiului: (introduce i un X în c su a corespunz toare)ţ ă ţ ăA. În func ie de obiectivele studiuluiţ

a. Descriptiv

b. Analitic x

B. În func ie de rezultatele vizţ ate

a. Observa ionalţ x

b. Experimental

4. Popula ie int şi eşantionul de studiu (completa i în spa iile de mai jos)ţ ţ ă ţ ţ

Popula ia intţ ţ ă:•

Caracteristici clinice: • Caracteristici demografice: nou-n scu i cuă ţ vârste gesta ionale cuprinse între 25 şiţ  35 de s pt mâniă ă

Popula ia accesibilţ ă (datorat unor constrângeri geografice/temporale pentru subiec iă ţ  sau cercet tor…):ă totalitatea nou-n scu ilor în Spitalulă ţ  Jude ean Satu-Mare în perioadaţ  Ianuarie – Decembrie 2004, cu vârste gesta ionale cuprinse între 25 şi 35 deţ  s pt mâniă ă

Eşantionul de studiu (identifica i şi completa i criteriile de includere şiţ ţ  excludere în coloana corespunz toare)ă :

•Criterii de includere (necesare definirii criteriilor care îi identific specific pe subiec iă ţ    pentru a participa la studiu):

• Caracteristici clinice: • Caracteristici demografice: nou-n scu i cuă ţ vârste gesta ionale cuprinseţ   între 25 şi 35 de s pt mâniă ă

•Criterii de excludere (aplicate subiec ilor ce întrunesc criteriile de includere): ţ 

• Factori care induc erori (boli coexistente/tratamente concomitente):•Reac ii adverse:ţ•Factori ce fac dificil /imposibil ob inerea de date:ă ă ţ•

Probleme de etic :ă•Talia (m rimeaă ) eşantionului este suficient ? (ă dac este mai mare decât 10 înmul it ă ţ   cu num rul maxim de variabile independente incluse in regresia linear multipl ) (Da/nu):ă ă ă  140>10*3 => DA

5. Modalitatea de culegere a datelor (introduce i un X în c su aţ ă ţ  corespunz toare şi completa i în spa iile de mai jos)ă ţ ţA. În func ie de popula ia cuprins în studiuţ ţ ă

a. Exhaustivă (se studiaz toat popula ia int /disponibil )ă ă ţ ţ ă ă

b. Prin eşantionare c (se studiaz o parte din toat popula ia int /disponibil )ă ă ţ ţ ă ă

B. În func ie de durata culegerii datelorţ

a. Transversală x

3

Page 4: 04 Evaluarea Unor Factori Prognostici - Corelatii Si Regresii

5/17/2018 04 Evaluarea Unor Factori Prognostici - Corelatii Si Regresii - slidepdf.com

http://slidepdf.com/reader/full/04-evaluarea-unor-factori-prognostici-corelatii-si-regres

b. Longitudinală

B(1). Retrospectiv

B(2). Prospectiv

C. În func ie de modul de alc tuire a grupei sau grupelor de subiec i lua i în studiuţ ă ţ ţa. Eşantion reprezentativ x

Preciza iţ boala urm rit / factorul urm rită ă ă : greutateaPreciza iţ factorul de dependent urm rit / factorul(ii) independent( i)ă ţ  urm rit( i)ă ţ : lungimea, perimetrul cranian, vârsta mamei

b. Expus - neexpusPreciza iţ factorul de dependent urm rită / factorul(ii) independent( i)ţ  fixat( i)ţ :Preciza iţ factorul de expunere fixat / boala urm rită ă:

c. Caz - martorPreciza iţ boala fixată / factorul de expunere urm rită :Preciza iţ factorul de dependent urm rită  / factorul(ii) independent( i)ţ  urm rit( i)ă ţ :

6. Definirea variabilelor (completa iţ numele variabilelor în coloanacorespunz toare)ăA. Calitative(atribut)

Nominale (ex.culoare p r)ă

• Etnie• Tipul laptelui• Stare civilă

Nominale ordonate (ex.stadiu boal )ă

Dicotomiale (ex.sex)SexMediu

B. CantitativeContinue (ex. greutate)

• IP

• Lungime

• PC

• PT

• Greutate

Discrete (ex. num r copii)ă

• Vârsta mamei

• Vârsta tat luiă

• Scor Apgar

C. Supravie uire (ex. timp pân la deces)ţ ă

Vârsta gestatională

7. Descrierea şi analiza datelor (introduce i un X în c su a corespunz toare)ţ ă ţ ăPrograme folosite pentru prelucrarea datelor:

• Excel – clic aici şi salva i pe local fişierul BD_Corel.xlsţBaza de date folosit :ă  Ctrl clic pe link-ul corespunz tor bazei de date şi salvarea acesteia în contulă  dumneavoastrăDescrierea datelor (bifa i pentru ce tip de date se va face descrierea. Zona în griţ  v indic ce metode de descriere ve i utiliza şi interpretarea unde este cazul):ă ă ţ

a. pentru variabile calitative:• descrierea unei variabile

o se vor utiliza: tabele de frecvenţăo se vor utiliza: grafice de tip sectorial (pie)

• descrierea rela iei întreţ dou variabileă

4

Page 5: 04 Evaluarea Unor Factori Prognostici - Corelatii Si Regresii

5/17/2018 04 Evaluarea Unor Factori Prognostici - Corelatii Si Regresii - slidepdf.com

http://slidepdf.com/reader/full/04-evaluarea-unor-factori-prognostici-corelatii-si-regres

o se pot utiliza: tabele de contingenţăo se pot utiliza: grafice de tip coloane

 b. pentru variabile cantitative: • descrierea unei variabile

o se vor utiliza: media şi devia ia standard (SD)ţ , în formatul: medie± devia ie standard.ţ Ex. nivelul colesterolului în lotul studiat este:190 ± 15 mg/dl ( media ± 1 SD)

interpretare: în intervalele:

• medie ± 1 SD se afl aprox. 68% din datele dină  eşantionul studiat

• medie ± 2 SD se afl aprox. 95% din datele dină  eşantionul studiat

• medie ± 3 SD se afl aprox. 99% din datele dină  eşantionul studiat

o se vor utiliza: tabele de frecvenţăo se vor utiliza: histograme

Interpretare: distribuţia e normală dacă urmează grosier o formă declopot – adică valorile extreme sunt puţine şi majoritatea datelor sunt apropiate

de medie. Distribuţia nu e normală dacă are o formă marcat asimetrică, saumult diferită de forma de clopot.

c. Pentru variabile de supravie uire:ţ

• se va utiliza: mediana timpului de supravie uireţ• se va utiliza: curba de supravie uire Kaplan-Meierţ

Analiza datelor (Pentru fiecare obiectiv în parte sunt preciza iţ indicatorii pecare trebuie s -i calcula i, sauă ţ testele statistice necesar a fi realizate şiformatul în care trebuie s scrie i rezultatele)ă ţObiective:evaluarea posibilit ii existen ei unei leg turi lineare între diferi i indicatori antropometriciăţ ţ ă ţ

• Analiza prin tabele sau figuri a rela iei dintre variabileţo pentru variabile calitative: 

• se vor utiliza: tabele de contingenţă

• se vor utiliza: grafice de tip coloane

• Interpretare: dacă raportul între variabile e proporţional – nu existălegătură între caracteristici, dacă nu e proporţional, atunci probabil există olegătură, iar această legătură poate fi testată şi descrisă.

o pentru variabile cantitative: • se poate utiliza: diagram nor de puncte (Scatter)ă

• Interpretare: dac punctele par s urmeze oă ă dreaptă 

oblică, atunci posibil s existe oă rela ie linearţ ă întrevariabile. Dac dreapta pare oblic ascendent atunci rela iaă ă ţ  

 între variabile este direct propor ional , dac dreapta pareţ ă ă  oblic descendent atunci rela ia dintre variabile este inversă ţ  propor ional . Pentru evaluare ulterioar se poate folosiţ ă ă  corela ia şi regresia linear . Dac punctele sunt dispuseţ ă ă f ră ă s dea impresia de dreapt oblică ă ă (ex. stau aproximativ

 în cerc, sau pe o dreapt orizontal sau vertical ) atunci întreă ă ă  variabile nu exist o rela ie lineară ţ ă. Dac punctele par să ă urmeze o alt formă ă (ex. curbă  de gradul doi, curbă 

exponen ial ţ ă) atunci între puncte există alte rela iiţ (ex. p tratice, exponen iale).ă ţ  Pentru evaluare ulterioar NU seă  poate folosi corela ia şi regresia linearţ ă

5

x

x

Page 6: 04 Evaluarea Unor Factori Prognostici - Corelatii Si Regresii

5/17/2018 04 Evaluarea Unor Factori Prognostici - Corelatii Si Regresii - slidepdf.com

http://slidepdf.com/reader/full/04-evaluarea-unor-factori-prognostici-corelatii-si-regres

evaluarea existen ei unei leg turiţ ă lineare între diferi i indicatori antropometrici:ţo Regresie linear simplă ă (o variabil independent , o variabilă ă ă independent )ăo Regresie linear multiplă ă  (mai multe variabile independente, ovariabil dependent )ă ă

• Se utilizează testul F (valoarea corespunz toare a lui p ob inută ţ ă cu testul F se g seşte în al doilea tabel dup efectuarea regresiei cu Regressionă ă  

din Data Analyisis: ANOVA)•  în formatul: p=valoare - numele testului folosit, cu maxim 3 zecimaleEx. p=0.01 - test Student pentru eşantioane perechiEx. daca p<0.001 atunci se scrie  p<0.001 – test student pentrueşantioane independente

• Interpretare statistică: dac pă <0.05 modelul de regresieeste bun, adic variabilele independente prezic bine variabilaă  dependent . Implicit exist o leg tur între variabilele independente şiă ă ă ă  cea dependentă

cuantificarea importan ei acestei leg turiţ ă :coeficient de corela ie (r), coeficien i de determinare (rţ ţ 2)

• ales întrucât: cuantific leg tura dintre dou variabileă ă ă  cantitative continue.•  în formatul: coeficient de corela ie, coeficient deţ  determinare Datele se scriu cu dou zecimale.ă• Interpretare statistic :ă  

o Coeficientul de corela ieţ arat m sura în care varia iileă ă ţ  unei variabile sunt corelate cu varia iile altei variabile. Exist coeficien i deţ ă ţ  corela ie pentru date de tip cantitativ continuu, normal distribuite:ţ  coeficientul de corela ie Pearson, sau pentru date nominale ordonate sauţ  date de tip cantitativ continuu care nu sunt normal distribuite: coeficientulde corela ie Spearman. Interpretarea e aceeaşi în cea mai mare parte.ţ

dac se apropie de 1 indic faptul c dac o variabil creşte atunci şiă ă ă ă ă  cealalt creste şi viceversa. Dac se apropie de -1 indic faptul c dac oă ă ă ă ă  variabil creşte atunci cealaltă ă scade şi viceversa. Un coeficient decorela ie în valoare absolut între:ţ ă

0-0,25 indic o corela ie slab sau nulă ţ ă ă 0,25-0,5 indic o corela ie acceptabilă ţ ă 0,5-0,75 indic o corela ie moderată ţ ă 0,75-1 indic o corela ie foarte bună ţ ă

o Ex. r=0,78 – corela ia linear între variabila x şi y este ţ ă  foarte bun , şi direct propor ional (dac x creşte, creşte şi y)ă ţ ă ă

Coeficientul de corela ie Pearson arat gradul asocierii lineareţ ă  dintre dou variabile cantitative continue normal distră ibuite.(Interpretabil doar pentru regresiile lineare simple. se utilizeaz multipleă  R din primul tabel dup efectuarea regresiei cu Regression din Dataă  Analyisis: Regression Statistics):

o Coeficientul de determinare (se utilizeaz Adjusted Ră  square din al doilea tabel dup efectuarea regresiei cu Regression din Dataă  Analyisis: ANOVA): arat procentual cât la sut din varia ia unei variabile eă ă ţ  

explicat de varia ia celeilalte variabileă ţo Ex. r 2=0,89 – 89% din varia ia lui y este explicat de ţ ă  varia ia lui x  ţ 

ecua ia dreptei de regresieţ

6

Page 7: 04 Evaluarea Unor Factori Prognostici - Corelatii Si Regresii

5/17/2018 04 Evaluarea Unor Factori Prognostici - Corelatii Si Regresii - slidepdf.com

http://slidepdf.com/reader/full/04-evaluarea-unor-factori-prognostici-corelatii-si-regres

• în formatul: variabil dependentă ă = variabil independentă ă _1 xcoeficientul ei + ... + variabil independent _n x coeficientul ei + coeficientă ă  liber (intercept). Toate cu unitatea de m sur între paranteze.ă ă

o Ex: vârsta gesta ional (s pt mâni) = lungime femur (cm) x  ţ ă ă ă  4,7015 + 3,2012

• Alegerea coeficien ilorţ şi variabilelor importante pentruregresia multipl :ă se aleg doar variabilele şi coeficien ii pentru care valoareaţ  lui p este <0.05.• Interpretare statistic :ă   pentru fiecare variabil independentă ă creşterea ei cu o unitate va determina creşterea valorii variabilei dependente cuvaloarea coeficientului variabilei independente (ex. pentru exemplul cu vârstagesta ional , pentru fiecare creştere de un centimetru a femurului f tului, ţ ă ă  vârsta gesta ional creşte cu 4,7015 s pt mâni) ţ ă ă ă• Interpretare clinic :ă  Trebuie evaluat cât de mare estecoeficientul fiec rei variabile importante pentru model, împreun cu intervalulă ă  de încredere asociat. Dac intervalul de încredere asociat este foarte larg atunciă  predic ia nu este foarte bun .ţ ă

o Putem considera pentru studiul de fa valori ale lungimiiţă  

intervalului sub 10% din valorile normale ale parametrilorde interes (lungime v.n. 50 cm, perimetru cranian 45 cm) cafiind intervale precise. Valori mai mari decât aceast limită ă le putem considera imprecise clinic, pentru aceavariabil /parametru.ă

eroarea standard a regresiei

• Interpretare statistic :ă  eroarea standard este m sura în care oă  observa ie individual difer de cea prezis de modelul de regresie. (ţ ă ă ă ex. pentruexemplul cu vârsta gesta ional ,de mai sus, eroarea standard a vârstei ţ ă  gesta ionale este: 5 zile. Asta înseamn c pentru un caz în parte c adev rata ţ ă ă ă ă  valoare se afl cu 68% probabilitate într-un interval cuprins între valoareaă   prezis ± 5 zile.ă• Interpretare clinic :ă valoarea erorii standard se apreciaz înă  context clinic. (Ex. Astfel pentru predic ia vârstei gesta ionale, având în vedere ţ ţ   interesul de a afla momentul naşterii, este rezonabil (suficient de precis ) oă ă  eroare standard de 5 zile.)

o Pentru problema predic iei greut ii, pentru studiul de fa ,ţ ăţ ţă  putem considera c dac eroarea standard este sub 5% dină ă  greutatea normal a unui nou n scut (3.300 g) esteă ă  suficient de precis predic ia (ES sub 166 g)ă ţ

Aten ie corela ia şi regresia sunt lucruri diferite.ţ ţ

• Corela ia evalueaz m sura leg turii lineare între dou variabile continueţ ă ă ă ă• Regresia linear este o metod de a prezice o variabil dependent înă ă ă ă  

func ie de una sau mai multe variabile independente.ţ  

Descrierea datelor8. Descrierea datelor (insera i pentru fiecare variabil în parte descriereaţ ă  datelor conform specifica iilor din protocol în c su a de mai jos).ţ ă ţ Indica ii existţ ă aici.

7

Page 8: 04 Evaluarea Unor Factori Prognostici - Corelatii Si Regresii

5/17/2018 04 Evaluarea Unor Factori Prognostici - Corelatii Si Regresii - slidepdf.com

http://slidepdf.com/reader/full/04-evaluarea-unor-factori-prognostici-corelatii-si-regres

• Talia eşantionului: 140

• Media şi devia ia standard a greut ii subiec ilor din lotul studiat:ţ ăţ ţ  Media = 2029,714286

Devia ia standard =ţ 474,461365

• Media şi intervalul de încredere 95% al greu ii:ţăţ  Media = 2029,714286

Limita inferioar a intervalului de încredere =ă 1950,430836

Limita superioar a intervalului de încredere =ă 2108,997735

• Tabel de frecven e pentru greutate:ţ

Intervalegreutate Frecventa

< 1300 11

1300 - 1700 25

1700 - 2100 49

2100 - 2500 43

2500 - 2900 72900 - 3300 4

> 3300 1

• Histograma greut ii:ăţ

Histograma greutăţii

0

10

20

30

40

50

60

< 1300 1300 -

1700

1700 -

2100

2100 -

2500

2500 -

2900

2900 -

3300

> 3300

Intervale greutate

       F

     r     e     c     v     e     n       ţ     a

• Media şi devia ia standard a lungimii subiec ilor din lotul studiat:ţ ţ  Media = 46,27857143

Devia ia standard =ţ 3,652274067

8

Page 9: 04 Evaluarea Unor Factori Prognostici - Corelatii Si Regresii

5/17/2018 04 Evaluarea Unor Factori Prognostici - Corelatii Si Regresii - slidepdf.com

http://slidepdf.com/reader/full/04-evaluarea-unor-factori-prognostici-corelatii-si-regres

• Media şi devia ia standard a perimetrului cranian al subiec ilor din lotulţ ţ  studiat: 

Media = 29,01428571

Devia ia standard =ţ 2,751025222

• Media şi devia ia standard a vârstei mamei subiec ilor din lotul studiat:ţ ţ  Media = 25,36428571

Devia ia standard =ţ 5,529789456

Rezultate

9. Rezultate (insera i rezultatele ob inute în formatul precizat în protocol înţ ţ  c su a de mai jos)ă ţPentru graficele nor de puncte, pe axa Y plasa i greutatea – variabila dependent , pe axa Xţ ă  variabila independentă

Scrie i ecua iile dreptelor de regresie şi semnifica iile modelelor (ţ ţ ţ p corespunzator lui Fsignificance), coeficien ii de corela ie şi de determinare, precum şi tabelele cu coeficien iiţ ţ ţ  variabilelor – al treilea tabel (ob inute prin tools /data analysis /regression – bifând confidenceţ  level 95%, selectând ca variabil dependent greutatea şi independente celelalte.).ă ă

• Insera i graficele nor de puncte, coeficientul de corela ie (r), coeficientul deţ ţ  determinare (r2), semnifica ia statistic a modelului de regresie linear (p),ţ ă ă  ecua ia regresiei, eroarea standard a regresiei.ţ

• greutatea la naştere şi lungime:o graficul nor de puncte:

Greutatea la naştere în funcţie de lungime

y = 99,373x - 2569,1

R2

= 0,5851

0

500

1000

1500

2000

2500

3000

3500

4000

30 35 40 45 50 55 60

Lungimea (cm)

   G  r  e  u   t  a   t  e  a

   (  g   )

9

Page 10: 04 Evaluarea Unor Factori Prognostici - Corelatii Si Regresii

5/17/2018 04 Evaluarea Unor Factori Prognostici - Corelatii Si Regresii - slidepdf.com

http://slidepdf.com/reader/full/04-evaluarea-unor-factori-prognostici-corelatii-si-regres

o r = 0,76

o r2 = 0,58

o p < 0.001o greutatea la nastere (g) = 99,373 x lungime (cm) - 2569,1o ES = 306,702759

o  Tabelul coeficien ilor regresiei:ţ

CoefficientsStandard 

Error t Stat P-value Lower 95% Upper 95% Lower 95,0% Upper 95,0%

Intercept -2569,129051 330,6477122 -7,769988892 1,61477E-12 -3222,919934 -1915,338169 -3222,919934 -1915,338169

LUNGIME 99,37306177 7,122737236 13,95152713 3,80512E-28 85,28924841 113,4568751 85,28924841 113,4568751

• greutatea la naştere şi perimetrul craniano graficul nor de puncte:

Greutatea la naştere în funcţie de perimetrul cranian

y = 110,73x - 1182,9

R2 = 0,4122

0

500

1000

1500

2000

2500

3000

3500

4000

15 20 25 30 35 40

Perimetrul cranian (cm)

   G  r  e  u   t  a   t  e  a   (  g   )

o r = 0,64

o r2 = 0,41o p < 0.001o greutatea la nastere (g) = 110,73 x perimetrul cranian (cm) – 1182,9o ES = 365,082507

o  Tabelul coeficien ilor regresiei:ţ

Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95,0% Upper 95,0%

Intercept -1182,921046 328,0428462 -3,605995558 0,000433508 -1831,561318 -534,2807742 -1831,561318 -534,2807742

PC 110,7259839 11,25612875 9,836950727 1,25093E-17 88,46920096 132,9827668 88,46920096 132,9827668

• greutatea la naştere şi perimetrul toracico graficul nor de puncte:

10

Page 11: 04 Evaluarea Unor Factori Prognostici - Corelatii Si Regresii

5/17/2018 04 Evaluarea Unor Factori Prognostici - Corelatii Si Regresii - slidepdf.com

http://slidepdf.com/reader/full/04-evaluarea-unor-factori-prognostici-corelatii-si-regres

Greutatea la naştere în funcţie de perimetrul toracic

y = 95,301x - 661,84

R2 = 0,3517

0

500

1000

1500

2000

2500

3000

3500

4000

15 20 25 30 35 40 45

Perimetrul toracic (cm)

   G  r  e  u   t  a   t  e  a   (  g

   )

o r = 0,59o r2 = 0,35o p < 0.001o greutatea la nastere (g) = 95,301 x perimetrul toracic (cm) – 661,84o ES = 383,4011854

o  Tabelul coeficien ilor regresiei:ţ

Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95,0% Upper 95,0%

Intercept -661,8444507 312,7522151 -2,116194287 0,036123741 -1280,250504 -43,43839738 -1280,250504 -43,43839738

PT 95,30051166 11,01407976 8,652607731 1,16057E-14 73,52233307 117,0786902 73,52233307 117,0786902

• greutatea la naştere şi lungime, perimetrul toracic, perimetrul cranian, vârsta mamei şivârsta tat lui?ă

o r2 = 0,59o p < 0.001o greutatea la nastere (g) = lungime (cm) x 82,359 – 2790,550 (numai lungimea

are p < 0,05)o ES = 304,330713o  Tabelul coeficien ilor regresiei:ţ

Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95,0% Upper 95,0%

Intercept -2790,550049 356,0788945 -7,836886972 1,26992E-12 -3494,812049 -2086,28805 -3494,812049 -2086,28805

LUNGIME 82,35859941 10,36777209 7,943712372 7,07946E-13 61,85295301 102,8642458 61,85295301 102,8642458

PT 3,229527566 18,97453304 0,17020327 0,865106987 -34,29879209 40,75784722 -34,29879209 40,75784722

PC 28,38894317 21,99494254 1,290703221 0,199029108 -15,11322011 71,89110645 -15,11322011 71,89110645

VMAMA 4,377845026 6,446531733 0,679100826 0,498245272 -8,372271301 17,12796135 -8,372271301 17,12796135

VTATA -0,583278673 5,847786886 -0,09974349 0,920697041 -12,14918204 10,98262469 -12,14918204 10,98262469

10. Interpreta i rezultatele (completa i în spa iile de mai jos)ţ ţ ţ

11

Page 12: 04 Evaluarea Unor Factori Prognostici - Corelatii Si Regresii

5/17/2018 04 Evaluarea Unor Factori Prognostici - Corelatii Si Regresii - slidepdf.com

http://slidepdf.com/reader/full/04-evaluarea-unor-factori-prognostici-corelatii-si-regres

Statistic:

• Interpreta i media şi devia ia standard a greut ii:ţ ţ ăţ  o 68% dintre datele eşantionului studiat se afl în intervalulă medie ±

devia ia standard ţ  , în cazul nostru, între: 1555,252921 şi2504,175651

o 95% dintre datele eşantionului studiat se afl în intervalulă medie ±2 x devia ia standard ţ  , în cazul nostru, între: 1080,791556 şi2978,637016

o 99% dintre datele eşantionului studiat se afl în intervalulă medie ±

3 x devia ia standard ţ  , în cazul nostru, între: 606,3301908 şi3453,098381

• Interpreta i media şi intervalul de încredere pentru greutate:ţo  În intervalul 1950,430836 – 2108,997735 sutem 95% siguri ca se

afl media greuta ii popula ieiă ţ ţ• Interpreta i histograma greut ii:ţ ăţ

o Histograma greut ii urmeaz grosier o form de clopot, prinăţ ă ă  urmare, putem spune c distribu ia este normal .ă ţ ă

• Interpreta i graficul nor de puncte:ţo  Toate cele 3 grafice (greutatea la naştere, pe de o parte, şi

lungimea, perimetrul cranian şi respectiv perimetrul toracic, pe dealt parte) arat o tendin cresc toare, adic o propor ionalitateă ă ţă ă ă ţ  direct între parametri.ă

• semnifica ia statistic a fiec rui model de regresieţ ă ă :o  Toate modelele de regresie au fost înalt semnificative statistic,

 întrucât pentru fiecare dintre ele valoarea lui p (Significance F dinANOVA) a fost sub 0,001 (p < 0,001)

• interpretarea erorii standard (ES) a regresieio greutatea la naştere în func ie de lungimeţ

greutatea la naştere este, cu 68% probabilitate, intervalul

dintre greutatea prezisă (99,373 x lungime (cm) – 2569,1) ±306,702759 (ES)o greutatea la naştere în func ie de perimetrul cranianţ

greutatea la naştere este, cu 68% probabilitate, intervaluldintre greutatea prezisă (110,73 x perimetrul cranian (cm) –1182,9) ± 365,082507 (ES)

o greutatea la naştere în func ie de perimetrul toracicţ

greutatea la naştere este, cu 68% probabilitate, intervaluldintre greutatea prezisă (95,301 x perimetrul toracic (cm) –661,84) ± 383,4011854 (ES)

o

greutatea la naştere în func ie de lungime, perimetrul toracic,ţ

 perimetrul cranian, vârsta mamei şi vârsta tat luiă greutatea la naştere este, cu 68% probabilitate, intervalul

dintre greutatea prezisă (82,359 x lungime (cm) – 2790,550)± 304,330712 (ES)

• interpretarea coeficientului de corela ie – pentru regresiile simple:ţo greutatea la naştere în func ie de lungimeţ

r = 0,76 – corela ie liniar foarte bun ; rţ ă ă > 0 – variabilele suntdirect propor ionale.ţ

o greutatea la naştere în func ie de perimetrul cranianţ

r = 0,64 – corela ie liniar bun ; rţ ă ă > 0 – variabilele sunt directpropor ionale.ţ

o greutatea la naştere în func ie de perimetrul toracicţ

r = 0,59 – corela ie liniar bun . rţ ă ă > 0 – variabilele sunt direct

12

Page 13: 04 Evaluarea Unor Factori Prognostici - Corelatii Si Regresii

5/17/2018 04 Evaluarea Unor Factori Prognostici - Corelatii Si Regresii - slidepdf.com

http://slidepdf.com/reader/full/04-evaluarea-unor-factori-prognostici-corelatii-si-regres

propor ionale.ţ• interpretarea coeficientului de determinare – pentru toate regresiile

o greutatea la naştere în func ie de lungimeţ

r2 = 0,58 – 58% din varia ia greut ii este explicat de varia iaţ ăţ ă ţ  lungimii

o greutatea la naştere în func ie de perimetrul cranianţ

r2 = 0,41 – 41% din varia ia greut ii este explicat de varia iaţ ăţ ă ţ  perimetrului cranian

o greutatea la naştere în func ie de perimetrul toracicţ r2 = 0,35 – 35% din varia ia greut ii este explicat de varia iaţ ăţ ă ţ  

perimetrului toracico greutatea la naştere în func ie de lungime, perimetrul toracic,ţ  

perimetrul cranian, vârsta mamei şi vârsta tat luiă r2 = 0,59 – 59% din varia ia greut ii este explicat de varia iaţ ăţ ă ţ  

lungimii (singurul parametru dintre cei urm ri i pentru careă ţ  valoarea lui p este sub 0,05

• interpretarea erorii standard a variabilei dependenteo greutatea la naştere este, cu 68% probabilitate, intervalul dintre

greutatea prezis (82,359 x lungime (cm) – 2790,550) ±ă  304,330712

• interpretarea coeficien ilor variabilelor independenteţ

• greutatea la naştere şi lungime:o graficul nor de puncte: arat o tendin cresc toare, adic oă ţă ă ă  

propor ionalitate direct între parametriţ ăo modelul: liniaro ES = greutatea la naştere este, cu 68% probabilitate, intervalul

dintre greutatea prezis (99,373 x lungime (cm) – 2569,1) ±ă  306,702759 (ES)

o r = 0,76 – corela ie liniar foarte bun ; rţ ă ă > 0 – variabilele sunt directpropor ionale.ţo r2 = 0,58 – 58% din varia ia greut ii este explicat de varia iaţ ăţ ă ţ  

lungimiio Coeficientul: creşterea lungimii cu un centimetru determină 

creşterea greut ii cu 99,373 grameăţ• greutatea la naştere şi perimetrul cranian

o graficul nor de puncte: arat o tendin cresc toare, adic oă ţă ă ă  propor ionalitate direct între parametriţ ă

o modelul: liniaro

ES = greutatea la naştere este, cu 68% probabilitate, intervaluldintre greutatea prezis (110,73 x perimetrul cranian (cm) – 1182,9)ă  ± 365,082507 (ES)

o r = 0,64 – corela ie liniar bun ; rţ ă ă > 0 – variabilele sunt directpropor ionale.ţ

o r2 = 0,41 – 41% din varia ia greut ii este explicat de varia iaţ ăţ ă ţ  perimetrului cranian

o Coeficientul: creşterea perimetrului cranian cu un centimetrudetermin creşterea greut ii cu 110,73 grameă ăţ

• greutatea la naştere şi perimetrul toracico graficul nor de puncte: arat o tendin cresc toare, adic oă ţă ă ă  

propor ionalitate direct între parametriţ ăo modelul: liniaro ES = greutatea la naştere este, cu 68% probabilitate, intervalul

13

Page 14: 04 Evaluarea Unor Factori Prognostici - Corelatii Si Regresii

5/17/2018 04 Evaluarea Unor Factori Prognostici - Corelatii Si Regresii - slidepdf.com

http://slidepdf.com/reader/full/04-evaluarea-unor-factori-prognostici-corelatii-si-regres

dintre greutatea prezis (95,301 x perimetrul toracic (cm) – 661,84)ă  ± 383,4011854 (ES)

o r = 0,59 – corela ie liniar bun . rţ ă ă > 0 – variabilele sunt directpropor ionale.ţ

o r2 = 0,35 – 35% din varia ia greut ii este explicat de varia iaţ ăţ ă ţ  perimetrului toracic

o Coeficientul: creşterea perimetrului toracic cu un centimetrudetermin creşterea greut ii cu 95,301 grameă ăţ

• greutatea la naştere şi lungime, perimetrul toracic, perimetrul cranian,vârsta mamei şi vârsta tat lui?ă

o modelul: liniaro ES = greutatea la naştere este, cu 68% probabilitate, intervalul

dintre greutatea prezis (82,359 x lungime (cm) – 2790,550) ±ă  304,330712 (ES)

o r2 = 0,59 – 59% din varia ia greut ii este explicat de varia iaţ ăţ ă ţ  lungimii (singurul parametru dintre cei urm ri i pentru care valoareaă ţ  lui p este sub 0,05)

o care sunt variabilele importante pentru model? Rescrie i modelulţ  

doar cu acestea. Numai lungimea are p < 0,05

o Coeficien ii:ţ creşterea lungimii cu un centimetru determină creşterea greut ii cu 82,359 grameăţ

Clinic: (interpreta i clinic eroarea standard a regresiei şi coeficien ii variabilelorţ ţ  independente):

• greutatea la naştere şi lungime:o ES = 306,70o Coeficientul: predic ia greut ii cu o eroare standard de 306,70ţ ăţ  

grame nu este rezonabila, având în vedere necesitatea cunoaşterii

destul de precise a greut ii, mai ales la copii cu o lungime mic (şiăţ ă  implicit o greutate mic la naştere) şi dificult ile de m surareă ăţ ă  exact a lungimii nou-n scutului.ă ă

• greutatea la naştere şi perimetrul craniano ES = 365,08o Coeficientul: predic ia greut ii cu o eroare standard de 365,08ţ ăţ  

grame nu este rezonabila, având în vedere necesitatea cunoaşteriidestul de precise a greut ii, mai ales la copii cu o lungime mic (şiăţ ă  implicit o greutate mic la naştere)ă

• greutatea la naştere şi perimetrul toracico

ES = 383,40o Coeficientul: predic ia greut ii cu o eroare standard de 383,40ţ ăţ  grame nu este rezonabila, având în vedere necesitatea cunoaşteriidestul de precise a greut ii, mai ales la copii cu o lungime mic (şiăţ ă  implicit o greutate mic la naştere) şi dificult ile de m surareă ăţ ă  exact a perimetrului toracic al nou-n scutului.ă ă

• greutatea la naştere şi lungime, perimetrul toracic, perimetrul cranian,vârsta mamei şi vârsta tat lui?ă

o ES = 304, 33o Coeficien ii: predic ia greut ii cu o eroare de 306,70 grame nu esteţ ţ ăţ  

rezonabila, având în vedere necesitatea cunoaşterii destul deprecise a greut ii, mai ales la copii cu o lungime mic (şi implicit oăţ ă  greutate mic la naştere) şi dificult ile de m surare exact aă ăţ ă ă  lungimii nou-n scutului (singurul parametru dintre cei urm ri iă ă ţ  

14

Page 15: 04 Evaluarea Unor Factori Prognostici - Corelatii Si Regresii

5/17/2018 04 Evaluarea Unor Factori Prognostici - Corelatii Si Regresii - slidepdf.com

http://slidepdf.com/reader/full/04-evaluarea-unor-factori-prognostici-corelatii-si-regres

pentru care valoarea lui p este sub 0,05).

Concluziile laboratorului: lucrarea de astăzi vă ajută

•  în realizarea unor studii care realizează regresii şi sau corelaţii pentru teza de doctorat sau pentrualte lucrări ştiinţifice

• la înţelegerea şi interpretarea studiilor utilizeată regresii şi/sau corelaţii pe care le veţi citi în calitatede clinicieni

Trimiteţi prin e-mail, pe adresa  [email protected], documentul Word completat (după ce îl salvaţi şi

închideţi în prealabil), ca fişier ataşat (attachment).

În e-mail specificaţi la Subject: Nume, prenume şi titlul lucrării.

15