Intervalul de Incredere. Inferenta Statistica

17
1 1 Sorana D. BOLBOACA – INFORMATICĂ MEDICALĂ ŞI BIOSTATISTICĂ Curs 10 TRUNCHI RUNCHI COMUN OMUN, , anul anul I (2008 I (2008-2009) 2009) Intervalul Intervalul de de încredere încredere Inferenţa statistică Inferenţa statistică Testarea distribuţiei unui set de date Testarea distribuţiei unui set de date Analiza corelaţiei Analiza corelaţiei 2 Sorana D. BOLBOACA – INFORMATICĂ MEDICALĂ ŞI BIOSTATISTICĂ Curs 10 TRUNCHI RUNCHI COMUN OMUN, , anul anul I (2008 I (2008-2009) 2009) Intervalul Intervalul de de încredere încredere 3 Sorana D. BOLBOACA – INFORMATICĂ MEDICALĂ ŞI BIOSTATISTICĂ Curs 10 TRUNCHI RUNCHI COMUN OMUN, , anul anul I (2008 I (2008-2009) 2009) Cuprins Cuprins Definiţie. Scop Interpretare Intervalul de încredere pentru medie Intervalul de încredere pentru frecvenţă 4 Sorana D. BOLBOACA – INFORMATICĂ MEDICALĂ ŞI BIOSTATISTICĂ Curs 10 TRUNCHI RUNCHI COMUN OMUN, , anul anul I (2008 I (2008-2009) 2009) De ce intervalul de încredere? De ce intervalul de încredere? Estimarea punctuală = o valoare pentru parametrul teoretic estimat Influenţată de fluctuaţiilor de eşantionare poate fi la o mare distanţă de valoarea reală a parametrului estimat Este recomandabil să se estimeze un parametru teoretic nu printr-o singură valoare ci printr-un interval, numit interval de încredere (în care să se poată afirma că parametrul estimat se găseşte cu o probabilitate ridicată). 5 Sorana D. BOLBOACA – INFORMATICĂ MEDICALĂ ŞI BIOSTATISTICĂ Curs 10 TRUNCHI RUNCHI COMUN OMUN, , anul anul I (2008 I (2008-2009) 2009) Definiţie Definiţie Un şi de valori al unui estimator de interes calculat astfel încât pentru o probabilitate de eroare aleasă să includă valorile adevărate ale variabilei. P[valoarea critică inferioară < estimatorul < valoarea critică superioară] = 1-α unde α = nivelul de semnificaţie Intervalul definit de valorile critice va cuprinde estimatorul populaţiei cu o probabilitate de 1-α Se aplică în cazul variabilelor distribuite normal! 6 Sorana D. BOLBOACA – INFORMATICĂ MEDICALĂ ŞI BIOSTATISTICĂ Curs 10 TRUNCHI RUNCHI COMUN OMUN, , anul anul I (2008 I (2008-2009) 2009) Interpretare Interpretare Dacă intervalul de încredere pentru diferenţa dintre o medie observată şi una teoretică cuprinde valoarea 0, datele sunt compatibile cu o diferenţă a mediei populaţiei egală cu 0. Dacă intervalul de încredere pentru diferenţa dintre o medie observată şi una teoretică nu cuprinde valoarea 0, datele nu sunt compatibile cu egalitatea mediilor populaţiei.

description

Statistica

Transcript of Intervalul de Incredere. Inferenta Statistica

  • 11

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    IntervalulIntervalul de de ncrederencredereInferena statisticInferena statisticTestarea distribuiei unui set de dateTestarea distribuiei unui set de dateAnaliza corelaieiAnaliza corelaiei

    2

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    IntervalulIntervalul de de ncrederencredere

    3

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    CuprinsCuprins Definiie. Scop Interpretare Intervalul de ncredere pentru medie Intervalul de ncredere pentru frecven

    4

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    De ce intervalul de ncredere?De ce intervalul de ncredere? Estimarea punctual = o valoare pentru parametrul teoretic estimat Influenat de fluctuaiilor de eantionare poate fi la o mare distan de valoarea real a

    parametrului estimat Este recomandabil s se estimeze un parametru

    teoretic nu printr-o singur valoare ci printr-un interval, numit interval de ncredere (n care s se poat afirma c parametrul estimat se gsete cu o probabilitate ridicat).

    5

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    DefiniieDefiniie Un i de valori al unui estimator de interes calculat

    astfel nct pentru o probabilitate de eroare aleas s includ valorile adevrate ale variabilei. P[valoarea critic inferioar < estimatorul <

    valoarea critic superioar] = 1- unde = nivelul de semnificaie

    Intervalul definit de valorile critice va cuprinde estimatorul populaiei cu o probabilitate de 1- Se aplic n cazul variabilelor distribuite normal!

    6

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    InterpretareInterpretare Dac intervalul de ncredere pentru diferena

    dintre o medie observat i una teoretic cuprinde valoarea 0, datele sunt compatibile cu o diferen a mediei populaiei egal cu 0. Dac intervalul de ncredere pentru diferena

    dintre o medie observat i una teoretic nu cuprinde valoarea 0, datele nu sunt compatibile cu egalitatea mediilor populaiei.

  • 27

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    Intervalul de ncredereIntervalul de ncredere Se calculeaz n funcie de: Talia eantionului sau a populaiei Variabila de studiat (calitativ, cantitativ)

    Formula de calcul cuprinde 2 pri: Un estimator al calitii eantionului pe baza cruia

    estimatorul populaiei s-a calculat (eroarea standard) Gradul de ncredere (confiden) al intervalului

    specificat (scorul Z) Cel mai frecvent utilizat este intervalul de ncredere

    pentru medie

    8

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    Intervalul de ncredere pentru medieIntervalul de ncredere pentru medie Eroarea standard a mediei este egal cu deviaia

    standard mprit la radicalul volumului eantionului Dac deviaia standard este mare, ansa de eroare n

    estimator este mare Dac volumul eantionului este mare, ansa erorii n

    estimator este mic.

    + nsZX,

    nsZX

    9

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    Intervalul de ncredere pentru medieIntervalul de ncredere pentru medie Scorul Z este scorul distribuiei normale de medie 0 i deviaie

    standard de 1. Orice distribuie poate fi transformat n scorulZ utiliznd formula:

    Scorul pozitiv este mai mare dect media Scorul negativ este mai mic dect media Pentru intervalul de confiden de 95%: Z5% = 1,96 Pentru intervalul de confiden de 99%: Z1% = 2,58

    + nsZX,

    nsZX

    ( ) s/XXZ =

    10

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    Intervalul de ncredere pentru medieIntervalul de ncredere pentru medie Media glicemiei la un

    eantion de 121 pacieni este de 105 iar variaia de 36. Care este intervalul de ncredere al mediei glicemiei n populaia din care s-a extras eantionul cu un prag de semnificaie =0,05, considernd c glicemia este normal distribuit i pentru acest prag Z = 1,96.

    n = 121 s2 = 36 s = 6

    [105-1.07, 105+1.07] [103.93 106.07] [104-106]

    105X =

    +121696,1105;

    121696,1105

    11

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    Compararea mediilor cu ajutorul Compararea mediilor cu ajutorul intervalului de ncredereintervalului de ncredere

    200

    100

    TAS(mmHg)

    Tratament A

    Tratament B

    Tratament C

    12

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    Intervalul de ncredere pentru frecveneIntervalul de ncredere pentru frecvene

    Dac np > 10( ) ( )

    + n

    f1fZf;n

    f1fZf

  • 313

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    Intervalul de ncredere pentru frecveneIntervalul de ncredere pentru frecvene Suntem interesai n

    estimarea frecvenei cancerului de sn la femeile ntre 50 i 54 de ani care au antecedente familiale pozitive. ntr-un studiu randomizat la care au participat 10000 de femei, s-a constatat c 400 dintre acestea au fost diagnosticate cu cancer de sn.

    Care este intervalul de ncredere de 95% asociat frecvenei observate?

    f = 400/10000 = 0.04

    [0,04-0,004; 0,04+0,004] [0,036; 0,044]

    +10000

    96,004,096,104,0;10000

    96,004,096,104,0

    ( ) ( )

    + nf1fZf;

    nf1fZf

    14

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    De reinut!De reinut! Estimarea corect a unui parametru statistic se

    face cu ajutorul intervalului de ncredere. Intervalul de ncredere depinde de volumul

    eantionului i de eroarea standard. Cu ct eroarea standard este mai mare cu att

    intervalul de ncredere este mai larg. Cu ct volumul eantionului este mai mic cu

    att intervalul de ncredere este mai larg.

    15

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)16

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    Inferena statisticInferena statistic

    17

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    CuprinsCuprins Definiie, aplicabilitate Ipoteza statistic versus ipoteza clinic Testarea unei ipoteze statistice: Etapele unui test statistic

    18

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    Definiie, aplicabilitateDefiniie, aplicabilitate Un test statistic este conceput i utilizat pentru

    verificarea unei ipoteze statistice. De regul, ipoteza care trebuie testat (H0, ipoteza

    nul) se poate formula ca fiind una n care nu exist nici o schimbare: Nu exist nici o diferen ntre mediile a dou

    populaii (media taliei la o populaie de nou-nscui la termen i respectiv nscui prematur) Nu exist diferen semnificativ ntre mediile a dou

    eantioane extrase din aceste populaii.

  • 419

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    TermeniTermeni Ipoteza nul (H0): ipoteza care urmeaz a fi

    testat Ipoteza alternativ (H1): opusul ipotezei nule Prag de semnificaie: Probabilitatea de eroare acceptat de cercettor De obicei este de 5% (0,05)

    20

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    Testul statisticTestul statistic Metod de comparaie a dou sau mai multe

    populaii, prin intermediul unor variabile observate ale lor.

    21

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    Ipoteza statisticIpoteza statistic vsvs ipoteza clinic ipoteza clinic Scopul unui test statistic este de a defini realitatea. Definirea ntrebrii de cercetare (ipoteza clinic): Tratamentul cu Nebivolol este la fel de eficient ca i

    cel cu Valsartan n tratamentul hipertensiunii arteriale?

    Transpunerea ntrebrii de cercetare n termeni statistici (ipoteza statistic): Media tensiunii arteriale a pacienilor tratai cu

    Valsartan nu difer semnificativ de media tensiunii arteriale a pacienilor tratai cu Nebivolol

    22

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    Etapele unui test statisticEtapele unui test statistic1. Formularea problemei n termenii ipotezelor

    statistice.2. Alegerea i calcularea parametrului statistic

    al testului. 3. Regiunea critic. 4. Concluzia testului.

    23

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    1. Formularea problemei n termenii 1. Formularea problemei n termenii ipotezelor statisticeipotezelor statistice Ipoteza nul: ipoteza care trebuie testat,

    testul efectundu-se sub prezumia c ipoteza nul ar fi adevrat Ipoteza alternativ: acea ipotez care ntr-un

    sens sau altul contrazice ipoteza nul. Aceast ipotez se mai numete i ipoteza de lucru

    24

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    1. Formularea problemei n termenii 1. Formularea problemei n termenii ipotezelor statisticeipotezelor statistice Ipoteza nul: tipuri O coad (one-tailed sau one-side): Media este mai mare Media este mai mic

    Dou cozi (one-tailed sau one-side): Media este egal

  • 525

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    2. Alegerea i calcularea parametrului 2. Alegerea i calcularea parametrului statistic al testuluistatistic al testului Parametrul statistic al testului exprim ntr-o

    anumit form, diferena dintre elementele comparate. innd seama de faptul c eantionul sau

    eantioanele utilizate sunt aleator extrase din populaiile care fac obiectul testului, parametrul statistic este o variabil aleatoare de selecie, care urmeaz o anumit lege de probabilitate.

    26

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    2. Alegerea i calcularea parametrului 2. Alegerea i calcularea parametrului statistic al testuluistatistic al testului Un parametru statistic al testului bun trebuie s

    ndeplineasc dou condiii: Trebuie s se comporte diferit atunci cnd

    ipoteza nul H0 este adevrat fa de situaia n care ipoteza alternativ H1 este adevrat. Distribuia de probabilitate a parametrului

    statistic al testului sub prezumia c H0 este adevrat, este cunoscut.

    27

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    3. 3. Regiunea criticRegiunea critic Trebuie s fim capabili s decidem n funcie de

    valoarea parametrului statistic calculat care dintre ipoteze, cea nul sau cea alternativ, este adevrat. Dac valoarea parametrului statistic aparine

    regiunii critice, ipoteza nul H0 va fi respins i va fi acceptat ipoteza alternativ H1. Dac valoarea parametrului statistic nu aparine

    regiunii critice, ipoteza nul H0 va fi acceptat.

    28

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    3. 3. Regiunea criticRegiunea critic Decidem mrimea regiunii critice. Pentru aceasta trebuie s specificm mrimea

    riscului de eroare pe care l acceptm. Pe scurt, definim nivelul de semnificaie, notat

    cu , sau mrimea riscului pe care suntem dispui s ni-l asumm n respingerea ipotezei nule H0 n cazul n care aceasta este adevrat. De obicei se alege un nivel de semnificaie ntre 1% i 5%.

    29

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    3. 3. Regiunea criticRegiunea critic Decidem mrimea regiunii critice. Probabilitatea unei erori de tipul I: probabilitatea de respingere a ipotezei nule H0

    n favoarea ipotezei alternative H1, n condiiile n care H0 este adevrat. probabilitatea unei erori de tipul I se noteaz cu i se mai numete nivel de semnificaie al testului.

    30

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    3. 3. Regiunea criticRegiunea critic Decidem mrimea regiunii critice. Probabilitatea unei erori de tipul II: probabilitatea acceptrii ipotezei nule n

    condiiile n care ipoteza alternativ H1 este adevrat. aceast probabilitate se noteaz cu .

  • 631

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    3. 3. Regiunea criticRegiunea critic unilateral la dreapta valoarea parametrului

    statistic al testului este mai mare sau egal cu valoarea din dreapta a intervalului critic;

    unilateral la stnga valoarea parametrului statistic al testului este mai mic sau egal cu valoarea din stnga a intervalului critic;

    bilateral valoarea parametrului statistic al testului este mai mic sau egal cu valoarea extrem din stnga regiunii critice sau mai mare sau egal cu valoarea extrem din dreapta regiunii critice, valorile extreme ale regiunii critice avnd nivele egale de semnificaie.

    32

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    4. Concluzia testului4. Concluzia testului Ipoteza nul H0 este respins dac valoarea

    parametrului statistic aparine regiunii critice. Regiunea critic trebuie astfel aleas nct

    dac ipoteza alternativ H1 este adevrat, probabilitatea de respingere a ipotezei nule H0este mai mare dect n cazul n care ipoteza nul H0 ar fi adevrat.

    33

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    4. Concluzia testului4. Concluzia testului Acceptarea ipotezei nule H0 atunci cnd

    ipoteza alternativ H1 este adevrat, este cunoscut ca i eroarea de tipul II. probabilitatea ei se noteaz cu msoar nivelul de eroare

    34

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    4. Concluzia testului4. Concluzia testului n testarea oricrei ipoteze statistice, exist patru

    situaii care determin dac decizia noastr este corect sau nu

    decizie corecteroare de tipul IH0 se respingeeroare de tipul IIdecizie corectH0 se acceptConcluzieH0 este falsH0 este adevrat

    Cazuri

    35

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    Luarea deciziei pe baza valorii Luarea deciziei pe baza valorii probabilitprobabilitii p de semnificaie a testuluiii p de semnificaie a testului n momentul n care prelucrm statistic o serie de date

    dorim s tim dac rezultatele obinute sunt sau nu semnificative statistic. Rspunsul la aceast ntrebare este dat de valoarea lui

    p calculat de orice program statistic la prelucrarea unor date. n cazul testelor statistice, ipoteza nul este respins

    dac nivelul de semnificaie este mai mic dect 0,05 iar programele de prelucrare statistic a datelor vor afia o stelu (*) n tabelul rezultatelor.

    36

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    Luarea deciziei pe baza valorii Luarea deciziei pe baza valorii probabilitprobabilitii p de semnificaie a testuluiii p de semnificaie a testului

  • 737

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    Luarea deciziei pe baza valorii Luarea deciziei pe baza valorii probabilitprobabilitii p de semnificaie a testuluiii p de semnificaie a testului

    Dac p 0,05: respingem ipoteza nul i acceptm ipoteza alternativ (am obinut semnificaia statistic) Dac p > 0,05: acceptm ipoteza nul (nu am

    obinut semnificaia statistic)

    38

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    Luarea deciziei pe baza valorii Luarea deciziei pe baza valorii probabilitprobabilitii p de semnificaie a testuluiii p de semnificaie a testului

    p = 0,02Respingem ipoteza nulRisc de eroare de tip I

    = 0,05

    p = 0,13NU respingem ipoteza nulRisc de eroare de tip II

    39

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    Semnificaia lui pSemnificaia lui p Criteriu de luare a deciziei cu privire la o

    ipotez statistic nul Cuantific ansa ca o decizie de respingere a

    ipotezei nule s fie greit Msur a semnificaiei statistice i NU

    CLINIC

    40

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    Semnificaia lui p: reguli empiriceSemnificaia lui p: reguli empirice 0,01 p < 0,05: rezultatul e semnificativ statistic 0,001 p < 0,01: rezultatul e nalt semnificativ statistic p < 0,001: rezultatul e foarte nalt semnificativ statistic p 0,05: rezultatul e considerat nesemnificativ statistic

    41

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    Limite ale valorii pLimite ale valorii p Valoarea p NU ne d informaii despre: ansa de beneficiu a unui pacient individual Procentul de pacieni care vor avea un

    beneficiu n urma instituirii procedurii medicale Gradul de beneficiu expectat pentru un anumit

    pacient

    42

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    Puterea unui test statisticPuterea unui test statistic Este capacitatea de a detecta o diferen acolo unde

    exist Creterea volumului eantionului determin creterea

    puterii testului statistic aplicat Valoarea este n relaie direct cu eroarea de tip II: Puterea = 1

    Cea mai utilizat modalitate de cretere a puterii unui test statistic este de a crete volumul eantionului

  • 843

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    Tipul scalei de mTipul scalei de msursur testul statistictestul statistic

    Mai mult de 2 grupuri, date perechi

    11Msurtori repetate (ANOVA)

    Eantioane perechi11Student perechi2 sau mai multe grupuri11ANOVADoar 2 grupuri11Student

    202Exist o relaie liniar?02Corelaie PearsonObservaiiNominalIntervalDenumire test

    44

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    De reinut!De reinut! Paii testului statistic sunt identici att pentru testele

    parametrice ct i pentru cele non-parametrice. Orice test statistic se poate interpreta din perspectiva

    valorii critice sau a intervalului critic i respectiv din perspectiva valorii p. Orice test statistic are asociat 2 tipuri de erori. Fiecare

    tip de eroare are o anumit semnificaie. Puterea unui test statistic este n relaie cu eroarea de

    tip II i depinde de volumul eantionului.

    45

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)46

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    Testarea distribuiei unui set de dateTestarea distribuiei unui set de date

    47

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    CuprinsCuprins Obiective Testarea normalitii unei distribuii Testarea egalitii a dou distribuii

    48

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    ObiectiveObiective Datele urmeaz o distribuie normal? Se poate aplica i pe alte tipuri de distribuii

    (Binomial, Poisson, etc.) Dou distribuii au aceeai form? Nu rspunde la ntrebarea: Care este form de

    distribuie a datelor? Ne spune dac formele de distribuie a dou

    seturi de date sunt sau nu diferite.

  • 949

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    Testarea normalitTestarea normalitii unei distribuiiii unei distribuii De ce normalitate? Este o condiie preliminar de aplicare a unor

    teste statistice (test parametric vs test non-parametric) Teste parametrice: aplicate pe date care

    urmeaz o distribuie normal: Testul t Testul z Analiza varianei

    50

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    Teste de normalitateTeste de normalitate Chi-Square goodness-of-fit: 1900 conservativ

    Kolmogorov-Smirnov (abreviere KS): 1933 conservativ

    Shapiro-Wilk: 1965

    51

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    Teste de normalitateTeste de normalitate

    Chi-Square Goodness-of-FitShapiro-WilkEantion mare (> 50)Kolmogorov-SmirnovShapiro-WilkEantion mic (5-50)

    Test conservativTest mai puin conservativ

    52

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    KolmogorovKolmogorov--SmirnovSmirnov: un eantion: un eantion Forma distribuiei datelor e normal (nu facem

    asumpii asupra mediei sau deviaiei standard)? H0: forma distribuiei este normal

    Eantionul a fost extras dintr-o populaie normal distribuit (facem asumpii asupra medie i a deviaie standard)? H0: forma distribuiei populaiei din care a fost extras

    eantionul nu este diferit de o distribuie normal specificat (de o anumit medie i deviaie standard)

    53

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    KolmogorovKolmogorov--SmirnovSmirnov: un eantion: un eantion Valorile critice pentru diferite valori ale

    nivelului de semnificaie: = 0,01: (1,63/n)-(1/3,5n) = 0,05: (1,36/n)-(1/4,5n) = 0,10: (1,22/n)-(1/5,5n)

    1. Aranjm valorile eantionului n ordine cresctoare

    2. x este valoarea eantionului la care datele se modific

    54

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    KolmogorovKolmogorov--SmirnovSmirnov: un eantion: un eantion3. Fie k numrul de membrii cu valori mai mici de x4. Fie Fn(x) = k/n (calculat pentru fiecare valoare a lui x)5. Valoarea expectat pentru fiecare x este dat de formula:

    z=(x-m)/s6. Pentru fiecare z calculm valoarea expectat Fe(n) dat de

    aria de sub curba normal de la dreapta lui z (e nevoie de program sau de tabel standard).

    7. Calculm diferena absolut | Fn(x) - Fe(n) |8. Testul statistic L este dat de cea mai mare valoarea a

    diferenei9. Dac L este mai mare dect valoarea critic se respinge

    ipoteza nul (H0).

  • 10

    55

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    KolmogorovKolmogorov--SmirnovSmirnov: un eantion: un eantion Variabila de interes: vrsta a zece pacieni internai

    cu infarct miocardic Valoarea critic: = 0,05: (1,36/10)-(1/4,510) = 0,408

    56

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    KolmogorovKolmogorov--SmirnovSmirnov: un eantion: un eantion

    57

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    ChiChi--SquareSquare goodnessgoodness--ofof--fitfit H0: populaia din care a fost extras eantionul este

    normal distribuit Dac valoarea calculat a testului e mai mare dect

    valoarea critic: respingem ipoteza nul (Ho)

    21,6719,0216,9214,68df = 920,0917,5315,5113,36df = 816,8114,4512,5910,64df = 60,010,0250,050,10 (1 coad)

    ( ) ==i

    2i

    i

    2ii2

    en

    een

    58

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    ChiChi--SquareSquare goodnessgoodness--ofof--fitfit 2 = 7,895 < 16,92: acceptm ipoteza nul

    59

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    De reinut!De reinut! Normalitatea datelor trebuie testat pentru a

    aplica corect un test statistic. Testele de normalitate se fac cu ajutorul

    programelor (SPSS, Statistica, etc.) Trebuie s tim s interpretm un test de

    normalitate att din perspectiva regiunii critice ct i din cea a valorii p.

    60

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

  • 11

    61

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    Analiza corelaiilor Analiza corelaiilor

    62

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    CuprinsCuprins Corelaia Semnificaia corelaiei Tipuri de coeficieni de corelaie Regresia liniar simpl Regresia liniar multipl

    63

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    Corelaie Corelaie vsvs regresieregresie

    Se folosesc pentru:

    Evaluarea puterii de asociere dintre dou variabile cantitative continue corelaie Prezicerea unei variabile (Y) n funcie de o

    alt variabil (X) regresie

    64

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    Coeficient de corelaieCoeficient de corelaie Puterea asocierii dintre dou variabile prin msurarea

    gradului n care punctele unui grafic de tip scatter(nor de puncte) se ntind de-a lungul unei linii.

    S se stabileasc dac exist o legtur ntre variabilele X i Y (cantitative continue) i s se determine o modalitate de a msura intensitatea acestei legturi. Coeficientul de corelatie

    65

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    Coeficient de corelaieCoeficient de corelaie66

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    Coeficient de corelaieCoeficient de corelaie

  • 12

    67

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    Coeficient de corelaieCoeficient de corelaie68

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    Tipuri de coeficieni de corelaieTipuri de coeficieni de corelaie Pearson: 2 variabile cantitative continue

    (relaie de liniaritate, variabile normal distribuite) Spearman: 2 variabile cantitative (relaie de

    non-liniaritate sau date nedistribuite normal); 1 variabil calitativ + 1 variabil cantitativ Kendall tau a, b, i c: similar cu Spearman Gamma: Similar cu Spearman

    69

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    Corelaia Corelaia PearsonPearson (r)(r) Scop: cuantific puterea i direcia legturii liniare

    dintre dou variabile prin descrierea direciei i a gradului n care o variabil este n relaie de liniaritate cu cealalt variabil de interes (Pearson, 1896). Condiii de aplicare: Ambele caractere sunt de tip interval sau raie Ambele variabile urmeaz o distribuie normal i

    distribuia lor comun este bivariat normal

    70

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    Corelaia Corelaia PearsonPearson (r)(r)

    H0: coeficientul de corelaie = 0 H1: coeficientul de

    corelaie 0 Testul statistic aplicat

    pentru obinerea semnificaiei coeficientului de corelaie: Student

    unde X, Y = valori ale caracterului pentru fiecare msurtoare i (i = 1, 2, , n); Xm, Ym = medii ale msurtorilor celor dou caractere.

    ( )( )( ) ( )

    =

    22YYXX

    YYXXr

    71

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    Interpretarea coeficientului de corelaie Interpretarea coeficientului de corelaie r [-1, +1], r = +1 exist o relaie de liniaritate

    ntre cele dou caractere; r = -1 exist o relaie invers de liniaritate ntre cele dou caractere. Clasificarea (regulile) lui Colton (Colton, 1974): r [-0.25, +0.25] nu exist relaie r (0.25, +0.50] (-0.25, -0.50] relaie slab r (0.50, +0.75] (-0.50, -0.75] relaie moderat r (0.75, +1) (-0.75, -1) relaie foarte bun

    72

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    Coeficientul de corelaie al rangurilor Coeficientul de corelaie al rangurilor SpearmanSpearman ()() Scop: Msur non-parametric de cuantificare a relaiei

    dintre dou caractere (evalueaz ct de bine o funcie monoton poate descrie relaie dintre cele dou caractere) (Spearman, 1904).

    Metoda este satisfctoare pentru testarea ipotezei nule (nu exist relaie ntre cele dou caractere) dar nu se recomand ca i instrument de cuantificare a relaiei (Bland, 1995).

  • 13

    73

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    Coeficientul de corelaie al rangurilor Coeficientul de corelaie al rangurilor SpearmanSpearman ()() Condiii de aplicare: Nu necesit nici un fel de asumpie asupra distribuiei

    de frecven a msurtorilor; Nu necesit asumpia relaiei de liniaritate dintre

    caractere; Caracterele nu trebuie s fie cantitative de tip raie sau

    interval. Testul statistic aplicat pentru obinerea semnificaiei

    coeficientului de corelaie: Testul Student

    74

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    Coeficientul de corelaie al rangurilor Coeficientul de corelaie al rangurilor SpearmanSpearman ()()

    unde RX, RY = rangurile atribuite valorilor msurate ale caracterelor; RXm, RYm = media rangurilor asociate celor dou caractere

    unde D = diferena dintre dou perechi de ranguri (RX RY); n = volumul eantionului

    ( )( )( ) ( )

    =

    2YY

    2XX

    YYXX

    RRRR

    RRRRr

    2

    2

    6 D1

    n(n 1) =

    75

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    Coeficienii de corelaie Coeficienii de corelaie KendallKendall tautau ()() Scop: coeficieni de corelaie non-parametrici utilizai

    pentru evaluarea i testarea corelaiei dintre date non-interval ordinale (Kendall, 1938; 1942). Este considerat a fi echivalent cu coeficientul

    de corelaie al rangurilor Spearman. Se cunosc trei coeficieni de corelaie notai a, b, i c.

    76

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    Coeficientul de corelaie Coeficientul de corelaie GammaGamma ()() Scop: Metod de determinare a coeficientului de corelaie care

    n comparaie cu Kendall e mai rezistent la existena perechilor de date cu ranguri egale (Goodman i Kruskal, 1963); este utilizat cnd datele de analizat conin multe date perechi cu ranguri egale (Siegel i Castellan, 1988).

    Parametrul statistic: = (C-D)/(C+D)

    unde C = concordan i D = discordana dintre perechile de caractere cantitative de interes.

    Testul statistic aplicat pentru obinerea semnificaiei coeficientului de corelaie: Testul Z

    77

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    Coeficieni de corelaie: exempluCoeficieni de corelaie: exemplu78

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    Coeficient de determinare rCoeficient de determinare r22

    Msura n care variaia unei variabile poate fi explicat variaiei celei de a doua variabile Proporia prin care variaia unei variabile poate

    fi explicat de relaia liniar cu cealalt variabil. Definete mrimea asocierii Nu definete direcia asocierii

  • 14

    79

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    Coeficient de determinare rCoeficient de determinare r22

    r2=0 variaia lui Y nu poate fi atribuit modificrilor lui X r2=1 variaia lui Y este atribuit relaiei liniare dintre

    Y i X cnd r este semnificativ statistic i r2 este semnificativ

    ntr-un studiu de asociere dintre psihoza indus ce consumul de amfetamine i nivelul plasmatic de amfetamine s-a determinat un r=0,94 r2=0,942 = 0.8836. 88% din variaia psihozei poate fi atribuit variaiei

    nivelului plasmatic al amfetaminei.

    80

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    De reinut! Coeficientul de corelaieDe reinut! Coeficientul de corelaie Coeficientul de corelaie: Identificarea legturii dintre dou variabile Cuantificarea legturii Direcia legturii

    Coeficientul de determinare: este ptratul coeficientului de corelaie

    81

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    RegresiaRegresia S se stabileasc dac Y depinde de X i dac

    da n ce form se realizeaz aceastdependen. Funcia de regresie

    82

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    RegresiiRegresii liniareliniare Descrie relaia dintre dou variabile Este posibil determinarea unei variabile dependente

    n funcie de o variabil independent folosind ecuaia:

    Y= variabila dependentX= variabila independenta = deplasarea de origine pe axa 0Yb = panta liniei de regresie

    bXaY +=

    83

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    RegresiiRegresii liniareliniare X = variabila independent Y = variabila dependent

    Epidemiologie: variabila independent = factor de risc, variabila dependent = apariia unei anumite patologii Studii experimentale: variabilele independente

    sunt fixate de cercettor (doze ale unui nou medicament)

    84

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    Diagrama Diagrama scatterscatter Alegerea axelor: Variabile observate alegere arbitrar Regresia este folosit pentru a prezice o variabil n

    funcie de alta variabila care trebuie prezis (variabila dependent) va fi pe axa 0Y

    Relaia dintre greutatea i lungime la natere

    y = 0.0055x + 35.102R2 = 0.5644

    4042444648505254

    1200 1400 1600 1800 2000 2200 2400 2600 2800 3000greutate (grame)

    lung

    ime

    (cm

    )

  • 15

    85

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    RegresiiRegresii multiplemultiple Dou tehnici: Regresii lineare multiple Regresii logistice multiple

    Relaia dintre o variabil dependent i una sau mai multe variabile independente Presiunea arterial vrst, greutate, fumat,

    antecedente heredo-colaterale Variabila dependent = continu, normal distribuit ...

    dac nu se folosete regresia logistic

    86

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    RegresiiRegresii multiplemultiple Regresia logistic: Variabila de rspuns nu este normal distribuit

    transformarea msurii rspunsului n rata ansei (probabilitatea de a avea boala/probabilitatea de a fi indemn la boal) logaritmare Permite prezicerea probabilitii ca o patologie s

    apar (cancer pulmonar) folosind mai multe variabile ca predictori (fumatul, vrsta, sexul)

    87

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    Indicatori statistici n evaluarea Indicatori statistici n evaluarea modelelor de modelelor de regresieregresie Coeficientul de corelaie (r): exprim cantitativ

    puterea relaiei liniare dintre activitatea de interes i variabila sau variabilele independente Coeficientul de determinare (r2): ptratul

    coeficientului de corelaie. Cuantific proporia variaiei lui Y care poate fi

    explicat de relaia de liniaritate dintre aceasta i variabilele X.

    88

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    Indicatori statistici n evaluarea Indicatori statistici n evaluarea modelelor de modelelor de regresieregresie Coeficientul de determinare ajustat: valoarea ajustat

    a coeficientului de determinare pentru numrul variabilelor independente din model (X). Valoarea lui crete dac noul termen introdus n model

    determin o mbuntire a acestuia mai mare dect cea ateptat prin ansa. Spre deosebire de coeficientul de determinare care este

    un estimator pentru eantion, coeficientul de determinare ajustat este un estimator pentru populaie.

    Eroarea standard a estimatului: media erorii n estimarea lui obinut pe baza ecuaiei de regresie.

    89

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    Indicatori statistici n evaluarea Indicatori statistici n evaluarea modelelor de modelelor de regresieregresie

    90

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    Indicatori statistici n evaluarea Indicatori statistici n evaluarea modelelor de modelelor de regresieregresie

  • 16

    91

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    Exemplu 1Exemplu 1S-a studiat scderea numrului de neuroni odat cu naintarea n vrst, prin examinarea creierului unui eantion de 38 pacieni cu vrste cuprinse ntre 13 - 101 ani care au decedat fr nici un fel de istoric de boal sau demen. S-au numrat neuronii din hipocamp, pe mai multe seciuni ale fiecrei regiuni a hipocampusului. Cercettorii implicai n numrarea neuronilor nu cunoteau vrstele pacienilor.

    92

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    Exemplu 1Exemplu 1S-au obinut urmtoarele rezultate*:

    0,0013-36000Subiculum0,2600-29000Pyramidal cell layer CA10,1800-6000Pyramidal cell layer CA3-20,0120-9000Dental hilus0,1700-54000Dental granule cell layer

    pPanta numr neuroni/vrst

    Subdiviziuni hipocamp

    * West et al. 1994

    93

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    Exemplu 1Exemplu 11. Ce se nelege prin panta numr de neuroni

    versus vrst?

    Estimarea modificrii numrului neuronilor pe an

    Este panta liniei de regresie Panta este negativ deoarece numrul de

    neuroni scade odat cu naintarea n vrst

    94

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    Exemplu 1Exemplu 12. De ce cercettorii nu au cunoscut vrsta

    pacienilor? Cercettorii se pot atepta ca persoanele mai

    n etate s aib mai puini neuroni n comparaie cu persoanele mai tinere. Astfel, dac cercettorii cunosc vrsta pacienilor se ateapt ca numrul de neuroni s fie mai mic la persoanele mai n etate numrul de neuroni poate fi astfel subestimat

    95

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    Exemplu 2Exemplu 2Greutatea la natere a unui eantion de 1333 brbai suedezi n vrst de 50 ani a fost extras din registrele de eviden a naterilor. S-a descoperit o corelaie semnificativ ntre vrsta la natere i nlimea acestor persoane adulte (r = 0.22, p < 0.001)

    (Leon et al. 1996)

    96

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    Exemplu 2Exemplu 2 Ce se nelege prin corelaie i r=0,22? Corelaie pozitiv:

    greutatea la natere nlime greutatea la natere nlime

    Corelaie negativ: greutatea la natere nlime greutate la natere nlime

    r = coeficientul de corelaie care msoar puterea relaiei liniare ntre cele dou variabile continue r = 0,22 corelaia este pozitiv; nlimea adulilor tinde s fie mai

    mare pentru subiecii cu greutate mai mare la natere dar corelaia este slab.

  • 17

    97

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    Exemplu 2Exemplu 2 Ce concluzie putem trage din relaia dintre nlimea

    adultului i greutatea la natere? Pentru populaia din care acest eantion a fost extras ,

    nlimea adultului este n relaie cu greutatea la natere, dar relaia este slab. Brbaii nali se pare c au avut o greutate la natere mai mare. Din aceste date nu putem trage concluzia c relaia este una de cauzalitate.

    98

    Sorana D. BOLBOACA INFORMATIC MEDICAL I BIOSTATISTIC Curs 10

    TTRUNCHIRUNCHI CCOMUNOMUN, , anulanul I (2008I (2008--2009)2009)

    De reinut! De reinut! RegresiaRegresia Se utilizeaz pentru a estima i ulterior a

    prezice o variabil n funcie de alt variabil. Parametrii de interpretare ai modelului de

    regresie! Relaia de liniaritate nu se ntlnete frecvent

    n studiile medicale.