Mc Fmam 1 - Statistica

30
NOTIUNI DE STATISTICA Dr. Adina Ghemigian 2013

Transcript of Mc Fmam 1 - Statistica

Page 1: Mc Fmam 1 - Statistica

NOTIUNI DE STATISTICA

Dr. Adina Ghemigian2013

Page 2: Mc Fmam 1 - Statistica

Definitie

Statistica = ştiinţa, ramură a

matematicii, care permite aprecierea

unor parametri populaţionali prin

studiul unui număr redus de elemente

ale populaţiei în studiu (ţintă)

Page 3: Mc Fmam 1 - Statistica

De ce avem nevoie de statistică?

Vrem sa tragem concluzii cât mai valide din cantităţi limitate de date.

• Diferenţe importante sunt deseori mascate de variabilitatea biologică şi/sau imprecizia experimentală

• Mintea umană excelează în găsirea de tipare şi relaţii, dar tinde să generalizeze în exces.

Page 4: Mc Fmam 1 - Statistica

• Calculele statistice extrapolează de la eşantion la populaţie

• În cercetarea biomedicală se presupune că populaţia este infinită, sau cel puţin foarte mare în comparaţie cu eşantionul nostru.

De ce avem nevoie de statistică?

Page 5: Mc Fmam 1 - Statistica

• Control de calitate O fabrică de cămăşi: se extrage la întâmplare

un eşantion din întreaga populaţie de cămăşi, iar concluziile legate de calitatea eşantionului se extrapolează la toată producţia.

• Sondajul politicSe extrage la întâmplare un eşantion de

votanţi, iar rezultatul se extrapolează la întreaga populaţie de votanţi

De ce avem nevoie de statistică?

Page 6: Mc Fmam 1 - Statistica

• Studii cliniceEşantionul de pacienţi studiat este rareori

extras la întâmplare. Totuşi, pacienţii incluşi în studiu sunt reprezentativi pentru alţi pacienţi similari, iar extrapolarea de la eşantion la populaţie se poate face.

Care este definiţia precisă a populaţiei?– Toţi pacienţii care vin la acel spital?– Toţi pacienţii din oraş? Din ţară? Din lume?

De ce avem nevoie de statistică?

Page 7: Mc Fmam 1 - Statistica

Ce pot face calculele statistice?

• Estimarea statistică– ex: media - estimare punctuală– interval de încredere

• Testarea statistică a unei ipoteze– decizia dacă o asociere observată este reală,

sau datorată întâmplării / p

• Construirea de modele statistice– testează cît de bine se încadrează datele

experimentale într-un model matematic (ex: regresia lineară)

Page 8: Mc Fmam 1 - Statistica

Variabile - definitie

Variabila = orice calitate, caracteristică sau constituent al unei persoane sau lucru, care poate fi evaluat la nivelul unei populatii

• toată cercetarea medicală = studiul relaţiilor dintre variabile

• cercetătorii medicali sunt interesaţi de studierea fie a asociaţiilor, fie a diferenţelor dintre variabile.

Page 9: Mc Fmam 1 - Statistica

Variabile - clasificare

Cantitative(caracteristică măsurabilă)

Calitative(caracteristică ce nu poate fi

măsurată)

Page 10: Mc Fmam 1 - Statistica

• Nominale – grupuri de elemente ce nu pot fi ordonate una in raport cu cealalta (culoarea părului, rasa, grupa sanguina)

• Nominale ordonate (ordinale) – concluziile pot fi grupate in doua sau mai multe categorii intre care exista o ordine naturala (evolutie, clasificari, eficienţa unui tratament: slabă, bună, foarte bună)

• Binare – variabile ce nu pot lua decat 2 valori (bolnav / sănătos, mort/viu, fumator/nefumator, prezent/absent, DA/NU, prezent/absent)

Variabilele calitative

Page 11: Mc Fmam 1 - Statistica

• Continue – o variabilă măsurabilă care poate lua o infinitate de valori, de obicei într-un interval (TAD, colesterol, inaltimea, greutatea, varsta)

• Discrete – variabile care nu pot lua decât valori întregi (scor APGAR)

Variabilele cantitative

Page 12: Mc Fmam 1 - Statistica

Statistica

• Descriptiva – descrie valori obţinute pentru o variabila studiata

• Interferentiala (inductivă) este partea de analiză a datelor care permite extrapolarea unei concluzii trase pe baza unui eşantion spre populaţia ţintă pentru care a fost efectuat studiul.

Page 13: Mc Fmam 1 - Statistica

Variabile nominale

• tabel de frecvenţă (frecvenţa observaţiilor pe categorii)

• grafic: bare, plăcintă• modul (categoria cea mai frecventă)

Statistica descriptivă

Page 14: Mc Fmam 1 - Statistica

F ig u r a I I.3 . D is tr ib uţ ia p e o raş e a c a z u r i lo r in c lu s e în s tu d iu

BRASOV

BUCURESTI

CLUJ

IASI

SIBIU

TARGU MURES

TIMISOARA

98 (60%)

11 (6,7%)

3 (1,8%)

10 (6%)

13 (8%)

23 (14%)

6 (3,7%)

Page 15: Mc Fmam 1 - Statistica
Page 16: Mc Fmam 1 - Statistica

Variabile cantitativeMăsura tendinţei centrale:• Media aritmetica• Mediana = este acea valoare din şirul de date

care împarte în două părţi egale şirul ordonat de valori, situându-se la mijlocul seriei statistice.

• Modul = constituie valoarea care apare cel mai des, deci valoarea cu numărul cel mai mare de apariţii

Statistica descriptivă

Page 17: Mc Fmam 1 - Statistica

Statistica descriptivă Variabile cantitative

Măsura dispersiei:• Amplitudinea = diferenta dintre valoarea maxima si

cea minima• Abaterea standard (deviatia standard = DS) =

indicator de imprastiere a datelor• Coeficientul de variatie = raport procentual între

abaterea standard şi valoarea medie a şirului de valori

• Curba de distributie – indica distributia datelor: normala/asimetrica

Page 18: Mc Fmam 1 - Statistica

47,5%

(x-x)2

n-1SD =

Page 19: Mc Fmam 1 - Statistica

Statistica interferentialaScopul analizei statistice este de a evalua efectul unui tratament

sau al unui factor de risc asupra unei populatii tinta prin intermediul datelor obţinute din eşantionul studiat.

Există posibilitatea ca rezultatele obţinute prin studiul unui eşantion să fie datorate întâmplării – incertitudine statistica.

Testele statistice ne ajută să apreciem în ce măsură rezultatele sunt întâmplătoare şi mai ales în ce măsură şi dacă se pot aplica populaţiei generale.

Se face prin testarea ipotezelor statistice = testarea semnificaţiei statistice.

Page 20: Mc Fmam 1 - Statistica

populaţie

eşantion

eşantionare p, CI

P si intervalele de incredere

Page 21: Mc Fmam 1 - Statistica

• Incertitudinea statistica poate fi cuantificata

prin:

– testarea ipotezei (cu calculul valorii p)

– calculul intervalelor de incredere (CI)

Masurarea incertitudinii statistice/Testarea semnificatiei

statistice

Page 22: Mc Fmam 1 - Statistica

Valoarea pColectarea datelor din două eşantioane → valori medii

diferite.Observarea celor două medii diferite nu este suficientă pentru

a concluziona că populaţiile au medii diferite. E posibil ca populaţiile să aibă aceeaşi medie, iar diferenţa observată să fie o coincidenţă în urma eşantionării aleatorii → este necesara calcularea probabilitatăţii.

Valoarea p răspunde la această întrebare: dacă populaţiile au avut într-adevăr aceeaşi medie, care este probabilitatea de a observa o asemenea diferenţă (sau una mai mare) între mediile eşantioanelor într-un experiment de dimensiunea acestuia?

Page 23: Mc Fmam 1 - Statistica

Valoarea p

Valoarea p este o probabilitate, cu valoarea oscilând între 0 şi 1. Dacă valoarea p este mică, concluzia este că diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putându-se conchide că populaţiile au medii diferite.

Marimea esantionului conteaza!

Page 24: Mc Fmam 1 - Statistica

INDICATORI

Page 25: Mc Fmam 1 - Statistica

IncidenţaMăsoară frecvenţa cu care un eveniment (boală)apare în populaţie într-o perioadă de timp

Incidenţa = numărul de cazuri noi apărute într-o perioadă de timp dată / populaţia la risc în aceeaşi perioadă de timp

! nu include cazuri preexistente! este obligatorie mentionarea perioadei de timpExemplu: 0.2% sau 2 cazuri noi/1000 locuitori/an

Page 26: Mc Fmam 1 - Statistica

Prevalenţa

Proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la un moment dat sau într-o perioadă de timp dată.

Exemplu: 2% din populatie are diabet

Page 27: Mc Fmam 1 - Statistica

Riscul relativ (RR)Este o masura a asocierii intre un factor de risc si

aparitia bolii.Se calculeaza raportul dintre riscul la “expusi” si

la “neexpusi”:– RR = 1 (risc identic in ambele grupuri)– RR < 1 (riscul la neexpusi e mai mare →

posibil factor protector)– RR> 1 (riscul la expusi e mai mare → posibil

factor de risc)

Page 28: Mc Fmam 1 - Statistica

Tabel de contingenta 2 x 2 pentrucalculul RR

Boala prezenta

Boala absenta

Total

Expus a b a + b

Neexpus c d c + d

Total a + c b + d a + b + c + d

a a + bRR =

c c + d

Page 29: Mc Fmam 1 - Statistica

Sensibilitate, Specificitate

sensibilitate = a / (a+c)

specificitate = d / (b+d)

sensitivity = probability of a positive test among patients with disease

specificity = probability of a negative test among patients without disease

Patienti cu boala

Patienti fara boala

Test pozitiv a bTest negativ

c d

Page 30: Mc Fmam 1 - Statistica

Valoare Predictiva

Valoare predictiva pozitiva= a / ( a+b)

Valoare predictiva negativa= d / (c+d)

Positive predictive value = probability of disease among patients with a positive test

Negative predictive value = probability of no disease among patients with a negative test

Patienti cu boala

Patienti fara boala

Test pozitiv a bTest negativ c d