cercetarea medicala - metodologie

78
Cuprins: 1. Cercetarea ştiinţifică medicală ................................................................. .........................................................2 2. Scopul, justificarea şi calităţile unui studiu medical................................................................... ......................2 3. Etapele unui studiu de cercetare................................................................. ........................................................4 3.1. Pregătirea studiului de cercetare ................................................................ ...................................................4 3.2. Elaborarea proiectului .............................................................. ......................................................................8 3.3. Culegerea informaţiei............................................................... .......................................................................9 Populaţia ţintă .................................................................... .......................................................................... ..........9 Eşantionul................................................................ .......................................................................... .....................9 Tipuri de culegere a datelor .................................................................. ...............................................................12 1

description

cercetarea medicala - metodologie

Transcript of cercetarea medicala - metodologie

Page 1: cercetarea medicala - metodologie

Cuprins

1 Cercetarea ştiinţifică medicală 2

2 Scopul justificarea şi calităţile unui studiu medical2

3 Etapele unui studiu de cercetare4

31 Pregătirea studiului de cercetare 4

32 Elaborarea proiectului 8

33 Culegerea informaţiei9

Populaţia ţintă 9

Eşantionul9

Tipuri de culegere a datelor 12

Metode de culegere a datelor 13

Instrumente de cercetare 15

34 Prelucrarea datelor 16

Instrumentele de prelucrare16

Statistica descriptivă 16

Statistica inferenţială18

Testul statistic 19

Etapele unui test statistic 19

Inferenţa statistică pe date calitative 23

Testul χ2 25

Testul Fisher 27

Testul z pentru proporţii 28

Testul McNemar 29

Inferenţa statistică pe date cantitative 30

Testul z şi Student (t) 31

ANOVA 32

Testul Wilcoxon 33

Testul Kruskal-Wallis 34

Indicatori 39

35 Analiza şi interpretarea datelor 42

Interpretarea rezultatelor statistice 42

Erorile studiilor medicale44

36 Prezentarea rezultatelor46

Bibliografie 53

1

1 Cercetarea ştiinţifică medicală

Progresele tehnice incontestabile din ultima perioadă cu repercusiuni favorabile asupra evoluţiei

generale a societăţii umane au contribuit şi la apariţia a numeroși factori de risc care pot influenţa starea de

sănătate

Icircncercările de a depista corelaţiile dintre starea de sănătate sau de boală şi factorii

de risc de a evalua mecanismele prin care ei acţionează de a găsi remediile medicamentoase sau profilactice

nasc o serie de icircntrebări răspunsul la aceste icircntrebări fiind adus de cercetarea ştiinţifică

Un proiect de cercetare pe baza căruia se va desfășura un studiu clinico-epidemiologic

icircşi găseşte originea icircn

bull curiozitatea cercetătorului pentru o problemă medicală

bull icircncercarea de a descrie unele inadvertenţe existente icircntre ceea ce se observă şi ceea ce ar trebui să fie icircn

practica medicală

bull calităţile de observator şi experienţa profesională a cercetătorului

bull abilitatea cercetătorului de a găsi cele mai eficiente metode de rezolvare a

problemelor ivite

2 Scopul justificarea şi calităţile unui studiu medical

Scopul unui studiu de cercetare este de a da răspuns la icircntrebări cu privire la

bull cauzalitate la documentarea unei relaţii stracircnse icircntre unul sau mai mulţi factori de risc şi boală

bull istoria naturală a unei boli sau dinamica acesteia icircncepacircnd cu momentul impactului factorului de risc

(inclusiv a factorilor de natură biologică) cu macroorganismul urmacircnd apoi fazele incubaţia bolii perioada de

stare şi faza finală urmată de vindecare imunitate cronicizare sau deces Dacă pentru bolile infecţioase aceste

faze cu precădere primele două sunt mai bine definite icircn bolile neinfecțioase debutul este imprecis iar

perioada de latenţă este de obicei asimptomatică deci mai greu se poate depista boala icircn aceste faze

bull prognosticul bolii aprecierea cacirct mai aproape de certitudine a evoluţiei unei boli Factorii prognostici sunt

apreciaţi prin studii epidemiologice de cohortă icircn care se pot evalua indicatori ca supravieţuirea unui bolnav la

5 ani după un anumit moment cheie din istoria naturală a bolii rata de fatalitate rata de răspuns la tratament

ratele de recidive şi remisii ale bolii

bull tratamentul eficienţa şi eficacitatea unui tratament sunt frecvente subiecte de cercetare pentru abordarea lor

se apelează la trialuri clinice controlaterandomizate

Se pot analiza de asemenea scheme noi de tratament eficienţa unor preparate sau scheme de aplicare a

preparatelor profilactice (vaccinuri dezinfectanţi etc)

2

bull profilaxia icircmbolnăvirilor include totalitatea măsurilor care pot influenţa cauzele modificabile ale unei boli şi

se efectuează icircn patru trepte profilaxia primordială primară secundară şi terţiară

Justificarea studiului clinic

Justificarea studiului pleacă de la informaţiile existente legate de subiectul pe care cercetarea

intenţionează să icircl dezbată informaţii existente icircn literatura de specialitate

Cercetarea bibliografică permite identificarea unor lipsuri icircn legătură cu problema luată icircn studiu

inexistenţa de date referitoare la o icircmbolnăvire dintr-o zonă geografică (ţară judeţ comunitate) explicarea şi

emiterea unor soluţii de remediu Toate acestea ar putea fi elemente care justifică iniţierea şi derularea unui

studiu

Icircn justificarea studiului se poate insista pe

bull caracterul nou actual inedit al problemei

bull un nivel ridicat al morbidităţii sau mortalităţii unui fenomen de sănătate

bull gravitatea evenimentului

Calităţile studiului de cercetare

Un bun studiu de cercetare trebuie să fie pertinent nou fezabil să respecte etica medicală

Un studiu este pertinent cacircnd are repercusiuni asupra viitorului clinic al unui fenomen de sănătate pertinența

practică icircnsemnacircnd o mai bună cunoaştere a bolii a prognosticului ei ameliorarea tehnicilor de diagnostic şi

de tratament etc

O altă cerinţă se referă la ineditul studiului faptul de a fi nou icircn sensul de a aduce informaţii noi să nu repete

un studiu deja finalizat şi cu concluzii ferme

Cercetătorul trebuie icircnainte de a demara studiul icircnainte de a investi timp bani energie să estimeze dacă

studiul este fezabil Icircn acest sens trebuie să se asigure că

bull are un număr suficient de subiecţi determinări de laborator etc pentru a putea trage concluzii adecvate

bull nu există constracircngeri tehnologice sau financiare

bull studiul este accesibil şi acceptat de populaţie

bull nu are costuri de timp dar mai ales financiare mari

bull nu are scopuri prea ambiţioase sau scopuri multiple icircn general un studiu ar trebui să aibă un singur scop să

găsească rezolvarea la o singură icircntrebare

Studiul medical trebuie să respecte etica medicală cele patru principii

bull interesul şi beneficiul cercetării

bull inocuitatea (nevătămarea cercetării)

bull respectul faţă de persoanele incluse icircn studiu (respectul intimităţii persoanelorconfidenţialitatea datelor)

bull păstrarea echităţii şi respectul valorilor morale

In efectuarea unui studiu este necesară parcurgerea următoarelor etape

1 Pregătirea studiului

3

2 Elaborarea protocolului

3 Culegerea informaţiilor (datelor)

4 Prelucrarea datelor

5 Analiza şi interpretarea rezultatelor

6 Prezentarea rezultatelor

7 Redactarea studiului

3 Etapele unui studiu de cercetare

31 Pregătirea studiului de cercetare

Pregătirea studiului de cercetare comportă mai multe sub-etape

bull Documentarea bibliografică

bull Definirea fenomenului

bull Formularea temei de cercetare

bull Aspecte manageriale

Documentarea bibliografică

Cercetarea bibliografică are misiunea de a realiza un compromis icircntre excesul de documente (anual se

publică icircn icircntreaga lume peste 20000 de reviste cu caracter medical) şi pierderea de informaţii pertinente

Cercetarea bibliografică necesită o selectare şi o evaluare a literaturii de specialitate pe o anumită problemă şi

se realizează prin parcurgerea a trei etape

a) Prima etapă este cercetarea bibliografică propriu-zisă adică identificarea publicaţiilor care se referă la

subiectul icircn discuţie

Etapele documentării bibliografice sunt

bull Definirea şi delimitarea precisă a subiectului de cercetat

bull Stabilirea unei liste de bdquocuvinte cheierdquo prin lectura referinţelor bibliografice

bull Traducerea icircn limbi de circulaţie internaţională

bull Stabilirea unei liste cu documentele de cercetat

bull Consultarea unor tratate sau cărţi de referinţă

bull Consultarea publicaţiilor primare

bull Redactarea fişelor bibliografice şi aranjarea lor icircn ordine alfabetică

bull Introducerea referinţelor bibliografice icircn textul propriu-zis

Literatura primară de specialitate

Reprezintă toate materialele scrise care conţin studii originale

Articole ştiinţifice Au calitatea esenţială că informaţiile publicate sunt recente intervalul de timp scurs de la

scriere la publicare fiind icircn general foarte scurt

4

Teze de doctorat licenţă Se pot găsi icircn bibliotecile instituţiilor de icircnvăţămacircnt superior Sunt utile pentru că

icircn general tratează pe larg o anumită problemă care poate fi de interes avacircnd şi o bibliografie recentă

Brevete şi mărci Sunt acele sisteme de protecţie a produselor şi tehnologiilor Sunt utile icircn general icircn

cercetarea experimentală

Literatura secundară de specialitate

Tratate de specialitate Sunt foarte importante icircn faza incipieintă a unui studiu pentru aprofundarea problemei

de cercetat Informaţiile prezente icircn astfel de publicaţii sunt ordonate cu noţiuni de bază definiţii teorii

posibile etc

Cărţi de referinţă Sunt monografii care studiază pe larg un fenomen putacircnd fi foarte utile atacirct cercetătorilor

debutanţi cacirct şi celor iniţiaţi

Literatura terţiară de specialitate este reprezentată de indexuri reviste cu extrase de articole şi rezumate

Cercetarea bibliografică bdquoon-linerdquo permite accesul la nenumărate surse de informare utilizacircnd icircn acest scop

motoare de căutare

b) A doua etapă este lectura critică activă a publicaţiilor selectate pentru a judeca valoarea publicaţiilor

indiferent dacă este vorba de calitatea cercetării sau de pertinenţa rezultatelor publicate

Evaluarea corectă critică a unui articol va permite cititorului să aprecieze dacă publicaţia este credibilă

rezultatele corespund realităţii (validitatea internă) respectiv dacă informaţiile conţinute icircn publicaţie sunt

aplicabile icircn practica medicală dacă se pot generaliza dacă sunt aplicabile icircn proiectul de cercetare al

viitorului investigator (validitatea externă)

Lectura critică a literaturii medicale se bazează pe folosirea unei grile de lectură care are meritul de a putea fi

aplicată tuturor tipurilor de publicaţii Această grilă are 8 criterii de evaluare pentru fiecare criteriu trebuie să

se răspundă la următoarele icircntrebări

bull este posibil să se găsească icircn articol informaţia pentru criteriul icircn cauză

bull dacă criteriul abordat este corect

bull dacă criteriul este incorect icircn ce măsură ameninţă validitatea studiului

Cele 8 criterii de evaluare sunt

1 Obiectivul vizează următoarele preocupări medicale

bull istoria naturală a unei boli evoluţia şi prognosticul ei

bull performanţa unui test diagnostic

bull impactul unei intervenţii (terapeutice de depistare de prevenţie sau de educaţie)

Lectura critică va aşeza articolul icircn una din aceste situaţii apoi icircn raport cu obiectivul va stabili dacă are

ipoteze de verificat

5

2 Tipul de studiu Cititorul trebuie să recunoască planul de studiul pentru a verifica dacă tipul de studiu este

adaptat icircntrebării puse Va merge progresiv cu urmărirea de la raportul de caz-seria de cazuri la studiul

transversal studiul caz-control studiul de cohortă şi trialul controlat

3 Factorii studiaţi (variabila independentă) pot fi factori de expunere sau de intervenţie Cititorul trebuie să

poată recunoaşte factorul să aprecieze cum a fost măsurat dacă s-a folosit aceeaşi metodă de măsurare pentru

loturile icircn studiu ce metodă de comparaţie s-a folosit dacă sunt erori (factor de confuzie)

4 Criteriul de raţionament este evenimentul sau situaţia presupusă a fi rezultatul factorului studiat boala

decesul supravieţuirea complicaţiile etc Definirea precisă şi metoda de măsurare a rezultatului expunerii va

permite cititorului să aprecieze validitatea informaţiilor

5 Populaţia studiată (eşantionul) Se va urmări dacă este definită populaţia de referinţă şi populaţia de

studiat analizacircndu-se corectitudinea selecţiei randomizarea proporţia de subiecţi la sfacircrşitul studiului

validitatea externă a rezultatelor

6 Analiza datelor Cititorul trebuie să aprecieze dacă s-au examinat toate erorile inclusiv factorul de confuzie

dacă nu validitatea studiului ar putea fi compromisă

7 Rezultatele Principalele aspecte pe care cititorul le va urmări la acest capitol sunt dacă ele se datoresc

numai şansei dacă s-a făcut calculul statistic dacă s-a apreciat relaţia expunere-efect (RR OR RA) dacă a

fost apreciată semnificaţia clinică sau biologică care nu este identică cu semnificaţia statistică

8 Sinteza lecturii critice analizează concluziile autorilor dacă ele răspund icircntrebărilor formulate la icircnceputul

studiului dacă rezultatele sunt aplicabile la populaţia studiată dacă rezultatele sunt acceptabile pentru practica

proprie a cititorului dacă rezultatele justifică vreo schimbare icircn practica clinică respectiv vor ameliora starea

pacienţilor Această abordare cere cititorului cunoaşterea noţiunilor de bază icircn metodologia cercetării

ştiinţifice fiind vorba icircn acelaşi timp şi de un demers clinic

c) A treia etapă icircn cercetarea bibliografică constă icircn combinarea datelor din mai multe studii referitoare la

acelaşi subiect şi care se realizează prin meta-analiză Tehnica meta-analizei permite să se sporească

eficacitatea testării ipotezelor să crească forţa statistică a rezultatelor şi să se obţină informaţii care nu pot fi

convenabil extrase din fiecare cercetare

Definirea fenomenului

Definirea fenomenului se bazează pe

bull Cunoaşterea prealabilă a problemei prin documentare riguroasă documentare care poate justifica pertinenţa

temei propuse (revista literaturii de specialitate)

Icircn prima etapă se cercetează bibliografia propriu-zisă adică se identifică publicaţiile care se referă la subiectul

icircn discuţie apoi se vor selecta publicaţiile necesare studiului apreciind validitatea lor (problemele de

documentare bibliografică vor constitui un capitol separat)

bull Formularea unei ipoteze ştiinţifice sub-etapă care reprezintă fondul problemei

6

Ipoteza este o afirmaţie (nu o icircntrebare) despre o posibilă relaţie icircntre factorii studiaţi şi criteriile de

raţionament Ipoteza poate fi ipoteză ldquonulărdquo - nu există această relaţie şi ldquoalternativărdquo - există relaţia Ipoteza

va trebui apoi dovedită sau respinsă testul statistic calculează probabilitatea conform căreia asociaţia observată

este reală sau ea survine din icircntacircmplare

bull Motivarea organizării studiului Trebuie făcută o motivare corectă legată de inexistenţa unor studii

referitoare la problema pe care o va dezbate studiul

Formularea temei de studiu

Pentru formularea temei de studiu trebuiesc menţionate obiectivul sau obiectivele şi tipul de studiu ales pentru

cercetarea respectivă Există icircn general patru tipuri de obiective

bull obiective care se referă la evoluţia şi prognosticul unei icircmbolnăviri obiective prin care se icircncearcă

icircnţelegerea şi cunoaşterea unor evenimente ce pot să apară la un pacient pe parcursul bolii

bull obiective care se referă la etiologia bolii (cauze de natură bacteriană virală parazitară) sau la cauzalitate

(relaţia factor de risc-boală)

bull obiective legate de performanţa unor teste de diagnostic sau de screening de evaluare a strategiei de

diagnostic sau de interpretare a unui test

bull obiective care se referă la impactul unei intervenţii evaluarea unei intervenţii terapeutice de depistare a unor

boli de prevenţie de educare pentru sănătate

Obiectivele unui studiu se icircmpart icircn obiectivul major unul din cele patru enumerate şi obiective

secundare care pot aborda şi alte fenomene biologice decacirct cel major cu condiţia să nu altereze realizarea

acestuia Alegerea tipului de studiu este stracircns legată de obiectivul ales Dacă obiectivul este descrierea

distribuţiei caracteristicilor unei populaţii aprecierea frecvenţei unui fenomen de sănătate analiza acelui

fenomen icircn funcţie de timp loc persoană se va alege un studiu epidemiologic descriptiv studiu care nu are o

ipoteză fixată anterior O ipoteză se poate formula ca rezultat al studiului descriptiv dar nu se va face

verificarea ei icircn cadrul studiului Dacă intenţia studiului este de a emite o judecată asupra unei posibile relaţii

icircntre factorii studiaţi atunci problema de cercetat este fundamentată de o ipoteză care trebuie verificată

dovedită iar studiul care realizează acest lucru respectiv limitele studiilor utilizate

Aspectele manageriale

Aspectele manageriale includ

bull justificarea bugetului estimarea sumei necesară realizării studiului și apreciarea durate studiului

bull defalcarea bugetului pe necesități legate de achziționare de aparatură reactanți truse etc pentru personal

(munca depusă pregătire deplasări icircn teren participări la congrese sau conferințe documentare) materiale

consumabile etc

7

32 Elaborarea proiectului

Protocolul de cercetare este un document care emite obiectivul și ipoteza studiului definește condițiile de

desfășurare și realizare a viitorului studiu clinic Elaborarea protocolului este importantă pentru cercetătorii

participanţi la studiu comisiile de etică şi finanţatori

Protocolul include mai multe formulare care trebuie să cuprindă

a) Titlul proiectului

b) Sumarul proiectului

c) Descrierea proiectului

d) Normele deontologice de cercetare

e) Modalitățile de diseminarea și valorificarea rezultatelor

f) Perspective de continuare a cercetării

g) Anexe

Prezentarea proiectului va include următoarele fișiere

bull resursele umane (membrii echipei afilierea acestora)

bull relevanța temei pentru dezvoltarea cunoașterii icircn domeniu

bull stadiul actual al cunoașterii și bibliografia aferentă

bull justificarea studiului

bull enunțarea obiectivelor și ipoteza de lucru

bull metodologia propriu-zisă

Referitor la metodologia utilizată vor trebui menționate

bull factorulfactorii studiați care reprezintă variabila independentă respectiv dacă este cazul modalitățile de

măsurare

bull criteriile de raționament- variabila dependentă (situația sau evenimentul ce se presupune a fi rezultatul

factorului studiat cum ar fi boala handicapul complicații decesul)

bull tipul de studiu care se va aplica icircmpreună cu design-ul acestuia

bull eșantioanele de lucru și modalitățile de eșantionaj

bull metodele de culegere și de prelucrare a datelor

bull planificarea activităților

bull structura bugetului fiind eligibile următoarele categorii de cheltuieli de capital (echipamente software

upgrading) pentru personal (full sau part-time instruire asigurări de sănătate) de informare (documentare

abonamente) mobilități (vizite la alte unități de cercetare participări la

congrese) materiale consumabile (truse reactanți papetărie) valorificare a rezultatelor (lucrări științifice de

etapă sau lucrarea finală) cheltuieli indirecte (de regie)

bull modalităţile de valorificare a rezultatelor

bull legături de alte proiecte

8

Protocolul mai conține anexe curriculum vitae al investigatorului principal și al coinvestigatorilor

calendarul activităților avizul Comisiei de etică documente speciale și

consimțămacircntul informat icircn cazul studiilor pe subiecți umani

Icircnainte de implementare protocolul va fi verificat de experți pentru eligibilitate (dacă sunt icircndeplinite

condițiile de acceptare finanțare) calitate și pertinență icircn sensul că protocolul trebuie să fie clar exprimat

corect icircntocmit bine așezat și cu repercursiuni favorabile pentru viitor

33 Culegerea informaţiei

Pentru a realiza o cercetare medicală culegerea datelor este prima etapă şi realizează icircn funcţie de

obiectivele propuse tipul studiului timpul disponibil şi resurse umane şi financiare

Există două mari posibilităţi de culegere

bull Icircn funcţie de elementele studiate

o Culegerea exaustivă Toţi subiecţii populaţiei pe care dorim să o studiem Greu de realizat din cauza

costurilor foarte mari sau a alterării populaţiei de studiu

o Prin eşantionare Este metoda folosită icircn studii medicale

bull Icircn funcţie de durata culegerii

o Transversală Se studiază un grup la un moment dat

o Longitudinală Extinsă in timp

- Retrospectivă ndash icircnregistrări medicale

- Prospectivă ndash date culese la intervale prestabilite de timp

Populaţia ţintă

Este orice colectivitate icircntreagă de oameni animale plante sau obiecte de la care putem colecta date Populaţia

ţintă este icircntregul grup care ne interesează pe care dorim să-l descriem sau să tragem concluzii despre el

Pentru a putea realiza generalizări spre populaţia ţintă deseori suntem obligaţi să folosim un eşantion (selecţie)

care icircnsă trebuie să fie reprezentativ pentru populaţia pe care vrem să o studiem Pentru fiecare populaţie de

studiu sunt posibile mai multe eşantioane Pe baza acestor eşantioane se calculează un estimator Pe baza

acestui estimator calculat care poate fi medie aritmetică procent etc se pot trage concluzii despre icircntreaga

populaţie Este foarte important ca investigatorul să definească foarte atent şi complet populaţia icircnainte de a

realiza eşantionul inclusiv descrierea criteriilor de includere şi excludere icircn populaţia de studiu

Eşantionul

Un eşantion este practic un grup de elemente selectate dintr-un grup mai extins (populaţia ţintă) Studiind

eşantionul selectat se pot trage concluzii despre grupul de unde a fost ales (populaţia ţintă)

Este icircn general ales pentru studiu pentru că

bull Populaţia ţintă este prea mare şi nu poate fi studiată ca icircntreg

bull Nu avem acces din diverse motive decacirct la parte din populaţia de studiu

9

bull Un studiu pe icircntreaga populaţie poate distruge populaţia

bull Eşantioanele pot fi studiate mai rapid

bull Costul şi resursele necesare studiului sunt mai reduse

Numărul elementelor dintr-un eşantion se numeşte talia sau volumul selecţiei

Acesta fiind icircn general mai mic decacirct icircntreaga populaţie poate fi observat icircn detaliu iar dacă este reprezentativ

se pot afla prin intermediul său proprietăţile populaţiei ţintă

Eşantionul trebuie să fie reprezentativ pentru populaţia generală De aceea dintre metodele de eşantionare se

folosesc tehnicile de randomizare Trebuie să satisfacă două condiţii principale

bull condiţie de ordin cantitativ talia să fie suficient de mare

bull condiţie de ordin calitativ trebuie extras aleator din populaţia ţintă

Metode de eşantionare

Putem vorbi icircn linii mari de două posibilităţi de eşantionare prin metode probabilistice şi prin metode

nonprobabilistice

Eşantionarea probabilistică este metoda cea mai folosită icircn studiile medicale fiind şi cea indicată pentru a

realiza reprezentativitatea calitativă

Icircn medicină se folosesc patru tipuri de eşantionări

1 Simplu randomizat

2 Sistematic

3 Stratificat

4 Cluster (icircn cuiburi)

1 Eşantionul simplu randomizat Fiecare element din populaţia ţintă are o şansă egală non zero de a fi

inclus icircn eşantion Se ia la icircntacircmplare un număr de elemente egal cu talia eşantionului Dezavantajul acestui tip

de eşantionare este că presupune cunoaşterea icircntregii populaţii ţintă

2 Eşantionul sistematic După aflarea taliei eşantionului şi a populaţiei ţintă se calculează factorul de

eşantionare k icircmpărţind talia populaţiei ţintă la volumul eşantionului Apoi fiecare al k-lea element este

selectat spre includere

Acelaşi mare dezavantaj apare şi icircn acest caz fiind obligatorie cunoaşterea icircntregii populaţii de studiu

3 Eşantionul stratificat Există icircn cele mai multe cazuri probleme medicale care studiindu-se pe eşantion

prezintă variabilităţi icircn funcţie de caracteristicile populaţiei (sex vacircrstă nivel de pregătire etc) Icircn acest caz

este obligatorie realizarea similitudinii demografice a eşantionului cu populaţia de studiu Din date provenite

de la Centrul de Statistică putem dezvolta ca procente o structură a populaţiei Această structură trebuie să se

regăsească (procentual) şi icircntre membrii eşantionului O importantă şansă ca reprezentativitatea calitativă să fie

corectă este conferită de respectarea

acestei similitudini demografice

10

4 Eşantionul bdquoclusterrdquo sau icircn cuiburi Icircn cazul unui studiu amplu cu scop de a investiga populaţia unei

icircntregi ţări sau regiuni putem ajunge icircn imposibilitatea de a alege şi mai ales investiga indivizi răspacircndiţi prin

icircntreaga zonă Din acest motiv se desemnează la icircntacircmplare un număr calculabil de

grupuri populaţionale extinse icircn toată zona de studiu Aceste grupuri poartă numele de bdquocuiburirdquo La nivelul

fiecărui bdquocuibrdquo se aplică o tehnică precedentă de selecţie a cazurilor Se poate sau de cele mai multe ori se face

la nivel de bdquocuibrdquo stratificarea iar apoi selecţia propriu-zisă se realizează sistematic sau simplu randomizat

Este metoda de eşantionare cel mai frecvent utilizată icircn cercetarea medicală de amploare Pentru ca eventualele

erori să nu se poată strecura s-a definit şi un indice DEF (design effect) cu care trebuie multiplicată talia

selecţiei care pentru eşantionarea icircn bdquocuiburirdquo este egal cu 2 astfel putem obţine şi o reprezentativitate

calitativă dar şi una cantitativă

Eşantionarea nonprobabilistică este o metodă neindicată icircn studiile medicale datorită lipsei de forţă icircn ceea ce

priveşte posibilitatea de aplicare a concluziilor asupra populaţiei de studiu

Se definesc şi icircn acest caz patru metode

1 Eşantion de convenienţă Membrii unui astfel de eşantion sunt aleşi numai pentru că sunt la icircndemacircnă

disponibili de a răspunde le un eventual chestionar

2 Eşantion pe cote Similar cu tipul de eşantion stratificat se referă la faptul că selecţia se face formacircnd

eşantionul din primele 30 de persoane care respectă un criteriu impus

3 Eşantion cu un scop Elementele incluse icircn eşantion sunt alese după un criteriu care exclude din start marea

majoritate a populaţiei

4 Eşantion raţional Selecţia se face prin prisma unui raţionament al celui care conduce studiul

Parametru şi estimator

Parametrul este o valoare de obicei necunoscută (şi care trebuie să fie estimată prin studiu) folosită pentru a

reprezenta o anumită caracteristică a populaţiei de studiu De exemplu media populaţiei (icircnălţime) este un

parametru populaţional Raportat la o populaţie parametrul este o valoare fixă şi exactă care nu variază

Fiecare eşantion extras din populaţie va indica o valoare a mediei care nu poate decacirct să estimeze parametrul

Icircn general parametrii sunt notaţi cu litere greceşti (ex Media = μ)

Estimatorul este o valoare calculată dintr-un eşantion studiat Este folosit pentru a putea aprecia parametrul

populaţional pe care icircn căutăm Este de asemenea posibil ca dintr-o populaţie să formăm mai multe eşantioane

mediile lor de cele mai multe ori nefiind identice icircntre ele şi nici identice cu media populaţiei Estimatorii

sunt notaţi cu litere latine (ex Media = μ)

Dacă valoarea mediei calculată pe eşantion este de exemplu 168 cm atunci putem estima ca valoarea mediei

icircn populaţie este 168 cm

11

Tipuri de culegere a datelor

1 Culegere de tip eşantion reprezentativ Grupul de indivizi incluşi icircn studiu sunt reprezentativi (calitativ şi

cantitativ) pentru populaţia generală Poate fi utilizat pentru studii descriptive (cel mai frecvent) dar uneori şi

pentru studii analitice

Este necesar pentru acest tip de culegere a datelor ca iniţial să fie cunoscută talia eşantionului (calculabilă icircn

funcţie de prevalenţă şi precizie) Pentru evaluarea datelor culese se utilizează tabelul de contingenţă 2 x 2

astfel (Figura 1)

Figura 1 - Tabelul de contingenţă 2 x 2

Unde

a ndash persoane expuse unui factor de risc care au boala studiată

b ndash persoane expuse unui factor de risc care nu au boala studiată

c - persoane neexpuse unui factor de risc care au boala studiată

d - persoane neexpuse unui factor de risc care nu au boala studiată

După aranjarea datelor icircn tabelul de contingenţă (2 x 2) se poate icircncepe analiza statistică a datelor atacirct ca

procente calculabile cacirct şi din punct de vedere a aplicării de teste statistice pentru elucidarea semnificaţiei

statistice

Este posibilă din acest tip de culegere de date calcularea

1 Prevalenţei unei boli

2 Frecvenţei expunerii

3 Gradul de asociere icircntre factorul eventual de risc şi boala

2 Culegerea de tip expus ndash neexpus Icircmparte subiecţii icircn două categorii expuşi sau neexpuşi factorului de risc

studiat Ca evoluţie următoare a studiului după o astfel de culegere a datelor se poate evalua icircn timp apariţia

icircmbolnăvirii despre care se efectuează studiul Icircn timp longitudinal prospectiv se poate calcula dacă factorul

studiat reprezintă un risc de icircmbolnăvire este indiferent sau chiar este cu efect protectiv Numărul subiecţilor

din cele două grupuri poate fi egal sau poate fi diferit Numărul acestora poate fi calculat icircn vederea obţinerii

unei bune reprezentativităţi cu ajutorul formulelor de selecţie Avacircnd icircn vedere calitatea longitudinală a

12

studiului este important ca numărul ales să fie mai mare pentru a putea suplinii eventualele pierderi din

urmărire Practic rezultatele sunt introduse icircn tabelul 2 x 2 de unde se pot calcula indicatorii doriţi (Figura 2)

Avacircnd icircn vedere modul de culegere a datelor este permisă calcularea de indicatori numai pe orizontală

orice comparare icircntre coloana dreaptă şi stacircngă fiind incorectă Avantajul acestui tip de culegere a datelor ar fi

eventualul număr mai redus de subiecţi dar dezavantajul major este cel al costurilor de urmărire icircn timp dar

trebuie luată icircn calcul şi pierderea de subiecţi din evidenţe Factorul controlat este deci prezenţa expunerii iar

factorul aleator este prezenţa bolii

Figura 2 Tabelul de contingenţă pentru tipul de culegere expus ndash neexpus

4 Culegerea de tip caz ndash martor Icircn acest caz ceea ce ghidează colectarea datelor este prezenţa sau absenţa

bolii icircn momentul prezent Se vor culege date de la două loturi constituite după criteriul de bolnav B+ şi de fără

boală B+ Datele culese sunt icircn trecut deci caracterul datelor va fi retrospectiv Icircn acest caz factorul controlat

este boala factorul aleator fiind expunerea (Figura 3)

Calculul de indicatori icircn acest caz se va putea efectua numai icircntre coloane orice calcul icircntre valorile de pe linii

fiind greşit Rezultate semnificative se pot obţine icircn acest caz utilizacircnd loturi mai mici de studiu prin

comparaţie cu tipul eşantion reprezentativ permiţacircnd icircn acelaşi timp studiul bolilor rare (cu prevalenţă mică)

Figura 3 Tabelul de contingenţă pentru tipul de culegere caz ndash martor

Metode de culegere a datelor

Metoda aleasă pentru culegerea datelor trebuie să fie aleasă după un atent studiu bibliografic icircn vederea

stabilirii celui mai eficient mod de a răspunde temei de studiu

Metodele de culegere trebuie să fie bine aplicabile şi consistente ca aport informaţional necesar

13

1 Fiziologice Sunt colectate date despre anumite caracteristici fiziologice ale pacienţilor (TA glicemie

colesterol etc) Această metodă aduce rezultate obiective cacirct timp instrumentul de evaluare este bine calibrat

şi prezintă variaţii mici

2 Metode observaţionale Instrumentul de culegere a datelor trebuie să fie sincronizat cu protocolul conceput

de cercetător Datele culese trebuie să fie de asemenea consistente adică să fie colectate de aceeaşi manieră

conducătorul studiului trebuind să instruiască investigatorii (colectorii de date) Icircnregistrarea datelor trebuie să

fie de asemenea sistematică şi bine standardizată Observaţii de control trebuie icircn mod obligatoriu făcute

pentru a putea aprecia icircn mod corect orice deviere datorată unor factorii externi Este obligatorie luarea icircn

consideraţie a aspectelor etice

3 Interviul Poate fi structurat cu un set specific de icircntrebări sau nestructurat cu o temă generală cu care se

icircncepe interviul Interviurile pot fi icircnregistrate sau intervievatorul poate nota pur şi simplu răspunsurile Există

două tipuri generice de interviu interviul de profunzime care se referă la o discuţie icircn general structurată cu

un număr de icircntrebări prestabilite icircn icircncăperea de studiu fiind doară intervievatorul şi persoana chestionată şi

interviul de grup unde prin conversaţii pornind de la temă generală expusă şi condusă de intervievator se

obţin date despre subiecţii participanţi la studiu Ambele metode de interviu au indicaţiile lor precise Un

interviu pe teme intime nu va putea fi corect icircn ceea ce priveşte datele colectate dacă se aplică un interviu de

grup

4 Chestionarul Document scris adresat unor persoane pentru a răspunde la una sau mai multe icircntrebări

Trebuie să aducă răspunsurile la icircntrebările care motivează studiul constituind ansamblul icircntrebărilor destinate

culegerii de informaţii (date) Redactarea chestionarului trebuie să ţină cont de structura acestuia introducere

conţinut exprimarea icircntrebărilor grafica chestionarului

5 Icircnregistrări preexistente

Icircn cercetarea medicală sunt cel mai frecvent utilizate Informaţiile dorite sunt deja existente ceea ce icirci revine

cercetătorului este ca să structureze datele icircn funcţie de scopul studiului pe care icircn conduce Aceste surse sunt

bull Foi de observaţie

bull Registre de consultaţie

bull Buletine de analize

bull Registre de operaţii

Icircn cazul icircn care nici o metodă de culegere a datelor nu este pe placul celui ce conduce studiul există

posibilitatea de a construi un instrument nou de culegere a datelor

Acest proces trebuie să urmărească nişte paşi obligatorii fiind mare consumator de timp

bull Definirea structurii cu care se va face măsurarea

bull Formularea itemilor de măsură

bull Analiza validităţii instrumentului de măsură ndash măsoară acesta fenomenul corect

bull Elaborarea de instrucţiuni de utilizare pentru investigatori

14

bull Pretestarea instrumentului

bull Aprecierea validităţii interne şi externe a datelor culese

Instrumente de cercetare

Formularea clară a temei de cercetare necesită o foarte bună definire a factorilor studiaţi şi a criteriilor de

judecată Acestea din urmă sunt ultimele care vor trebui definite icircn cadrul protocolului de studiu

Alegerea unui instrument de măsură

Nu există un instrument de măsură perfect sau universal corect Alegerea sa dintre cele existente şi cele deja

utilizate depind de trei factori

bull Obiectivul studiului

bull Boala studiată

bull Populaţia icircn studiu

De aceste trei elemente trebuie ţinut cont icircn fiecare etapă a dezvoltării instrumentului

Definirea obiectivului

Studiu transversal Dacă se doreşte studierea unui simptom sau a unei caracteristici ale populaţiei se poate

icircmpărţi populaţia de studiu icircn mai multe grupuri Este practic vorba de a determina diferenţele dintre subiecţi

icircn cea ce priveşte o variabilă necesară studiată printr-un studiu transversal (utilizarea dozării de Ac HBS

pentru a evalua progresele bolnavilor de hepatită tip B)

Studiu longitudinal Icircn acest caz nu se poate icircmpărţii populaţia de studiu icircn mai multe grupuri datele obţinute

fiind de la acelaşi subiect colectate după un interval de timp

Icircn funcţie de boală şi populaţie se aleg şi instrumentele de măsură cele mai adecvate

Instrumentele cercetării reprezintă un mecanism specific sau o strategie pe care cercetătorul o utilizează pentru

colectarea prelucrarea şi inferenţa datelor Aceste instrumente sunt

1 Studiul icircn bibliotecă

2 Computerul

3 Determinările experimentale

4 Statistica

5 Mintea umană

6 Facilităţi de limbaj şi comunicare

Determinările experimentale

Măsurarea constă icircn aprecierea şi cuantificarea fenomenelor calitativ sau cantitativ Interpretarea

datelor se referă la transformarea lor icircn unităţi de descoperire a unor fenomene mai puţin cercetate

Standardele acceptate se referă la norme medii distribuţii etc Tot icircn cadrul interpretării datelor datele

obţinute sunt caracterizate pe scale de valori nominal ordinal de interval sau de raport

Validarea şi reproductibilitatea măsurătorilor sunt aspecte importante şi foarte necesare pentru o

cercetare corect fundamentată care doreşte obţinerea unor concluzii pertinente

15

Statistica Este implicată icircn condensarea şi procesarea unui volum mai mare de date astfel icircncacirct să se poată

interpreta corect valorile obţinute şi să se permită comparările Utilizarea unor teste statistice specifice permite

determinarea semnificaţiei (diferenţei) statistice astfel icircncacirct estimatorii să poată fi aplicaţi la populaţia

generală Furnizează informaţii şi privind corelarea sau relaţionarea icircntre date

Mintea umană este cea care reuşeşte să integreze şi să icircnţeleagă rezultatele obţinute Semnificaţia ştiinţifică

este stabilită icircn funcţie de rezultatele statisticii de mintea umană conform afirmaţiei bdquosemnificaţia ştiinţifică

nu este egală cu semnificaţia statisticărdquo Metodele aplicate pentru a putea ajunge la o concluzie pertinentă sunt

logica deductivă raţionamentul inductiv şi gacircndirea critică

Limbaj şi comunicare Exprimarea orală sau icircn scris permite nuanţarea unor aspecte seci cifrice ale unor

studii Icircn acest mod devine mai evidentă semnificaţia ştiinţifică a unor rezultate statistice

34 Prelucrarea datelor

Instrumentele de prelucrare

Statistica este o ştiinţă ramură a matematicii care studiază evoluţia fenomenelor şi proceselor

colective pe baza observării lor ştiinţifice a culegerii şi prelucrării detaliate a informaţiilor statistice cu scopul

de a formula şi explica legile legităţile şi regularităţile ce le guvernează

Statistica permite deci aprecierea unor parametrii populaţionali prin studiul unui număr redus de

elemente ale populaţiei icircn studiu (ţintă) O populaţie poate fi definită printr-un şir de valori care pot fi grupate

icircn funcţie de parametrul studiat (glicemie colesterol TAD TAS etc) Pentru fiecare astfel de şir se defineşte

o variabilă (care va purta nume propriu glicemie colesterol etc) Practic variabila este considerată o funcţie

ia valori posibil diferite de la un element la altul icircn funcţie de caracteristicile proprii acestora Sunt clasificate

icircn două grupe variabile cantitative (caracteristică măsurabilă) şi calitative (caracteristică ce nu poate fi

măsurată)

La racircndul lor variabilele calitative pot fi

bull Nominale ndash grupuri de elemente ce nu pot fi ordonate (culoarea părului)

bull Nominale ordonate ndash concluziile pot fi grupate (eficienţa unui tratament slabă bună foarte bună)

bull Binare ndash apar numai două posibilităţi (bolnav sănătos)

Variabilele cantitative pot fi

bull Continue ndash o variabilă măsurabilă care poate lua o infinitate de valori

bull Discrete ndash variabile care nu pot lua decacirct valori icircntregi

Statistica descriptivă

Există două ramuri ale statisticii statistica descriptivă şi statistica inferenţială

Statistica descriptivă (după cum rezultă din denumire) se ocupă cu descrierea unor valori obţinute ale unei

variabile studiate

16

Valorile pe care variabila le ia se constituie icircntr-o serie statistică Indicatorii care definesc o variabilă (serie)

sunt

1 Ale tendinţei centrale

Media aritmetică - notată de regulă cu

Mediana - este acea valoare din şirul de date care icircmparte icircn două părţi egale şirul ordonat de valori (atenţie

şirul este ordonat crescător) situacircndu-se la mijlocul seriei statistice

Dacă numărul de valori n este un număr impar atunci mediana este valoarea unde

Dacă n este par deci avem un număr par de valori mediana este definitatilde ca fiind

unde k = n2

Modul - constituie valoarea care apare cel mai des deci valoarea cu numărul cel mai mare de apariţii

2 De dispersie

Amplitudinea - este diferenţa dintre valoarea maximă şi cea minimă

A = Amax - Amin

Amplitudinea relativă - notată A este raportul dintre amplitudinea absolută şi media aritmetică a seriei de

date

Varianţa notată este un indicator de icircmprăştiere a datelor Formula de calcul este

Abaterea standard (S) sau deviaţia standard reprezintă rădăcina pătrată din varianţă (dispersie)

Coeficientul de variaţie se calculează ca un raport procentual icircntre abaterea standard şi valoarea medie a şirului

de valori

Eroarea standard intervine icircn estimarea intervalelor de confidenţă Se calculează astfel

17

3 De asimetrie (skewness) indică distribuţia datelor dacă sunt sau nu distribuite normal

4 De boltire (kurtosis) estimează boltirea sau aplatizarea curbei de distribuţie

Prezentarea descriptivă a datelor se face prin icircnregistrarea datelor culese icircn tabele care să reprezinte icircn mod

sintetic valorile măsurate

Icircn concluzie statistica descriptivă permite

bull Stabilirea comparabilităţii icircntre grupurile de studiu şi aprecierea prezenţei erorilor sau confuziei

bull Reprezentarea datelor icircn tabele permite evaluarea fiecărui pacient şi dacă a existat pierderi din studiu

Statistica inferenţială

Statistica inferenţială (inductivă) este partea de analiză a datelor care permite extrapolarea unei

concluzii trase pe baza unui eşantion spre populaţia ţintă pentru care a fost efectuat studiul

Scopul analizei statistice este de a evidenţia efectul unui tratament sau al unui factor de risc prin date obţinute

din eşantionul studiat spre populaţia ţintă Aceasta implică testarea ipotezelor statistice sau altfel spus testarea

semnificaţiei statistice Este una dintre cele mai importante momente ale studiului Cum rezultatele sunt

obţinute prin studiul unui eşantion există posibilitatea ca acestea să fie datorate icircntacircmplării Testele

statistice ne ajută să apreciem icircn ce măsură rezultatele sunt icircntacircmplătoare şi mai ales icircn ce măsură şi dacă se

pot aplica populaţiei generale Icircn acest scop se impune o valoare limită alfa 005 care reprezintă limita

superioară a probabilităţii ca rezultatul obţinut să fie greşit (datorat icircntacircmplării) Astfel icircn funcţie de tipul

variabilelor şi indicatorii descriptivi aplicaţi şi evaluaţi se aplică teste de semnificaţie statistică (Tabelul 1)

Tabelul 1 Alegerea testelor de semnificaţie statistică

Tipul datelor

18

Diferenţierea variabilelor din punctul de vedere a distribuţiei se face folosind testul de normalitate

Kolmogorov ndash Smirnov

Testul statistic reprezintă metoda de comparaţie a două sau mai multe populaţii prin intermediul unor

variabile observate ale lor

Scopul unui test statistic este de a defini realitatea

Definirea icircntrebării de cercetare (ipoteza clinică)

Tratamentul cu Nebivolol este la fel de eficient ca şi cel cu Valsartan icircn tratamentul

hipertensiunii arteriale

Transpunerea icircntrebării de cercetare icircn termeni statistici (ipoteza statistică)

Media tensiunii arteriale a pacienţilor trataţi cu Valsartan nu diferă semnificativ de media

tensiunii arteriale a pacienţilor trataţi cu Nebivolol

Etapele unui test statistic

1 Formularea problemei icircn termenii ipotezelor statistice

2 Alegerea şi calcularea parametrului statistic al testului

3 Regiunea critică

4 Concluzia testului

1 Formularea problemei icircn termenii ipotezelor statistice

Ipoteza nulă ipoteza care trebuie testată testul efectuacircndu-se sub prezumţia că ipoteza nulă ar

fi adevărată

Ipoteza alternativă acea ipoteză care icircntr-un sens sau altul contrazice ipoteza nulă Această

ipoteză se mai numeşte şi ipoteza de lucru

Ipoteza nulă tipuri

O coadă (ldquoone-tailedrdquo sau ldquoone-siderdquo)

Media este mai mare

Media este mai mică

Două cozi (ldquoone-tailedrdquo sau ldquoone-siderdquo)

Media este egală

2 Alegerea şi calcularea parametrului statistic al testului

Parametrul statistic al testului exprimă icircntr-o anumită formă diferenţa dintre elementele comparate

Ţinacircnd seama de faptul că eşantionul sau eşantioanele utilizate sunt aleator extrase din populaţiile care

fac obiectul testului parametrul statistic este o variabilă aleatoare de selecţie care urmează o anumită

lege de probabilitate

Un parametru statistic al testului bun trebuie să icircndeplinească două condiţii

19

Trebuie să se comporte diferit atunci cacircnd ipoteza nulă H0 este adevărată faţă de situaţia icircn

care ipoteza alternativă H1 este adevărată

Distribuţia de probabilitate a parametrului statistic al testului sub prezumţia că H0 este

adevărată este cunoscută

3 Regiunea critică

- Trebuie să fim capabili să decidem icircn funcţie de valoarea parametrului statistic calculat care dintre

ipoteze cea nulă sau cea alternativă este adevărată

- Dacă valoarea parametrului statistic aparţine regiunii critice ipoteza nulă H0 va fi respinsă şi va fi

acceptată ipoteza alternativă H1

- Dacă valoarea parametrului statistic nu aparţine regiunii critice ipoteza nulă H0 va fi acceptată

- Decidem mărimea regiunii critice

Pentru aceasta trebuie să specificăm mărimea riscului de eroare pe care icircl acceptăm

Pe scurt definim nivelul de semnificaţie notat cu a sau mărimea riscului pe care

suntem dispuşi să ni-l asumăm icircn respingerea ipotezei nule H0 icircn cazul icircn care aceasta

este adevărată De obicei se alege un nivel de semnificaţie icircntre 1 şi 5

Probabilitatea unei erori de tipul I

probabilitatea de respingere a ipotezei nule H0 icircn favoarea ipotezei alternative H1 icircn

condiţiile icircn care H0 este adevărată

probabilitatea unei erori de tipul I se notează cu a şi se mai numeşte nivel de

semnificaţie al testului

Probabilitatea unei erori de tipul II

probabilitatea acceptării ipotezei nule icircn condiţiile icircn care ipoteza alternativă H1 este

adevărată

această probabilitate se notează cu b

- Unilaterală la dreapta ndash valoarea parametrului statistic al testului este mai mare sau egală cu

valoarea din dreapta a intervalului critic

- Unilaterală la stacircnga ndash valoarea parametrului statistic al testului este mai mică sau egală cu

valoarea din stacircnga a intervalului critic

- Bilaterală ndash valoarea parametrului statistic al testului este mai mică sau egală cu valoarea extremă

din stacircnga regiunii critice sau mai mare sau egală cu valoarea extremă din dreapta regiunii critice

valorile extreme ale regiunii critice avacircnd nivele egale de semnificaţie

4 Concluzia testului

- Ipoteza nulă H0 este respinsă dacă valoarea parametrului statistic aparţine regiunii critice

20

- Regiunea critică trebuie astfel aleasă icircncacirct dacă ipoteza alternativă H1 este adevărată

probabilitatea de respingere a ipotezei nule H0 este mai mare decacirct icircn cazul icircn care ipoteza nulă H0

ar fi adevărată

- Acceptarea ipotezei nule H0 atunci cacircnd ipoteza alternativă H1 este adevărată este cunoscută ca şi

eroarea de tipul II

a probabilitatea ei se notează cu b

b măsoară bdquonivelul de eroarerdquo

- Icircn testarea oricărei ipoteze statistice există patru situaţii care determină dacă decizia noastră este

corectă sau nu

Cazuri

H0 este adevărată H0 este falsă

Concluzie H0 se acceptă decizie corectă eroare de tipul

II

H0 se

respinge

eroare de tipul I decizie corectă

Luarea deciziei pe baza valorii probabilităţii p de semnificaţie a testului

Icircn momentul icircn care prelucrăm statistic o serie de date dorim să ştim dacă rezultatele obţinute sunt sau

nu semnificative statistic

Răspunsul la această icircntrebare este dat de valoarea lui p calculată de orice program statistic la

prelucrarea unor date

Icircn cazul testelor statistice ipoteza nulă este respinsă dacă nivelul de semnificaţie este mai mic decacirct

005 iar programele de prelucrare statistică a datelor vor afişa o steluţă () icircn tabelul rezultatelor

21

Dacă p le 005 respingem ipoteza nulă şi acceptăm ipoteza alternativă (am obţinut semnificaţia

statistică)

Dacă p gt 005 acceptăm ipoteza nulă (nu am obţinut semnificaţia statistică)

p = 013

NU respingem ipoteza nulă

Risc de eroare de tip II

α = 005

p = 002

Respingem ipoteza nulă

Risc de eroare de tip I

Semnificaţia lui p

Criteriu de luare a deciziei cu privire la o ipoteză statistică nulă

Cuantifică şansa ca o decizie de respingere a ipotezei nule să fie greşită

Măsură a semnificaţiei statistice şi NU CLINICĂ

22

Semnificaţia lui p (reguli empirice)

001 le p lt 005 rezultatul e semnificativ statistic

0001 le p lt 001 rezultatul e icircnalt semnificativ statistic

p lt 0001 rezultatul e foarte icircnalt semnificativ statistic

p ge 005 rezultatul e considerat nesemnificativ statistic

Limite ale valorii p

Valoarea p NU ne dă informaţii despre

Şansa de beneficiu a unui pacient individual

Procentul de pacienţi care vor avea un beneficiu icircn urma instituirii procedurii medicale

Gradul de beneficiu expectat pentru un anumit pacient

Puterea unui test statistic

Este capacitatea de a detecta o diferenţă acolo unde există

Creşterea volumului eşantionului determină creşterea puterii testului statistic aplicat

Valoarea este icircn relaţie directă cu eroarea de tip II

Puterea = 1 ndash β

Cea mai utilizată modalitate de creştere a puterii unui test statistic este de a creşte volumul

eşantionului

Tipul scalei de măsură ndash testul statistic

Denumire test Interval Nominal Observaţii

Corelaţie Pearson 2 0 Există o relaţie liniară

χ2 0 2

Student 1 1 Doar 2 grupuri

ANOVA 1 1 2 sau mai multe grupuri

Student perechi 1 1 Eşantioane perechi

Măsurători repetate (ANOVA) 1 1 Mai mult de 2 grupuri date

perechi

Inferenţa statistică pe date calitativ e

Tabela de contingenţă 2times2

Riscuri şi raţii

Testul χ2 (testarea asocierii icircn tabela de contingenţă)

Testul Fisher

23

Testul z pentru proporţii

Testul McNemar

Tabela de contingenţă 2times2

Scale de tip nominal (dicotomiale tabela de contingenţă de 2times2) sau ordinal (tabela de contingenţă de

rtimesc)

Frecvenţa absolută (numărul de evenimente per categorie)

Tabela de contingenţă de 2times2 4 categorii

AP = adevărat pozitiv

FP = fals pozitiv

FN = fals negativ

AN = adevărat negativ

Ulcer deschis Ulcer vindecat Total

Recurenţă + AP = 1 FP = 5 = 1+5 = 6

Recurenţă - FN = 7 AN = 16 = 7+16 = 23

Total =1+7=8 =5+16=21 29

Riscuri şi raţii Mărimi ale asocierii

Denumire Formula Definiţie

Rata falşilor pozitivi =FP(FP+AN) Probabilitatea unui test fals + (α)

Rata falşilor negativi =FN(FN+AP) Probabilitatea unui test fals ndash (β)

Sensibilitate =AP(AP+FN) Probabilitatea unui test real + (1- β)

Specificitate =AN(AN+FP) Probabilitatea unui test real ndash (1- α)

Acurateţe =(AP+AN)n Probabilitatea generală a unei decizii corecte

Valoarea predictivă pozitivă =AP(AP+FP) Probabilitatea ca un test pozitiv să fie corect

Valoarea predictivă negativă =AN(AN+FN) Probabilitatea ca un test negativ să fie corect

Riscul relativ =AP(FP+AN)FN(AP+FP)

Rata şansei =(AP∙AN)(FN∙FP)

Riscul atribuabil =AP(AP+FP)-FN(FN+AN)

24

Denumire Formula

Rata falşilor pozitivi = 5(5+1) = 08334

Rata falşilor negativi = 7(7+16) = 03043

Sensibilitate = 1(1+7) = 01250

Specificitate = 16(16+5) = 07619

Acurateţe = (1+16)29 = 05862

Valoarea predictivă pozitivă = 1(1+5) = 01667

Valoarea predictivă negativă = 16(16+7) = 06957

Riscul relativ = 1(5+16)7(1+5) = 2142 = 050

Rata şansei = (1∙16)(7∙5) = 04571

Riscul atribuabil = 1(1+5)-7(7+16) = 01667-03043=-01376

Testarea asocierii icircn tabela de contingenţă

Testul χ2

Nu trebuie utilizat pentru eşantioane de volum mic

Testul este valid doar dacă valoarea expectată (aşteptată) pentru fiecare celulă este cel puţin

egală cu 1 şi frecvenţa absolută observată este de minim 5

Dacă aceste condiţii nu sunt icircndeplinite se aplică testul exact al lui Fisher (Fisherrsquos Exact Test)

Indică dacă cele două variabile sunt sau nu independente DAR NU cuantifică puterea asocierii

dintre ele

Problema S-a investigat icircntr-un studiu asocierea dintre obezitatea (ca factor de risc) şi bolile

cardio-vasculare la persoanele icircn etate (gt 60 ani) Din totalul de 620 persoane investigate s-au

identificat 150 persoane cu obezitate şi boală cardio-vasculară 230 persoane fără obezitate şi

fără boală cardio-vasculară şi 60 persoane fără obezitate dar cu boală cardio-vasculară Există

o asociere icircntre obezitate şi boala cardio-vasculară (df=1 α=005 χ2critic = 384)

Testul χ2 exemplu

H025

Nu există asociere icircntre obezitate şi bolile cardio-vasculare

Obezitatea şi bolile cardio-vasculare sunt independente

H1

Există asociere icircntre obezitate şi bolile cardio-vasculare

Obezitatea şi bolile cardio-vasculare sunt asociate

a = 005 pragul de semnificaţie al testului

urmează o lege cu (r-1)(c-1) grade de libertate

χ2 = parametrul testului χ2

fio = frecvenţa observată

fit = frecvenţa teoretică

Regiunea critică este [χα2 yen)

Pentru α = 005 χα2 = 384

OBSERVAT BCV+ BCV- Total

Obezitate + AP = 150 FP = 180 330

Obezitate - FN = 60 AN = 230 290

Total 210 410 620

TEORETIC BCV+ BCV- Total

Obezitate + = 330times210620 = 330times410620 330

Obezitate - = 290times210620 = 290times410620 290

Total 210 410 620

TEORETIC BCV+ BCV- Total

Obezitate + = 330times210620 = 330times410620 330

26

Obezitate - = 290times210620 = 290times410620 290

Total 210 410 620

TEORETIC BCV+ BCV-

Obezitate + = 112 = 218

Obezitate - = 98 = 192

Deoarece 4177Icirc[384 yen) se respinge H0 cu un risc de eroare de 5

Există asociere icircntre obezitate şi bolile cardio-vasculare

Testul Fisher

Corecţie a testului χ2

Valoarea p asociată parametrului ne dă probabilitatea ca valoarea observată de independenţă să fie

atribuită doar şansei

O valoare p mică indică că există alte cauze decacirct şansa influenţează rezultatul şi astfel cele două

variabile investigate nu sunt independente

Testul Fisher = dispersia corectată a factorului x dispersia corectată a factorilor reziduali

Icircn acest context regula adunării dispersiilor se poate scrie unde

este variaţia lui y pe seama variaţiei variabilei x

este variaţia lui y pe seama influenţei factorilor reziduali (neicircnregistraţi)

este variaţia totală a caracteristicii y

Testul Fisher empiric se calculează după formula

27

se compară cu Ftab pentru nx şi nz grade de libertate la un anumit prag de semnificaţie stabilit

Dacă Fc gt Ftab rezultă că variaţia factorului de grupare x este semnificativă pentru variaţia caracteristicii y

Testul z pentru proporţii

1 Compararea unei frecvenţe observate cu o frecvenţă teoretică

2 Testarea egalităţii a două frecvenţe

Testul z Compararea unei frecvenţe observate cu o frecvenţă teoretică

Scop Investigarea semnificaţiei diferenţei icircntre o frecvenţă teoretică p (icircntr-o populaţie) şi o frecvenţă

observată f pe un eşantion reprezentativ (variabilă calitativă (binare))

Condiţii de aplicare Testul este corect aplicat dacă numărul n al observaţiilor eşantionului este

suficient de mare (n∙p n∙(1-p)gt10

Parametrul

n = volumul eşantionului

Suntem interesaţi de investigarea prevalenţei hepatitei B la personalul care lucrează icircn laboratoarele

clinicilor de boli infecţioase din Transilvania Se ştie din studii anterioare că prevalenţa hepatitei B icircn

populaţia generală din Transilvania este de 9 S-a luat icircn studiu un eşantion de 100 persoane şi s-a

obţinut o prevalenţă a hepatitei B de 6 Există diferenţă semnificativă icircntre frecvenţa hepatitei B la

personalul care lucrează icircn laboratoarele spitalelor de boli infecţioase din Transilvania faţă de

populaţia generală

f = 006 p = 009 n = 100

Ipoteza nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat

faţă de frecvenţa hepatitei B icircn populaţia generală

Ipoteza alternativă test bilateral Există diferenţă semnificativă icircntre frecvenţa hepatitei B la

nivelul eşantionului şi prevalenţa hepatitei B icircn populaţia generală

f = 006 p = 009 n = 100

Pragul de semnificaţie a = 005

Regiunea critică test bilateral (-yen -196 ]Egrave[196 yen)

28

Concluzia testului

Deoarece parametrul statistic calculat al testului nu aparţine regiunii critice se acceptă ipoteza

nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat faţă de

frecvenţa hepatitei B icircn populaţia generală

Testul McNemar

Evaluarea dependenţei variabilelor calitative perechi (dorim să determinăm dacă o anumită

caracteristică este sau nu asociată cu o anumită patologie)

Identificăm n pacienţi care prezintă patologia de interes (eg Cancer bronho-pulmonar) şi n

pacienţi cu aceleaşi caracteristici ca şi primul grup dar care nu o prezintă

Martor = da Martor = nu

Caz = da a b

Caz = nu c d

Testul McNemar - exemplu fumat vs cancer

Martor = da Martor = nu

Cancer = da a = 2 b = 5

Cancer = nu c = 0 d = 3

29

χ2critic(α=005) = 384

32 lt 384 rarr acceptăm ipoteza nulă

Fumatul nu este icircn relaţie cu apariţia cancerului bronho-pulmonar

Inferenţa statistică pe date cantitative

Variabile cantitative continue

Testul z şi Student (t) (o medie sau medii perechi)

Testul z şi Student (t) (testarea a două medii)

ANOVA (ge 3 medii)

Ranguri (variabile cantitative discrete sau cantitative care nu icircndeplinesc condiţia de

normalitate)

Testul sumei rangurilor Wilcoxon

Kruskal-Wallis (ge 3 eşantioane independente)

Friedman (ge 3 eşantioane dependente)

Teste de normalitate variabile cantitative continue

Shapiro-Wilk

Kolmogorov-Smirnov

Shapiro-Wilk

Chi-Square Goodness-of-Fit

Dacă datele urmează o distribuţie normală aplicăm un test parametric

Dacă datele nu urmează o distribuţie normală aplicăm un test de comparare al rangurilor

30

Testul Z de comparare a mediei unui eşantion cu media unei populaţii

Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ

extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie

s2 care se cunoaşte

Condiţii de aplicare

1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru

compararea mediei unui eşantion cu media unei populaţii)

2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal

distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă

3 Talia eşantionului este mare ( ge 30)

Ipoteze

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media

eşantionului şi media populaţiei

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

(-yen -196 ] Egrave [196 yen)

Parametrul testului

n = volumul eşantionului

= media eşantionului

s = deviaţia standard a populaţiei

Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)

Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard

cunoscută

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi

media standard

Condiţii de aplicare

Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se

realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această

condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea

31

Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai

puternic

Numărul de grade de libertate (df) df = n-1

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

Parametrul testului

n = volumul eşantionului

micro0 = media standard

= media eşantionului

s = deviaţia standard a eşantionului

Testul ANOVA compararea mediilor a mai multe eşantioane

H0 = toate mediile sunt egale

H1 = nu toate mediile sunt egale

Condiţii de aplicare

1 Datele sunt independente unele faţă de celelalte

2 Datele fiecărui grup sunt normal distribuite

3 Deviaţia standard este aceeaşi pentru toate grupurile

Id Medicament

A B C D E F

1 5 6 7 10 5 9

2 6 8 8 11 8 8

3 7 7 9 13 6 7

4 8 9 11 12 4 5

32

5 9 10 10 9 7 6

Suma 35 40 45 55 30 35

Media 7 8 9 11 6 7

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =

= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)

Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2

F = (suma pătratelor(icircntre))(suma pătratelor(icircn))

Suma pătratelor (icircntre) = 16times5 = 80

Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60

Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn

interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare

SP df Media pătratelor F = MPicircntreMPicircn

Icircntre 80 5 = 805 = 16 = 1625 = 64

Icircn 60 24 = 6024 = 25

Total 140 29 -

Testul sumei rangurilor Wilcoxon

Aplicat pentru

Un set de observaţii provenite dintr-o valoare ipotetică comună

Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)

Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero

Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace

Suma rangurilor pentru diferenţele negative = 2+3+1 = 6

Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30

33

Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului

egal cu 8 = 0109

Icircnainte După Diferenţa Rang

64 66 -2 2

66 58 8 5

67 68 -1 3

71 65 6 4

72 75 -3 1

76 67 9 6

78 59 19 8

89 74 15 7

Testul Kruskal-Wallis (ge 3 eşantioane independente)

Test de ranguri aplicate pe mai mult de 3 eşantioane

H = parametrul testului

n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)

Tk = suma rangurilor

Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie

pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni

34

df = k-1 (k = numărul de eşantioane)

df = 3-1 = 2

Hcritic(α=005) = 599

H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie

pozitivă şi respectiv biopsie negativă

Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie

a tipului de studiu pe eşantioane perechi)

1 Definirea numărului de tratamente k

2 Obţinerea rangurilor pentru fiecare tratament

3 Sumarea rangurilor fiecărui tratament

4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)

5 Dacă Fr gt Frcritic rarr respingem H0

Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost

măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi

n = 9 k = 3 T12 = 225 T2

2 = 38025 T32 = 38025

Frcritic = 599

Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de

prostată

35

De reţinut

Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei

Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-

of-Fit

Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z

Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t

Compararea mediilor a 3 sau mai multe eşantioane ANOVA

Compararea mediilor a două populaţii (σ) testul Z

Compararea mediilor a două eşantioane (s) testul t

Compararea mediilor a două eşantioane perechi (s) testul t

ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi

cu cel pentru compararea a două eşantioane perechi

Ranguri

Distribuţia datelor nu are importanţă

Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)

Trei sau mai multe eşantioane Kruskal-Wallis

Trei sau mai multe eşantioane perechi Friedman

Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia

Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a

datelor)

Variabile nominale

Un singur eşantion sau eşantioane perechi

Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte

Eşantioane perechi testul Mc Nemar

Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2

Icircn analiza proporţiilor există teste diferite pentru

Compararea unei frecvenţe cu o frecvenţă cunoscută

Compararea a două frecvenţe

Semnificaţia statistică

Valoarea p (p value)

Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor

două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E

posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării

aleatorii

36

Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală

urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii

Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este

probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un

experiment de dimensiunea acestuia

Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că

diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii

diferite

Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca

fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă

ar fi fost adevărată

Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă

1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe

baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De

fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001

2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie

3 Se aplică testul statistic aferent pentru a calcula valoarea p

4 Se compară valoarea p cu valoarea ndash prag

5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe

semnificativă dpdv statisticrdquo

6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e

semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să

conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă

Teste de semnificaţie

Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului

populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)

Testarea ipotezelor implică posibile erori

Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile

sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui

grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul

icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005

ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există

37

nici o diferenţă

Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ

statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de

ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost

ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau

dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă

cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă

semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe

ipotetice variate icircn cazul icircn care ele există

Măsuri ale frecvenţei

Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)

Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate

Generic formula pe care se bazează toate cele trei este

unde x şi y sunt cantităţile de comparat

Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea

unei frecvenţe pe grupe de sex vacircrstă etc

Proporţia implică icircn mod necesar ca x să fie inclus icircn y

Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară

frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp

Pentru calcularea unei rate trebuie ţinut cont de trei aspecte

bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin

bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp

bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo

Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un

tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei

populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei

aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)

38

Indicatori

Rata de incidenţă

Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă

icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii

Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o

perioadă de timp

Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de

timp x

Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei

susceptibili de a dezvolta icircmbolnăvirea studiată

Numitorul poate fi

bull Numărul mediu al populaţiei icircn perioada de timp studiată

bull Mărimea populaţiei icircn mijlocul perioadei de studiu

bull Mărimea populaţiei la icircnceputul studiului

Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă

Este obligatorie menţionarea perioadei de timp

Prevalenţa

Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la

un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă

schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa

momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)

39

Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include

numai cazuri noi respectiv include cazuri noi şi vechi

Rata de atac

Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este

folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp

raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori

Rata persoană-timp

Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din

momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte

migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost

observate

Riscul relativ (RR)

Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment

legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele

prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două

grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la

bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la

bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai

mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo

Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2

Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn

cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă

(Tabelul 1)

Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR

Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la

neexpuşi

40

Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de

culegere a datelor

Odds ratio (OR)

Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin

raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general

studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)

Tabelul 2 Tabelul 2 x 2 pentru calcularea OR

Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală

Rate de mortalitate

Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp

specificată Există mai multe tipuri de rate de mortalitate

o Mortalitate specifică pe sex

o Mortalitate specifică pe rasă

o Mortalitate specifică pe boală

o Mortalitate neonatală

o Mortalitate postneonatală

o Mortalitate infantilă

o Mortalitate maternă

Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP

41

Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de

viaţă şi vacircrsta la care survine decesul dacă este prematur

Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu

Ani de viaţă pierduţi datorat dizabilităţii

Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt

utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru

cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite

grupuri

Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de

risc şi o boală se folosesc riscul relativ şi odds ratio

35 Analiza şi interpretarea datelor

După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date

trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul

Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor

colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului

studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu

plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde

prezenţa biostatisticianului este necesară

Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu

elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat

iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului

iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate

depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori

testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere

clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza

Interpretarea rezultatelor statistice

Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne

motive (număr mic de date) acceptarea ei să fie falsă

Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine

gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia

ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument

de decizie Intervalul de confidenţă

42

Interpretarea statistica ne interpretarea clinică

Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă

Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice

obţinute pe eşantionul studiat

Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare

Ce interpretăm Rezultatele

personale obţinute icircn urma studiului

care au fost prezentate icircn secţiunea bdquoRezultaterdquo

Explicăm rezultatele obţinute

Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale

Interpretarea trebuie să se realizeze icircn

lumina limitelor studiului

contextul cultural social şi educaţional al locului unde s-a realizat cercetarea

contextul a ceea ce se cunoaşte din literatura de specialitate

Interpretăm doar rezultatele personale obţinute icircn urma studiului

Interpretarea statistică nu este tot una cu interpretarea clinică

Interpretarea statistică este importantă

Interpretarea clinică este foarte importantă

Intervalul de confidenţă

Media calculată pe baza unui eşantion nu va echivala media populaţiei

Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului

Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a

populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a

populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)

pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru

orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare

dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de

confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de

date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de

5

Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel

Dacă valoarea p este mică

Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare

aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o

medie diferită Diferenţa este semnificativă dpdv statistic

43

Icircn continuare

Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa

reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică

pentru a fi interesante din punct de vedere ştiinţific

Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC

oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care

este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a

obţine o concluzie clară

Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o

diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că

datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din

punct de vedere ştiinţific

Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul

detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat

Erorile studiilor medicale

Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura

anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară

caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea

asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri

legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias

Erorile potenţiale icircn studiile epidemiologice

1 Erori icircntacircmplătoare

2 Erori sistematice

3 Confuzia

4 Validitatea

1 Erori icircntacircmplătoare

Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a

parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel

de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot

fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii

(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor

de măsură (eroarea de măsurare)

44

2 Erori sistematice

Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate

care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu

acurateţe mare Acurateţea nu este afectată de mărimea eşantionului

Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de

experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea

dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus

şi greu de cuantificat (consum de alcool personalitate etc)

Principalele tipuri de erori din această categorie sunt

bull Biasul de selecţie

bull Biasul de informaţie

Biasul de selecţie

Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul

trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion

inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale

persoanelor incluse

Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se

ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia

Biasul de informaţie

Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de

instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze

expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere

nesemnificativă sau chiar să nu şi-o amintească de loc

3 Confuzia

Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune

prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este

cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă

de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte

important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor

protector

4 Validitatea

Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă

Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte

estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional

Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă

45

conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se

demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)

Validitatea externă se poate realiza numai dacă studiul este valid intern

Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii

studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de

studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt

laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi

validă din punct de vedere intern)

3 6 Prezentarea rezultatelor

După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite

Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor

icircntr-o formă bdquodigerabilărdquo este necesară

Scopul prezentării datelor

1 Transmiterea concluziilor studiului

a Datele corecte şi importante merită comunicate

b Datele trebuie să confirme sau să infirme ipoteza studiului

c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală

2 Acordarea posibilităţii altor cercetători să aprecieze studiul

a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti

b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor

prezentate

Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru

fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie

statistică

Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de

valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras

(Tabel 3)

Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)

46

Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct

numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor

precum şi prezentarea acestora sub formă inteligibilă

Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care

convin cercetătorului

Prezentarea datelor se poate face

1 Figuri şi tabele icircn articole scrise

2 Figuri şi tabele icircn prezentări orale

3 Figuri şi tabele icircn postere

4 Text scris sau incluse icircn text

5 Site-uri de WEB

Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor

Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie

Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele

exprimacircnd exact ceea ce acestea exprimă

Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate

anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel

să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se

acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca

mai sus sugestive sunt formatele simple şi puţin icircncărcate

Dacă nu există reguli impuse se respectă

1 Mesaj simplu fără falsificarea datelor

2 De obicei este necesar atacirct tabelul cacirct şi graficul

3 Să fie simplu şi clar

Tabele

Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile

coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică

elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de

1 Se folosesc doar linii orizontale

2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn

evidenţi prin linie de separare (Tabelul 4)

Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland

Noua Zeelandă)

(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)

47

3 Numerele sunt aliniate icircn funcţie de virgulă

4 Indicii statistici sunt explicaţi sub tabel

5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană

6 Abrevierile pot fi folosite

7 Numărul de zecimale trebuie limitat la maxim două

8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel

9 Plasarea legendei este obligatorie sub tabel

10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)

Icircn cazul prezentărilor orale sau a posterelor este indicat ca

1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării

2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte

3 Folosirea de simboluri este permisă

Clasificarea tabelelor

Tabelele se clasifică după

i) conţinut

bull cu distribuţii de frecvenţe

bull de clase de frecvenţe

bull de contingenţă

ii) structura

bull cu doua coloane

bull cu subclasificări

bull ldquomasterrdquo

Tabele ce conţin distribuţii de frecvenţe

O modalitate comodă de a prezenta o mulţime de date brute este

1 Se ordonează datele in ordine crescătoare

2 Se determine frecvenţa fiecărei valori

3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane

(Tabelul 5)

Tabelul 5 Distribuţii de frecvenţă absolută

48

Tabelul claselor de frecvenţe

1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă

2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)

Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)

Tabele de contingenţă

1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a

tabelelor de contingenţă

2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a

combinaţiilor de perechi ordonate de valori

3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre

a factor de risc si

b starea sănătăţii

4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)

5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)

Tabelul 7 Tabel de contingenţă 2 x 2

49

Grafice

Există două categorii de moduri grafice sub care se pot prezenta datele

1 Ilustraţii şi fotografii

2 Grafice

1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă

pentru lucrare

2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit

Putem vorbi despre mai multe tipuri de grafice

bull Grafice pentru reprezentarea datelor cantitative

1048707 Grafic cartezian (X Y)

1048707 Histograma

1048707 Poligonul de frecvenţe

1048707 Diagrama bdquoscatterrdquo

bull Grafice pentru reprezentarea datelor calitative

1048707 Grafic cu bare

1048707 Diagrama tip bdquoboxplotrdquo

1048707 Diagrama bdquopierdquo

1048707 Cartograma

Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi

dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)

Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)

Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie

Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)

Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)

50

Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir

de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele

două variabile studiate (Figura 6)

Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2

(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2

rămacircne aproximativ constantă)

Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea

comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea

comparativă a mai multor variabile

Figura 7 Grafic calitativ cu bare

51

Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo

Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două

posibilităţi reprezentate grafic este mai frecventă (Figura 8)

Figura 8 Reprezentare tip bdquopierdquo

Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli

sau a oricărui element comparativ Se foloseşte de epidemiologi

Rezultate

Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare

Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o

manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu

explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția

bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la

ilustraţii tabele grafice

Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi

nici rezultatele care invalidează eventual ipoteza

Discuţii

Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd

cultura ştiinţifică şi inteligenţa autorilor

Acest capitol răspunde la trei obiective

Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia

calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de

selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează

rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv

52

este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn

care a fost abordată problema fără a face o revistă a literaturii

Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea

rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul

Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor

afirmaţii nesusţinute de conţinutul lucrării

Concluzii

Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate

să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie

Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de

concluzii va scădea valoarea lucrării

Bibliografia (lista referinţelor citarea icircn text)

Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn

lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente

Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli

- să conţină cele mai importante şi recente lucrări

- să includă numai lucrări publicate

- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate

Bibliografie

Elisabeta Jaba ndash Statistică Ed Economică 1998

Mihai Ţarcă ndash Statistică volI Ed UAIC 1979

Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale

Ed University Press 2009

Sorana Daniela Bolboacă ndash Metodologia cercetării curs

53

Page 2: cercetarea medicala - metodologie

1 Cercetarea ştiinţifică medicală

Progresele tehnice incontestabile din ultima perioadă cu repercusiuni favorabile asupra evoluţiei

generale a societăţii umane au contribuit şi la apariţia a numeroși factori de risc care pot influenţa starea de

sănătate

Icircncercările de a depista corelaţiile dintre starea de sănătate sau de boală şi factorii

de risc de a evalua mecanismele prin care ei acţionează de a găsi remediile medicamentoase sau profilactice

nasc o serie de icircntrebări răspunsul la aceste icircntrebări fiind adus de cercetarea ştiinţifică

Un proiect de cercetare pe baza căruia se va desfășura un studiu clinico-epidemiologic

icircşi găseşte originea icircn

bull curiozitatea cercetătorului pentru o problemă medicală

bull icircncercarea de a descrie unele inadvertenţe existente icircntre ceea ce se observă şi ceea ce ar trebui să fie icircn

practica medicală

bull calităţile de observator şi experienţa profesională a cercetătorului

bull abilitatea cercetătorului de a găsi cele mai eficiente metode de rezolvare a

problemelor ivite

2 Scopul justificarea şi calităţile unui studiu medical

Scopul unui studiu de cercetare este de a da răspuns la icircntrebări cu privire la

bull cauzalitate la documentarea unei relaţii stracircnse icircntre unul sau mai mulţi factori de risc şi boală

bull istoria naturală a unei boli sau dinamica acesteia icircncepacircnd cu momentul impactului factorului de risc

(inclusiv a factorilor de natură biologică) cu macroorganismul urmacircnd apoi fazele incubaţia bolii perioada de

stare şi faza finală urmată de vindecare imunitate cronicizare sau deces Dacă pentru bolile infecţioase aceste

faze cu precădere primele două sunt mai bine definite icircn bolile neinfecțioase debutul este imprecis iar

perioada de latenţă este de obicei asimptomatică deci mai greu se poate depista boala icircn aceste faze

bull prognosticul bolii aprecierea cacirct mai aproape de certitudine a evoluţiei unei boli Factorii prognostici sunt

apreciaţi prin studii epidemiologice de cohortă icircn care se pot evalua indicatori ca supravieţuirea unui bolnav la

5 ani după un anumit moment cheie din istoria naturală a bolii rata de fatalitate rata de răspuns la tratament

ratele de recidive şi remisii ale bolii

bull tratamentul eficienţa şi eficacitatea unui tratament sunt frecvente subiecte de cercetare pentru abordarea lor

se apelează la trialuri clinice controlaterandomizate

Se pot analiza de asemenea scheme noi de tratament eficienţa unor preparate sau scheme de aplicare a

preparatelor profilactice (vaccinuri dezinfectanţi etc)

2

bull profilaxia icircmbolnăvirilor include totalitatea măsurilor care pot influenţa cauzele modificabile ale unei boli şi

se efectuează icircn patru trepte profilaxia primordială primară secundară şi terţiară

Justificarea studiului clinic

Justificarea studiului pleacă de la informaţiile existente legate de subiectul pe care cercetarea

intenţionează să icircl dezbată informaţii existente icircn literatura de specialitate

Cercetarea bibliografică permite identificarea unor lipsuri icircn legătură cu problema luată icircn studiu

inexistenţa de date referitoare la o icircmbolnăvire dintr-o zonă geografică (ţară judeţ comunitate) explicarea şi

emiterea unor soluţii de remediu Toate acestea ar putea fi elemente care justifică iniţierea şi derularea unui

studiu

Icircn justificarea studiului se poate insista pe

bull caracterul nou actual inedit al problemei

bull un nivel ridicat al morbidităţii sau mortalităţii unui fenomen de sănătate

bull gravitatea evenimentului

Calităţile studiului de cercetare

Un bun studiu de cercetare trebuie să fie pertinent nou fezabil să respecte etica medicală

Un studiu este pertinent cacircnd are repercusiuni asupra viitorului clinic al unui fenomen de sănătate pertinența

practică icircnsemnacircnd o mai bună cunoaştere a bolii a prognosticului ei ameliorarea tehnicilor de diagnostic şi

de tratament etc

O altă cerinţă se referă la ineditul studiului faptul de a fi nou icircn sensul de a aduce informaţii noi să nu repete

un studiu deja finalizat şi cu concluzii ferme

Cercetătorul trebuie icircnainte de a demara studiul icircnainte de a investi timp bani energie să estimeze dacă

studiul este fezabil Icircn acest sens trebuie să se asigure că

bull are un număr suficient de subiecţi determinări de laborator etc pentru a putea trage concluzii adecvate

bull nu există constracircngeri tehnologice sau financiare

bull studiul este accesibil şi acceptat de populaţie

bull nu are costuri de timp dar mai ales financiare mari

bull nu are scopuri prea ambiţioase sau scopuri multiple icircn general un studiu ar trebui să aibă un singur scop să

găsească rezolvarea la o singură icircntrebare

Studiul medical trebuie să respecte etica medicală cele patru principii

bull interesul şi beneficiul cercetării

bull inocuitatea (nevătămarea cercetării)

bull respectul faţă de persoanele incluse icircn studiu (respectul intimităţii persoanelorconfidenţialitatea datelor)

bull păstrarea echităţii şi respectul valorilor morale

In efectuarea unui studiu este necesară parcurgerea următoarelor etape

1 Pregătirea studiului

3

2 Elaborarea protocolului

3 Culegerea informaţiilor (datelor)

4 Prelucrarea datelor

5 Analiza şi interpretarea rezultatelor

6 Prezentarea rezultatelor

7 Redactarea studiului

3 Etapele unui studiu de cercetare

31 Pregătirea studiului de cercetare

Pregătirea studiului de cercetare comportă mai multe sub-etape

bull Documentarea bibliografică

bull Definirea fenomenului

bull Formularea temei de cercetare

bull Aspecte manageriale

Documentarea bibliografică

Cercetarea bibliografică are misiunea de a realiza un compromis icircntre excesul de documente (anual se

publică icircn icircntreaga lume peste 20000 de reviste cu caracter medical) şi pierderea de informaţii pertinente

Cercetarea bibliografică necesită o selectare şi o evaluare a literaturii de specialitate pe o anumită problemă şi

se realizează prin parcurgerea a trei etape

a) Prima etapă este cercetarea bibliografică propriu-zisă adică identificarea publicaţiilor care se referă la

subiectul icircn discuţie

Etapele documentării bibliografice sunt

bull Definirea şi delimitarea precisă a subiectului de cercetat

bull Stabilirea unei liste de bdquocuvinte cheierdquo prin lectura referinţelor bibliografice

bull Traducerea icircn limbi de circulaţie internaţională

bull Stabilirea unei liste cu documentele de cercetat

bull Consultarea unor tratate sau cărţi de referinţă

bull Consultarea publicaţiilor primare

bull Redactarea fişelor bibliografice şi aranjarea lor icircn ordine alfabetică

bull Introducerea referinţelor bibliografice icircn textul propriu-zis

Literatura primară de specialitate

Reprezintă toate materialele scrise care conţin studii originale

Articole ştiinţifice Au calitatea esenţială că informaţiile publicate sunt recente intervalul de timp scurs de la

scriere la publicare fiind icircn general foarte scurt

4

Teze de doctorat licenţă Se pot găsi icircn bibliotecile instituţiilor de icircnvăţămacircnt superior Sunt utile pentru că

icircn general tratează pe larg o anumită problemă care poate fi de interes avacircnd şi o bibliografie recentă

Brevete şi mărci Sunt acele sisteme de protecţie a produselor şi tehnologiilor Sunt utile icircn general icircn

cercetarea experimentală

Literatura secundară de specialitate

Tratate de specialitate Sunt foarte importante icircn faza incipieintă a unui studiu pentru aprofundarea problemei

de cercetat Informaţiile prezente icircn astfel de publicaţii sunt ordonate cu noţiuni de bază definiţii teorii

posibile etc

Cărţi de referinţă Sunt monografii care studiază pe larg un fenomen putacircnd fi foarte utile atacirct cercetătorilor

debutanţi cacirct şi celor iniţiaţi

Literatura terţiară de specialitate este reprezentată de indexuri reviste cu extrase de articole şi rezumate

Cercetarea bibliografică bdquoon-linerdquo permite accesul la nenumărate surse de informare utilizacircnd icircn acest scop

motoare de căutare

b) A doua etapă este lectura critică activă a publicaţiilor selectate pentru a judeca valoarea publicaţiilor

indiferent dacă este vorba de calitatea cercetării sau de pertinenţa rezultatelor publicate

Evaluarea corectă critică a unui articol va permite cititorului să aprecieze dacă publicaţia este credibilă

rezultatele corespund realităţii (validitatea internă) respectiv dacă informaţiile conţinute icircn publicaţie sunt

aplicabile icircn practica medicală dacă se pot generaliza dacă sunt aplicabile icircn proiectul de cercetare al

viitorului investigator (validitatea externă)

Lectura critică a literaturii medicale se bazează pe folosirea unei grile de lectură care are meritul de a putea fi

aplicată tuturor tipurilor de publicaţii Această grilă are 8 criterii de evaluare pentru fiecare criteriu trebuie să

se răspundă la următoarele icircntrebări

bull este posibil să se găsească icircn articol informaţia pentru criteriul icircn cauză

bull dacă criteriul abordat este corect

bull dacă criteriul este incorect icircn ce măsură ameninţă validitatea studiului

Cele 8 criterii de evaluare sunt

1 Obiectivul vizează următoarele preocupări medicale

bull istoria naturală a unei boli evoluţia şi prognosticul ei

bull performanţa unui test diagnostic

bull impactul unei intervenţii (terapeutice de depistare de prevenţie sau de educaţie)

Lectura critică va aşeza articolul icircn una din aceste situaţii apoi icircn raport cu obiectivul va stabili dacă are

ipoteze de verificat

5

2 Tipul de studiu Cititorul trebuie să recunoască planul de studiul pentru a verifica dacă tipul de studiu este

adaptat icircntrebării puse Va merge progresiv cu urmărirea de la raportul de caz-seria de cazuri la studiul

transversal studiul caz-control studiul de cohortă şi trialul controlat

3 Factorii studiaţi (variabila independentă) pot fi factori de expunere sau de intervenţie Cititorul trebuie să

poată recunoaşte factorul să aprecieze cum a fost măsurat dacă s-a folosit aceeaşi metodă de măsurare pentru

loturile icircn studiu ce metodă de comparaţie s-a folosit dacă sunt erori (factor de confuzie)

4 Criteriul de raţionament este evenimentul sau situaţia presupusă a fi rezultatul factorului studiat boala

decesul supravieţuirea complicaţiile etc Definirea precisă şi metoda de măsurare a rezultatului expunerii va

permite cititorului să aprecieze validitatea informaţiilor

5 Populaţia studiată (eşantionul) Se va urmări dacă este definită populaţia de referinţă şi populaţia de

studiat analizacircndu-se corectitudinea selecţiei randomizarea proporţia de subiecţi la sfacircrşitul studiului

validitatea externă a rezultatelor

6 Analiza datelor Cititorul trebuie să aprecieze dacă s-au examinat toate erorile inclusiv factorul de confuzie

dacă nu validitatea studiului ar putea fi compromisă

7 Rezultatele Principalele aspecte pe care cititorul le va urmări la acest capitol sunt dacă ele se datoresc

numai şansei dacă s-a făcut calculul statistic dacă s-a apreciat relaţia expunere-efect (RR OR RA) dacă a

fost apreciată semnificaţia clinică sau biologică care nu este identică cu semnificaţia statistică

8 Sinteza lecturii critice analizează concluziile autorilor dacă ele răspund icircntrebărilor formulate la icircnceputul

studiului dacă rezultatele sunt aplicabile la populaţia studiată dacă rezultatele sunt acceptabile pentru practica

proprie a cititorului dacă rezultatele justifică vreo schimbare icircn practica clinică respectiv vor ameliora starea

pacienţilor Această abordare cere cititorului cunoaşterea noţiunilor de bază icircn metodologia cercetării

ştiinţifice fiind vorba icircn acelaşi timp şi de un demers clinic

c) A treia etapă icircn cercetarea bibliografică constă icircn combinarea datelor din mai multe studii referitoare la

acelaşi subiect şi care se realizează prin meta-analiză Tehnica meta-analizei permite să se sporească

eficacitatea testării ipotezelor să crească forţa statistică a rezultatelor şi să se obţină informaţii care nu pot fi

convenabil extrase din fiecare cercetare

Definirea fenomenului

Definirea fenomenului se bazează pe

bull Cunoaşterea prealabilă a problemei prin documentare riguroasă documentare care poate justifica pertinenţa

temei propuse (revista literaturii de specialitate)

Icircn prima etapă se cercetează bibliografia propriu-zisă adică se identifică publicaţiile care se referă la subiectul

icircn discuţie apoi se vor selecta publicaţiile necesare studiului apreciind validitatea lor (problemele de

documentare bibliografică vor constitui un capitol separat)

bull Formularea unei ipoteze ştiinţifice sub-etapă care reprezintă fondul problemei

6

Ipoteza este o afirmaţie (nu o icircntrebare) despre o posibilă relaţie icircntre factorii studiaţi şi criteriile de

raţionament Ipoteza poate fi ipoteză ldquonulărdquo - nu există această relaţie şi ldquoalternativărdquo - există relaţia Ipoteza

va trebui apoi dovedită sau respinsă testul statistic calculează probabilitatea conform căreia asociaţia observată

este reală sau ea survine din icircntacircmplare

bull Motivarea organizării studiului Trebuie făcută o motivare corectă legată de inexistenţa unor studii

referitoare la problema pe care o va dezbate studiul

Formularea temei de studiu

Pentru formularea temei de studiu trebuiesc menţionate obiectivul sau obiectivele şi tipul de studiu ales pentru

cercetarea respectivă Există icircn general patru tipuri de obiective

bull obiective care se referă la evoluţia şi prognosticul unei icircmbolnăviri obiective prin care se icircncearcă

icircnţelegerea şi cunoaşterea unor evenimente ce pot să apară la un pacient pe parcursul bolii

bull obiective care se referă la etiologia bolii (cauze de natură bacteriană virală parazitară) sau la cauzalitate

(relaţia factor de risc-boală)

bull obiective legate de performanţa unor teste de diagnostic sau de screening de evaluare a strategiei de

diagnostic sau de interpretare a unui test

bull obiective care se referă la impactul unei intervenţii evaluarea unei intervenţii terapeutice de depistare a unor

boli de prevenţie de educare pentru sănătate

Obiectivele unui studiu se icircmpart icircn obiectivul major unul din cele patru enumerate şi obiective

secundare care pot aborda şi alte fenomene biologice decacirct cel major cu condiţia să nu altereze realizarea

acestuia Alegerea tipului de studiu este stracircns legată de obiectivul ales Dacă obiectivul este descrierea

distribuţiei caracteristicilor unei populaţii aprecierea frecvenţei unui fenomen de sănătate analiza acelui

fenomen icircn funcţie de timp loc persoană se va alege un studiu epidemiologic descriptiv studiu care nu are o

ipoteză fixată anterior O ipoteză se poate formula ca rezultat al studiului descriptiv dar nu se va face

verificarea ei icircn cadrul studiului Dacă intenţia studiului este de a emite o judecată asupra unei posibile relaţii

icircntre factorii studiaţi atunci problema de cercetat este fundamentată de o ipoteză care trebuie verificată

dovedită iar studiul care realizează acest lucru respectiv limitele studiilor utilizate

Aspectele manageriale

Aspectele manageriale includ

bull justificarea bugetului estimarea sumei necesară realizării studiului și apreciarea durate studiului

bull defalcarea bugetului pe necesități legate de achziționare de aparatură reactanți truse etc pentru personal

(munca depusă pregătire deplasări icircn teren participări la congrese sau conferințe documentare) materiale

consumabile etc

7

32 Elaborarea proiectului

Protocolul de cercetare este un document care emite obiectivul și ipoteza studiului definește condițiile de

desfășurare și realizare a viitorului studiu clinic Elaborarea protocolului este importantă pentru cercetătorii

participanţi la studiu comisiile de etică şi finanţatori

Protocolul include mai multe formulare care trebuie să cuprindă

a) Titlul proiectului

b) Sumarul proiectului

c) Descrierea proiectului

d) Normele deontologice de cercetare

e) Modalitățile de diseminarea și valorificarea rezultatelor

f) Perspective de continuare a cercetării

g) Anexe

Prezentarea proiectului va include următoarele fișiere

bull resursele umane (membrii echipei afilierea acestora)

bull relevanța temei pentru dezvoltarea cunoașterii icircn domeniu

bull stadiul actual al cunoașterii și bibliografia aferentă

bull justificarea studiului

bull enunțarea obiectivelor și ipoteza de lucru

bull metodologia propriu-zisă

Referitor la metodologia utilizată vor trebui menționate

bull factorulfactorii studiați care reprezintă variabila independentă respectiv dacă este cazul modalitățile de

măsurare

bull criteriile de raționament- variabila dependentă (situația sau evenimentul ce se presupune a fi rezultatul

factorului studiat cum ar fi boala handicapul complicații decesul)

bull tipul de studiu care se va aplica icircmpreună cu design-ul acestuia

bull eșantioanele de lucru și modalitățile de eșantionaj

bull metodele de culegere și de prelucrare a datelor

bull planificarea activităților

bull structura bugetului fiind eligibile următoarele categorii de cheltuieli de capital (echipamente software

upgrading) pentru personal (full sau part-time instruire asigurări de sănătate) de informare (documentare

abonamente) mobilități (vizite la alte unități de cercetare participări la

congrese) materiale consumabile (truse reactanți papetărie) valorificare a rezultatelor (lucrări științifice de

etapă sau lucrarea finală) cheltuieli indirecte (de regie)

bull modalităţile de valorificare a rezultatelor

bull legături de alte proiecte

8

Protocolul mai conține anexe curriculum vitae al investigatorului principal și al coinvestigatorilor

calendarul activităților avizul Comisiei de etică documente speciale și

consimțămacircntul informat icircn cazul studiilor pe subiecți umani

Icircnainte de implementare protocolul va fi verificat de experți pentru eligibilitate (dacă sunt icircndeplinite

condițiile de acceptare finanțare) calitate și pertinență icircn sensul că protocolul trebuie să fie clar exprimat

corect icircntocmit bine așezat și cu repercursiuni favorabile pentru viitor

33 Culegerea informaţiei

Pentru a realiza o cercetare medicală culegerea datelor este prima etapă şi realizează icircn funcţie de

obiectivele propuse tipul studiului timpul disponibil şi resurse umane şi financiare

Există două mari posibilităţi de culegere

bull Icircn funcţie de elementele studiate

o Culegerea exaustivă Toţi subiecţii populaţiei pe care dorim să o studiem Greu de realizat din cauza

costurilor foarte mari sau a alterării populaţiei de studiu

o Prin eşantionare Este metoda folosită icircn studii medicale

bull Icircn funcţie de durata culegerii

o Transversală Se studiază un grup la un moment dat

o Longitudinală Extinsă in timp

- Retrospectivă ndash icircnregistrări medicale

- Prospectivă ndash date culese la intervale prestabilite de timp

Populaţia ţintă

Este orice colectivitate icircntreagă de oameni animale plante sau obiecte de la care putem colecta date Populaţia

ţintă este icircntregul grup care ne interesează pe care dorim să-l descriem sau să tragem concluzii despre el

Pentru a putea realiza generalizări spre populaţia ţintă deseori suntem obligaţi să folosim un eşantion (selecţie)

care icircnsă trebuie să fie reprezentativ pentru populaţia pe care vrem să o studiem Pentru fiecare populaţie de

studiu sunt posibile mai multe eşantioane Pe baza acestor eşantioane se calculează un estimator Pe baza

acestui estimator calculat care poate fi medie aritmetică procent etc se pot trage concluzii despre icircntreaga

populaţie Este foarte important ca investigatorul să definească foarte atent şi complet populaţia icircnainte de a

realiza eşantionul inclusiv descrierea criteriilor de includere şi excludere icircn populaţia de studiu

Eşantionul

Un eşantion este practic un grup de elemente selectate dintr-un grup mai extins (populaţia ţintă) Studiind

eşantionul selectat se pot trage concluzii despre grupul de unde a fost ales (populaţia ţintă)

Este icircn general ales pentru studiu pentru că

bull Populaţia ţintă este prea mare şi nu poate fi studiată ca icircntreg

bull Nu avem acces din diverse motive decacirct la parte din populaţia de studiu

9

bull Un studiu pe icircntreaga populaţie poate distruge populaţia

bull Eşantioanele pot fi studiate mai rapid

bull Costul şi resursele necesare studiului sunt mai reduse

Numărul elementelor dintr-un eşantion se numeşte talia sau volumul selecţiei

Acesta fiind icircn general mai mic decacirct icircntreaga populaţie poate fi observat icircn detaliu iar dacă este reprezentativ

se pot afla prin intermediul său proprietăţile populaţiei ţintă

Eşantionul trebuie să fie reprezentativ pentru populaţia generală De aceea dintre metodele de eşantionare se

folosesc tehnicile de randomizare Trebuie să satisfacă două condiţii principale

bull condiţie de ordin cantitativ talia să fie suficient de mare

bull condiţie de ordin calitativ trebuie extras aleator din populaţia ţintă

Metode de eşantionare

Putem vorbi icircn linii mari de două posibilităţi de eşantionare prin metode probabilistice şi prin metode

nonprobabilistice

Eşantionarea probabilistică este metoda cea mai folosită icircn studiile medicale fiind şi cea indicată pentru a

realiza reprezentativitatea calitativă

Icircn medicină se folosesc patru tipuri de eşantionări

1 Simplu randomizat

2 Sistematic

3 Stratificat

4 Cluster (icircn cuiburi)

1 Eşantionul simplu randomizat Fiecare element din populaţia ţintă are o şansă egală non zero de a fi

inclus icircn eşantion Se ia la icircntacircmplare un număr de elemente egal cu talia eşantionului Dezavantajul acestui tip

de eşantionare este că presupune cunoaşterea icircntregii populaţii ţintă

2 Eşantionul sistematic După aflarea taliei eşantionului şi a populaţiei ţintă se calculează factorul de

eşantionare k icircmpărţind talia populaţiei ţintă la volumul eşantionului Apoi fiecare al k-lea element este

selectat spre includere

Acelaşi mare dezavantaj apare şi icircn acest caz fiind obligatorie cunoaşterea icircntregii populaţii de studiu

3 Eşantionul stratificat Există icircn cele mai multe cazuri probleme medicale care studiindu-se pe eşantion

prezintă variabilităţi icircn funcţie de caracteristicile populaţiei (sex vacircrstă nivel de pregătire etc) Icircn acest caz

este obligatorie realizarea similitudinii demografice a eşantionului cu populaţia de studiu Din date provenite

de la Centrul de Statistică putem dezvolta ca procente o structură a populaţiei Această structură trebuie să se

regăsească (procentual) şi icircntre membrii eşantionului O importantă şansă ca reprezentativitatea calitativă să fie

corectă este conferită de respectarea

acestei similitudini demografice

10

4 Eşantionul bdquoclusterrdquo sau icircn cuiburi Icircn cazul unui studiu amplu cu scop de a investiga populaţia unei

icircntregi ţări sau regiuni putem ajunge icircn imposibilitatea de a alege şi mai ales investiga indivizi răspacircndiţi prin

icircntreaga zonă Din acest motiv se desemnează la icircntacircmplare un număr calculabil de

grupuri populaţionale extinse icircn toată zona de studiu Aceste grupuri poartă numele de bdquocuiburirdquo La nivelul

fiecărui bdquocuibrdquo se aplică o tehnică precedentă de selecţie a cazurilor Se poate sau de cele mai multe ori se face

la nivel de bdquocuibrdquo stratificarea iar apoi selecţia propriu-zisă se realizează sistematic sau simplu randomizat

Este metoda de eşantionare cel mai frecvent utilizată icircn cercetarea medicală de amploare Pentru ca eventualele

erori să nu se poată strecura s-a definit şi un indice DEF (design effect) cu care trebuie multiplicată talia

selecţiei care pentru eşantionarea icircn bdquocuiburirdquo este egal cu 2 astfel putem obţine şi o reprezentativitate

calitativă dar şi una cantitativă

Eşantionarea nonprobabilistică este o metodă neindicată icircn studiile medicale datorită lipsei de forţă icircn ceea ce

priveşte posibilitatea de aplicare a concluziilor asupra populaţiei de studiu

Se definesc şi icircn acest caz patru metode

1 Eşantion de convenienţă Membrii unui astfel de eşantion sunt aleşi numai pentru că sunt la icircndemacircnă

disponibili de a răspunde le un eventual chestionar

2 Eşantion pe cote Similar cu tipul de eşantion stratificat se referă la faptul că selecţia se face formacircnd

eşantionul din primele 30 de persoane care respectă un criteriu impus

3 Eşantion cu un scop Elementele incluse icircn eşantion sunt alese după un criteriu care exclude din start marea

majoritate a populaţiei

4 Eşantion raţional Selecţia se face prin prisma unui raţionament al celui care conduce studiul

Parametru şi estimator

Parametrul este o valoare de obicei necunoscută (şi care trebuie să fie estimată prin studiu) folosită pentru a

reprezenta o anumită caracteristică a populaţiei de studiu De exemplu media populaţiei (icircnălţime) este un

parametru populaţional Raportat la o populaţie parametrul este o valoare fixă şi exactă care nu variază

Fiecare eşantion extras din populaţie va indica o valoare a mediei care nu poate decacirct să estimeze parametrul

Icircn general parametrii sunt notaţi cu litere greceşti (ex Media = μ)

Estimatorul este o valoare calculată dintr-un eşantion studiat Este folosit pentru a putea aprecia parametrul

populaţional pe care icircn căutăm Este de asemenea posibil ca dintr-o populaţie să formăm mai multe eşantioane

mediile lor de cele mai multe ori nefiind identice icircntre ele şi nici identice cu media populaţiei Estimatorii

sunt notaţi cu litere latine (ex Media = μ)

Dacă valoarea mediei calculată pe eşantion este de exemplu 168 cm atunci putem estima ca valoarea mediei

icircn populaţie este 168 cm

11

Tipuri de culegere a datelor

1 Culegere de tip eşantion reprezentativ Grupul de indivizi incluşi icircn studiu sunt reprezentativi (calitativ şi

cantitativ) pentru populaţia generală Poate fi utilizat pentru studii descriptive (cel mai frecvent) dar uneori şi

pentru studii analitice

Este necesar pentru acest tip de culegere a datelor ca iniţial să fie cunoscută talia eşantionului (calculabilă icircn

funcţie de prevalenţă şi precizie) Pentru evaluarea datelor culese se utilizează tabelul de contingenţă 2 x 2

astfel (Figura 1)

Figura 1 - Tabelul de contingenţă 2 x 2

Unde

a ndash persoane expuse unui factor de risc care au boala studiată

b ndash persoane expuse unui factor de risc care nu au boala studiată

c - persoane neexpuse unui factor de risc care au boala studiată

d - persoane neexpuse unui factor de risc care nu au boala studiată

După aranjarea datelor icircn tabelul de contingenţă (2 x 2) se poate icircncepe analiza statistică a datelor atacirct ca

procente calculabile cacirct şi din punct de vedere a aplicării de teste statistice pentru elucidarea semnificaţiei

statistice

Este posibilă din acest tip de culegere de date calcularea

1 Prevalenţei unei boli

2 Frecvenţei expunerii

3 Gradul de asociere icircntre factorul eventual de risc şi boala

2 Culegerea de tip expus ndash neexpus Icircmparte subiecţii icircn două categorii expuşi sau neexpuşi factorului de risc

studiat Ca evoluţie următoare a studiului după o astfel de culegere a datelor se poate evalua icircn timp apariţia

icircmbolnăvirii despre care se efectuează studiul Icircn timp longitudinal prospectiv se poate calcula dacă factorul

studiat reprezintă un risc de icircmbolnăvire este indiferent sau chiar este cu efect protectiv Numărul subiecţilor

din cele două grupuri poate fi egal sau poate fi diferit Numărul acestora poate fi calculat icircn vederea obţinerii

unei bune reprezentativităţi cu ajutorul formulelor de selecţie Avacircnd icircn vedere calitatea longitudinală a

12

studiului este important ca numărul ales să fie mai mare pentru a putea suplinii eventualele pierderi din

urmărire Practic rezultatele sunt introduse icircn tabelul 2 x 2 de unde se pot calcula indicatorii doriţi (Figura 2)

Avacircnd icircn vedere modul de culegere a datelor este permisă calcularea de indicatori numai pe orizontală

orice comparare icircntre coloana dreaptă şi stacircngă fiind incorectă Avantajul acestui tip de culegere a datelor ar fi

eventualul număr mai redus de subiecţi dar dezavantajul major este cel al costurilor de urmărire icircn timp dar

trebuie luată icircn calcul şi pierderea de subiecţi din evidenţe Factorul controlat este deci prezenţa expunerii iar

factorul aleator este prezenţa bolii

Figura 2 Tabelul de contingenţă pentru tipul de culegere expus ndash neexpus

4 Culegerea de tip caz ndash martor Icircn acest caz ceea ce ghidează colectarea datelor este prezenţa sau absenţa

bolii icircn momentul prezent Se vor culege date de la două loturi constituite după criteriul de bolnav B+ şi de fără

boală B+ Datele culese sunt icircn trecut deci caracterul datelor va fi retrospectiv Icircn acest caz factorul controlat

este boala factorul aleator fiind expunerea (Figura 3)

Calculul de indicatori icircn acest caz se va putea efectua numai icircntre coloane orice calcul icircntre valorile de pe linii

fiind greşit Rezultate semnificative se pot obţine icircn acest caz utilizacircnd loturi mai mici de studiu prin

comparaţie cu tipul eşantion reprezentativ permiţacircnd icircn acelaşi timp studiul bolilor rare (cu prevalenţă mică)

Figura 3 Tabelul de contingenţă pentru tipul de culegere caz ndash martor

Metode de culegere a datelor

Metoda aleasă pentru culegerea datelor trebuie să fie aleasă după un atent studiu bibliografic icircn vederea

stabilirii celui mai eficient mod de a răspunde temei de studiu

Metodele de culegere trebuie să fie bine aplicabile şi consistente ca aport informaţional necesar

13

1 Fiziologice Sunt colectate date despre anumite caracteristici fiziologice ale pacienţilor (TA glicemie

colesterol etc) Această metodă aduce rezultate obiective cacirct timp instrumentul de evaluare este bine calibrat

şi prezintă variaţii mici

2 Metode observaţionale Instrumentul de culegere a datelor trebuie să fie sincronizat cu protocolul conceput

de cercetător Datele culese trebuie să fie de asemenea consistente adică să fie colectate de aceeaşi manieră

conducătorul studiului trebuind să instruiască investigatorii (colectorii de date) Icircnregistrarea datelor trebuie să

fie de asemenea sistematică şi bine standardizată Observaţii de control trebuie icircn mod obligatoriu făcute

pentru a putea aprecia icircn mod corect orice deviere datorată unor factorii externi Este obligatorie luarea icircn

consideraţie a aspectelor etice

3 Interviul Poate fi structurat cu un set specific de icircntrebări sau nestructurat cu o temă generală cu care se

icircncepe interviul Interviurile pot fi icircnregistrate sau intervievatorul poate nota pur şi simplu răspunsurile Există

două tipuri generice de interviu interviul de profunzime care se referă la o discuţie icircn general structurată cu

un număr de icircntrebări prestabilite icircn icircncăperea de studiu fiind doară intervievatorul şi persoana chestionată şi

interviul de grup unde prin conversaţii pornind de la temă generală expusă şi condusă de intervievator se

obţin date despre subiecţii participanţi la studiu Ambele metode de interviu au indicaţiile lor precise Un

interviu pe teme intime nu va putea fi corect icircn ceea ce priveşte datele colectate dacă se aplică un interviu de

grup

4 Chestionarul Document scris adresat unor persoane pentru a răspunde la una sau mai multe icircntrebări

Trebuie să aducă răspunsurile la icircntrebările care motivează studiul constituind ansamblul icircntrebărilor destinate

culegerii de informaţii (date) Redactarea chestionarului trebuie să ţină cont de structura acestuia introducere

conţinut exprimarea icircntrebărilor grafica chestionarului

5 Icircnregistrări preexistente

Icircn cercetarea medicală sunt cel mai frecvent utilizate Informaţiile dorite sunt deja existente ceea ce icirci revine

cercetătorului este ca să structureze datele icircn funcţie de scopul studiului pe care icircn conduce Aceste surse sunt

bull Foi de observaţie

bull Registre de consultaţie

bull Buletine de analize

bull Registre de operaţii

Icircn cazul icircn care nici o metodă de culegere a datelor nu este pe placul celui ce conduce studiul există

posibilitatea de a construi un instrument nou de culegere a datelor

Acest proces trebuie să urmărească nişte paşi obligatorii fiind mare consumator de timp

bull Definirea structurii cu care se va face măsurarea

bull Formularea itemilor de măsură

bull Analiza validităţii instrumentului de măsură ndash măsoară acesta fenomenul corect

bull Elaborarea de instrucţiuni de utilizare pentru investigatori

14

bull Pretestarea instrumentului

bull Aprecierea validităţii interne şi externe a datelor culese

Instrumente de cercetare

Formularea clară a temei de cercetare necesită o foarte bună definire a factorilor studiaţi şi a criteriilor de

judecată Acestea din urmă sunt ultimele care vor trebui definite icircn cadrul protocolului de studiu

Alegerea unui instrument de măsură

Nu există un instrument de măsură perfect sau universal corect Alegerea sa dintre cele existente şi cele deja

utilizate depind de trei factori

bull Obiectivul studiului

bull Boala studiată

bull Populaţia icircn studiu

De aceste trei elemente trebuie ţinut cont icircn fiecare etapă a dezvoltării instrumentului

Definirea obiectivului

Studiu transversal Dacă se doreşte studierea unui simptom sau a unei caracteristici ale populaţiei se poate

icircmpărţi populaţia de studiu icircn mai multe grupuri Este practic vorba de a determina diferenţele dintre subiecţi

icircn cea ce priveşte o variabilă necesară studiată printr-un studiu transversal (utilizarea dozării de Ac HBS

pentru a evalua progresele bolnavilor de hepatită tip B)

Studiu longitudinal Icircn acest caz nu se poate icircmpărţii populaţia de studiu icircn mai multe grupuri datele obţinute

fiind de la acelaşi subiect colectate după un interval de timp

Icircn funcţie de boală şi populaţie se aleg şi instrumentele de măsură cele mai adecvate

Instrumentele cercetării reprezintă un mecanism specific sau o strategie pe care cercetătorul o utilizează pentru

colectarea prelucrarea şi inferenţa datelor Aceste instrumente sunt

1 Studiul icircn bibliotecă

2 Computerul

3 Determinările experimentale

4 Statistica

5 Mintea umană

6 Facilităţi de limbaj şi comunicare

Determinările experimentale

Măsurarea constă icircn aprecierea şi cuantificarea fenomenelor calitativ sau cantitativ Interpretarea

datelor se referă la transformarea lor icircn unităţi de descoperire a unor fenomene mai puţin cercetate

Standardele acceptate se referă la norme medii distribuţii etc Tot icircn cadrul interpretării datelor datele

obţinute sunt caracterizate pe scale de valori nominal ordinal de interval sau de raport

Validarea şi reproductibilitatea măsurătorilor sunt aspecte importante şi foarte necesare pentru o

cercetare corect fundamentată care doreşte obţinerea unor concluzii pertinente

15

Statistica Este implicată icircn condensarea şi procesarea unui volum mai mare de date astfel icircncacirct să se poată

interpreta corect valorile obţinute şi să se permită comparările Utilizarea unor teste statistice specifice permite

determinarea semnificaţiei (diferenţei) statistice astfel icircncacirct estimatorii să poată fi aplicaţi la populaţia

generală Furnizează informaţii şi privind corelarea sau relaţionarea icircntre date

Mintea umană este cea care reuşeşte să integreze şi să icircnţeleagă rezultatele obţinute Semnificaţia ştiinţifică

este stabilită icircn funcţie de rezultatele statisticii de mintea umană conform afirmaţiei bdquosemnificaţia ştiinţifică

nu este egală cu semnificaţia statisticărdquo Metodele aplicate pentru a putea ajunge la o concluzie pertinentă sunt

logica deductivă raţionamentul inductiv şi gacircndirea critică

Limbaj şi comunicare Exprimarea orală sau icircn scris permite nuanţarea unor aspecte seci cifrice ale unor

studii Icircn acest mod devine mai evidentă semnificaţia ştiinţifică a unor rezultate statistice

34 Prelucrarea datelor

Instrumentele de prelucrare

Statistica este o ştiinţă ramură a matematicii care studiază evoluţia fenomenelor şi proceselor

colective pe baza observării lor ştiinţifice a culegerii şi prelucrării detaliate a informaţiilor statistice cu scopul

de a formula şi explica legile legităţile şi regularităţile ce le guvernează

Statistica permite deci aprecierea unor parametrii populaţionali prin studiul unui număr redus de

elemente ale populaţiei icircn studiu (ţintă) O populaţie poate fi definită printr-un şir de valori care pot fi grupate

icircn funcţie de parametrul studiat (glicemie colesterol TAD TAS etc) Pentru fiecare astfel de şir se defineşte

o variabilă (care va purta nume propriu glicemie colesterol etc) Practic variabila este considerată o funcţie

ia valori posibil diferite de la un element la altul icircn funcţie de caracteristicile proprii acestora Sunt clasificate

icircn două grupe variabile cantitative (caracteristică măsurabilă) şi calitative (caracteristică ce nu poate fi

măsurată)

La racircndul lor variabilele calitative pot fi

bull Nominale ndash grupuri de elemente ce nu pot fi ordonate (culoarea părului)

bull Nominale ordonate ndash concluziile pot fi grupate (eficienţa unui tratament slabă bună foarte bună)

bull Binare ndash apar numai două posibilităţi (bolnav sănătos)

Variabilele cantitative pot fi

bull Continue ndash o variabilă măsurabilă care poate lua o infinitate de valori

bull Discrete ndash variabile care nu pot lua decacirct valori icircntregi

Statistica descriptivă

Există două ramuri ale statisticii statistica descriptivă şi statistica inferenţială

Statistica descriptivă (după cum rezultă din denumire) se ocupă cu descrierea unor valori obţinute ale unei

variabile studiate

16

Valorile pe care variabila le ia se constituie icircntr-o serie statistică Indicatorii care definesc o variabilă (serie)

sunt

1 Ale tendinţei centrale

Media aritmetică - notată de regulă cu

Mediana - este acea valoare din şirul de date care icircmparte icircn două părţi egale şirul ordonat de valori (atenţie

şirul este ordonat crescător) situacircndu-se la mijlocul seriei statistice

Dacă numărul de valori n este un număr impar atunci mediana este valoarea unde

Dacă n este par deci avem un număr par de valori mediana este definitatilde ca fiind

unde k = n2

Modul - constituie valoarea care apare cel mai des deci valoarea cu numărul cel mai mare de apariţii

2 De dispersie

Amplitudinea - este diferenţa dintre valoarea maximă şi cea minimă

A = Amax - Amin

Amplitudinea relativă - notată A este raportul dintre amplitudinea absolută şi media aritmetică a seriei de

date

Varianţa notată este un indicator de icircmprăştiere a datelor Formula de calcul este

Abaterea standard (S) sau deviaţia standard reprezintă rădăcina pătrată din varianţă (dispersie)

Coeficientul de variaţie se calculează ca un raport procentual icircntre abaterea standard şi valoarea medie a şirului

de valori

Eroarea standard intervine icircn estimarea intervalelor de confidenţă Se calculează astfel

17

3 De asimetrie (skewness) indică distribuţia datelor dacă sunt sau nu distribuite normal

4 De boltire (kurtosis) estimează boltirea sau aplatizarea curbei de distribuţie

Prezentarea descriptivă a datelor se face prin icircnregistrarea datelor culese icircn tabele care să reprezinte icircn mod

sintetic valorile măsurate

Icircn concluzie statistica descriptivă permite

bull Stabilirea comparabilităţii icircntre grupurile de studiu şi aprecierea prezenţei erorilor sau confuziei

bull Reprezentarea datelor icircn tabele permite evaluarea fiecărui pacient şi dacă a existat pierderi din studiu

Statistica inferenţială

Statistica inferenţială (inductivă) este partea de analiză a datelor care permite extrapolarea unei

concluzii trase pe baza unui eşantion spre populaţia ţintă pentru care a fost efectuat studiul

Scopul analizei statistice este de a evidenţia efectul unui tratament sau al unui factor de risc prin date obţinute

din eşantionul studiat spre populaţia ţintă Aceasta implică testarea ipotezelor statistice sau altfel spus testarea

semnificaţiei statistice Este una dintre cele mai importante momente ale studiului Cum rezultatele sunt

obţinute prin studiul unui eşantion există posibilitatea ca acestea să fie datorate icircntacircmplării Testele

statistice ne ajută să apreciem icircn ce măsură rezultatele sunt icircntacircmplătoare şi mai ales icircn ce măsură şi dacă se

pot aplica populaţiei generale Icircn acest scop se impune o valoare limită alfa 005 care reprezintă limita

superioară a probabilităţii ca rezultatul obţinut să fie greşit (datorat icircntacircmplării) Astfel icircn funcţie de tipul

variabilelor şi indicatorii descriptivi aplicaţi şi evaluaţi se aplică teste de semnificaţie statistică (Tabelul 1)

Tabelul 1 Alegerea testelor de semnificaţie statistică

Tipul datelor

18

Diferenţierea variabilelor din punctul de vedere a distribuţiei se face folosind testul de normalitate

Kolmogorov ndash Smirnov

Testul statistic reprezintă metoda de comparaţie a două sau mai multe populaţii prin intermediul unor

variabile observate ale lor

Scopul unui test statistic este de a defini realitatea

Definirea icircntrebării de cercetare (ipoteza clinică)

Tratamentul cu Nebivolol este la fel de eficient ca şi cel cu Valsartan icircn tratamentul

hipertensiunii arteriale

Transpunerea icircntrebării de cercetare icircn termeni statistici (ipoteza statistică)

Media tensiunii arteriale a pacienţilor trataţi cu Valsartan nu diferă semnificativ de media

tensiunii arteriale a pacienţilor trataţi cu Nebivolol

Etapele unui test statistic

1 Formularea problemei icircn termenii ipotezelor statistice

2 Alegerea şi calcularea parametrului statistic al testului

3 Regiunea critică

4 Concluzia testului

1 Formularea problemei icircn termenii ipotezelor statistice

Ipoteza nulă ipoteza care trebuie testată testul efectuacircndu-se sub prezumţia că ipoteza nulă ar

fi adevărată

Ipoteza alternativă acea ipoteză care icircntr-un sens sau altul contrazice ipoteza nulă Această

ipoteză se mai numeşte şi ipoteza de lucru

Ipoteza nulă tipuri

O coadă (ldquoone-tailedrdquo sau ldquoone-siderdquo)

Media este mai mare

Media este mai mică

Două cozi (ldquoone-tailedrdquo sau ldquoone-siderdquo)

Media este egală

2 Alegerea şi calcularea parametrului statistic al testului

Parametrul statistic al testului exprimă icircntr-o anumită formă diferenţa dintre elementele comparate

Ţinacircnd seama de faptul că eşantionul sau eşantioanele utilizate sunt aleator extrase din populaţiile care

fac obiectul testului parametrul statistic este o variabilă aleatoare de selecţie care urmează o anumită

lege de probabilitate

Un parametru statistic al testului bun trebuie să icircndeplinească două condiţii

19

Trebuie să se comporte diferit atunci cacircnd ipoteza nulă H0 este adevărată faţă de situaţia icircn

care ipoteza alternativă H1 este adevărată

Distribuţia de probabilitate a parametrului statistic al testului sub prezumţia că H0 este

adevărată este cunoscută

3 Regiunea critică

- Trebuie să fim capabili să decidem icircn funcţie de valoarea parametrului statistic calculat care dintre

ipoteze cea nulă sau cea alternativă este adevărată

- Dacă valoarea parametrului statistic aparţine regiunii critice ipoteza nulă H0 va fi respinsă şi va fi

acceptată ipoteza alternativă H1

- Dacă valoarea parametrului statistic nu aparţine regiunii critice ipoteza nulă H0 va fi acceptată

- Decidem mărimea regiunii critice

Pentru aceasta trebuie să specificăm mărimea riscului de eroare pe care icircl acceptăm

Pe scurt definim nivelul de semnificaţie notat cu a sau mărimea riscului pe care

suntem dispuşi să ni-l asumăm icircn respingerea ipotezei nule H0 icircn cazul icircn care aceasta

este adevărată De obicei se alege un nivel de semnificaţie icircntre 1 şi 5

Probabilitatea unei erori de tipul I

probabilitatea de respingere a ipotezei nule H0 icircn favoarea ipotezei alternative H1 icircn

condiţiile icircn care H0 este adevărată

probabilitatea unei erori de tipul I se notează cu a şi se mai numeşte nivel de

semnificaţie al testului

Probabilitatea unei erori de tipul II

probabilitatea acceptării ipotezei nule icircn condiţiile icircn care ipoteza alternativă H1 este

adevărată

această probabilitate se notează cu b

- Unilaterală la dreapta ndash valoarea parametrului statistic al testului este mai mare sau egală cu

valoarea din dreapta a intervalului critic

- Unilaterală la stacircnga ndash valoarea parametrului statistic al testului este mai mică sau egală cu

valoarea din stacircnga a intervalului critic

- Bilaterală ndash valoarea parametrului statistic al testului este mai mică sau egală cu valoarea extremă

din stacircnga regiunii critice sau mai mare sau egală cu valoarea extremă din dreapta regiunii critice

valorile extreme ale regiunii critice avacircnd nivele egale de semnificaţie

4 Concluzia testului

- Ipoteza nulă H0 este respinsă dacă valoarea parametrului statistic aparţine regiunii critice

20

- Regiunea critică trebuie astfel aleasă icircncacirct dacă ipoteza alternativă H1 este adevărată

probabilitatea de respingere a ipotezei nule H0 este mai mare decacirct icircn cazul icircn care ipoteza nulă H0

ar fi adevărată

- Acceptarea ipotezei nule H0 atunci cacircnd ipoteza alternativă H1 este adevărată este cunoscută ca şi

eroarea de tipul II

a probabilitatea ei se notează cu b

b măsoară bdquonivelul de eroarerdquo

- Icircn testarea oricărei ipoteze statistice există patru situaţii care determină dacă decizia noastră este

corectă sau nu

Cazuri

H0 este adevărată H0 este falsă

Concluzie H0 se acceptă decizie corectă eroare de tipul

II

H0 se

respinge

eroare de tipul I decizie corectă

Luarea deciziei pe baza valorii probabilităţii p de semnificaţie a testului

Icircn momentul icircn care prelucrăm statistic o serie de date dorim să ştim dacă rezultatele obţinute sunt sau

nu semnificative statistic

Răspunsul la această icircntrebare este dat de valoarea lui p calculată de orice program statistic la

prelucrarea unor date

Icircn cazul testelor statistice ipoteza nulă este respinsă dacă nivelul de semnificaţie este mai mic decacirct

005 iar programele de prelucrare statistică a datelor vor afişa o steluţă () icircn tabelul rezultatelor

21

Dacă p le 005 respingem ipoteza nulă şi acceptăm ipoteza alternativă (am obţinut semnificaţia

statistică)

Dacă p gt 005 acceptăm ipoteza nulă (nu am obţinut semnificaţia statistică)

p = 013

NU respingem ipoteza nulă

Risc de eroare de tip II

α = 005

p = 002

Respingem ipoteza nulă

Risc de eroare de tip I

Semnificaţia lui p

Criteriu de luare a deciziei cu privire la o ipoteză statistică nulă

Cuantifică şansa ca o decizie de respingere a ipotezei nule să fie greşită

Măsură a semnificaţiei statistice şi NU CLINICĂ

22

Semnificaţia lui p (reguli empirice)

001 le p lt 005 rezultatul e semnificativ statistic

0001 le p lt 001 rezultatul e icircnalt semnificativ statistic

p lt 0001 rezultatul e foarte icircnalt semnificativ statistic

p ge 005 rezultatul e considerat nesemnificativ statistic

Limite ale valorii p

Valoarea p NU ne dă informaţii despre

Şansa de beneficiu a unui pacient individual

Procentul de pacienţi care vor avea un beneficiu icircn urma instituirii procedurii medicale

Gradul de beneficiu expectat pentru un anumit pacient

Puterea unui test statistic

Este capacitatea de a detecta o diferenţă acolo unde există

Creşterea volumului eşantionului determină creşterea puterii testului statistic aplicat

Valoarea este icircn relaţie directă cu eroarea de tip II

Puterea = 1 ndash β

Cea mai utilizată modalitate de creştere a puterii unui test statistic este de a creşte volumul

eşantionului

Tipul scalei de măsură ndash testul statistic

Denumire test Interval Nominal Observaţii

Corelaţie Pearson 2 0 Există o relaţie liniară

χ2 0 2

Student 1 1 Doar 2 grupuri

ANOVA 1 1 2 sau mai multe grupuri

Student perechi 1 1 Eşantioane perechi

Măsurători repetate (ANOVA) 1 1 Mai mult de 2 grupuri date

perechi

Inferenţa statistică pe date calitativ e

Tabela de contingenţă 2times2

Riscuri şi raţii

Testul χ2 (testarea asocierii icircn tabela de contingenţă)

Testul Fisher

23

Testul z pentru proporţii

Testul McNemar

Tabela de contingenţă 2times2

Scale de tip nominal (dicotomiale tabela de contingenţă de 2times2) sau ordinal (tabela de contingenţă de

rtimesc)

Frecvenţa absolută (numărul de evenimente per categorie)

Tabela de contingenţă de 2times2 4 categorii

AP = adevărat pozitiv

FP = fals pozitiv

FN = fals negativ

AN = adevărat negativ

Ulcer deschis Ulcer vindecat Total

Recurenţă + AP = 1 FP = 5 = 1+5 = 6

Recurenţă - FN = 7 AN = 16 = 7+16 = 23

Total =1+7=8 =5+16=21 29

Riscuri şi raţii Mărimi ale asocierii

Denumire Formula Definiţie

Rata falşilor pozitivi =FP(FP+AN) Probabilitatea unui test fals + (α)

Rata falşilor negativi =FN(FN+AP) Probabilitatea unui test fals ndash (β)

Sensibilitate =AP(AP+FN) Probabilitatea unui test real + (1- β)

Specificitate =AN(AN+FP) Probabilitatea unui test real ndash (1- α)

Acurateţe =(AP+AN)n Probabilitatea generală a unei decizii corecte

Valoarea predictivă pozitivă =AP(AP+FP) Probabilitatea ca un test pozitiv să fie corect

Valoarea predictivă negativă =AN(AN+FN) Probabilitatea ca un test negativ să fie corect

Riscul relativ =AP(FP+AN)FN(AP+FP)

Rata şansei =(AP∙AN)(FN∙FP)

Riscul atribuabil =AP(AP+FP)-FN(FN+AN)

24

Denumire Formula

Rata falşilor pozitivi = 5(5+1) = 08334

Rata falşilor negativi = 7(7+16) = 03043

Sensibilitate = 1(1+7) = 01250

Specificitate = 16(16+5) = 07619

Acurateţe = (1+16)29 = 05862

Valoarea predictivă pozitivă = 1(1+5) = 01667

Valoarea predictivă negativă = 16(16+7) = 06957

Riscul relativ = 1(5+16)7(1+5) = 2142 = 050

Rata şansei = (1∙16)(7∙5) = 04571

Riscul atribuabil = 1(1+5)-7(7+16) = 01667-03043=-01376

Testarea asocierii icircn tabela de contingenţă

Testul χ2

Nu trebuie utilizat pentru eşantioane de volum mic

Testul este valid doar dacă valoarea expectată (aşteptată) pentru fiecare celulă este cel puţin

egală cu 1 şi frecvenţa absolută observată este de minim 5

Dacă aceste condiţii nu sunt icircndeplinite se aplică testul exact al lui Fisher (Fisherrsquos Exact Test)

Indică dacă cele două variabile sunt sau nu independente DAR NU cuantifică puterea asocierii

dintre ele

Problema S-a investigat icircntr-un studiu asocierea dintre obezitatea (ca factor de risc) şi bolile

cardio-vasculare la persoanele icircn etate (gt 60 ani) Din totalul de 620 persoane investigate s-au

identificat 150 persoane cu obezitate şi boală cardio-vasculară 230 persoane fără obezitate şi

fără boală cardio-vasculară şi 60 persoane fără obezitate dar cu boală cardio-vasculară Există

o asociere icircntre obezitate şi boala cardio-vasculară (df=1 α=005 χ2critic = 384)

Testul χ2 exemplu

H025

Nu există asociere icircntre obezitate şi bolile cardio-vasculare

Obezitatea şi bolile cardio-vasculare sunt independente

H1

Există asociere icircntre obezitate şi bolile cardio-vasculare

Obezitatea şi bolile cardio-vasculare sunt asociate

a = 005 pragul de semnificaţie al testului

urmează o lege cu (r-1)(c-1) grade de libertate

χ2 = parametrul testului χ2

fio = frecvenţa observată

fit = frecvenţa teoretică

Regiunea critică este [χα2 yen)

Pentru α = 005 χα2 = 384

OBSERVAT BCV+ BCV- Total

Obezitate + AP = 150 FP = 180 330

Obezitate - FN = 60 AN = 230 290

Total 210 410 620

TEORETIC BCV+ BCV- Total

Obezitate + = 330times210620 = 330times410620 330

Obezitate - = 290times210620 = 290times410620 290

Total 210 410 620

TEORETIC BCV+ BCV- Total

Obezitate + = 330times210620 = 330times410620 330

26

Obezitate - = 290times210620 = 290times410620 290

Total 210 410 620

TEORETIC BCV+ BCV-

Obezitate + = 112 = 218

Obezitate - = 98 = 192

Deoarece 4177Icirc[384 yen) se respinge H0 cu un risc de eroare de 5

Există asociere icircntre obezitate şi bolile cardio-vasculare

Testul Fisher

Corecţie a testului χ2

Valoarea p asociată parametrului ne dă probabilitatea ca valoarea observată de independenţă să fie

atribuită doar şansei

O valoare p mică indică că există alte cauze decacirct şansa influenţează rezultatul şi astfel cele două

variabile investigate nu sunt independente

Testul Fisher = dispersia corectată a factorului x dispersia corectată a factorilor reziduali

Icircn acest context regula adunării dispersiilor se poate scrie unde

este variaţia lui y pe seama variaţiei variabilei x

este variaţia lui y pe seama influenţei factorilor reziduali (neicircnregistraţi)

este variaţia totală a caracteristicii y

Testul Fisher empiric se calculează după formula

27

se compară cu Ftab pentru nx şi nz grade de libertate la un anumit prag de semnificaţie stabilit

Dacă Fc gt Ftab rezultă că variaţia factorului de grupare x este semnificativă pentru variaţia caracteristicii y

Testul z pentru proporţii

1 Compararea unei frecvenţe observate cu o frecvenţă teoretică

2 Testarea egalităţii a două frecvenţe

Testul z Compararea unei frecvenţe observate cu o frecvenţă teoretică

Scop Investigarea semnificaţiei diferenţei icircntre o frecvenţă teoretică p (icircntr-o populaţie) şi o frecvenţă

observată f pe un eşantion reprezentativ (variabilă calitativă (binare))

Condiţii de aplicare Testul este corect aplicat dacă numărul n al observaţiilor eşantionului este

suficient de mare (n∙p n∙(1-p)gt10

Parametrul

n = volumul eşantionului

Suntem interesaţi de investigarea prevalenţei hepatitei B la personalul care lucrează icircn laboratoarele

clinicilor de boli infecţioase din Transilvania Se ştie din studii anterioare că prevalenţa hepatitei B icircn

populaţia generală din Transilvania este de 9 S-a luat icircn studiu un eşantion de 100 persoane şi s-a

obţinut o prevalenţă a hepatitei B de 6 Există diferenţă semnificativă icircntre frecvenţa hepatitei B la

personalul care lucrează icircn laboratoarele spitalelor de boli infecţioase din Transilvania faţă de

populaţia generală

f = 006 p = 009 n = 100

Ipoteza nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat

faţă de frecvenţa hepatitei B icircn populaţia generală

Ipoteza alternativă test bilateral Există diferenţă semnificativă icircntre frecvenţa hepatitei B la

nivelul eşantionului şi prevalenţa hepatitei B icircn populaţia generală

f = 006 p = 009 n = 100

Pragul de semnificaţie a = 005

Regiunea critică test bilateral (-yen -196 ]Egrave[196 yen)

28

Concluzia testului

Deoarece parametrul statistic calculat al testului nu aparţine regiunii critice se acceptă ipoteza

nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat faţă de

frecvenţa hepatitei B icircn populaţia generală

Testul McNemar

Evaluarea dependenţei variabilelor calitative perechi (dorim să determinăm dacă o anumită

caracteristică este sau nu asociată cu o anumită patologie)

Identificăm n pacienţi care prezintă patologia de interes (eg Cancer bronho-pulmonar) şi n

pacienţi cu aceleaşi caracteristici ca şi primul grup dar care nu o prezintă

Martor = da Martor = nu

Caz = da a b

Caz = nu c d

Testul McNemar - exemplu fumat vs cancer

Martor = da Martor = nu

Cancer = da a = 2 b = 5

Cancer = nu c = 0 d = 3

29

χ2critic(α=005) = 384

32 lt 384 rarr acceptăm ipoteza nulă

Fumatul nu este icircn relaţie cu apariţia cancerului bronho-pulmonar

Inferenţa statistică pe date cantitative

Variabile cantitative continue

Testul z şi Student (t) (o medie sau medii perechi)

Testul z şi Student (t) (testarea a două medii)

ANOVA (ge 3 medii)

Ranguri (variabile cantitative discrete sau cantitative care nu icircndeplinesc condiţia de

normalitate)

Testul sumei rangurilor Wilcoxon

Kruskal-Wallis (ge 3 eşantioane independente)

Friedman (ge 3 eşantioane dependente)

Teste de normalitate variabile cantitative continue

Shapiro-Wilk

Kolmogorov-Smirnov

Shapiro-Wilk

Chi-Square Goodness-of-Fit

Dacă datele urmează o distribuţie normală aplicăm un test parametric

Dacă datele nu urmează o distribuţie normală aplicăm un test de comparare al rangurilor

30

Testul Z de comparare a mediei unui eşantion cu media unei populaţii

Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ

extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie

s2 care se cunoaşte

Condiţii de aplicare

1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru

compararea mediei unui eşantion cu media unei populaţii)

2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal

distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă

3 Talia eşantionului este mare ( ge 30)

Ipoteze

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media

eşantionului şi media populaţiei

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

(-yen -196 ] Egrave [196 yen)

Parametrul testului

n = volumul eşantionului

= media eşantionului

s = deviaţia standard a populaţiei

Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)

Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard

cunoscută

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi

media standard

Condiţii de aplicare

Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se

realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această

condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea

31

Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai

puternic

Numărul de grade de libertate (df) df = n-1

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

Parametrul testului

n = volumul eşantionului

micro0 = media standard

= media eşantionului

s = deviaţia standard a eşantionului

Testul ANOVA compararea mediilor a mai multe eşantioane

H0 = toate mediile sunt egale

H1 = nu toate mediile sunt egale

Condiţii de aplicare

1 Datele sunt independente unele faţă de celelalte

2 Datele fiecărui grup sunt normal distribuite

3 Deviaţia standard este aceeaşi pentru toate grupurile

Id Medicament

A B C D E F

1 5 6 7 10 5 9

2 6 8 8 11 8 8

3 7 7 9 13 6 7

4 8 9 11 12 4 5

32

5 9 10 10 9 7 6

Suma 35 40 45 55 30 35

Media 7 8 9 11 6 7

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =

= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)

Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2

F = (suma pătratelor(icircntre))(suma pătratelor(icircn))

Suma pătratelor (icircntre) = 16times5 = 80

Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60

Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn

interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare

SP df Media pătratelor F = MPicircntreMPicircn

Icircntre 80 5 = 805 = 16 = 1625 = 64

Icircn 60 24 = 6024 = 25

Total 140 29 -

Testul sumei rangurilor Wilcoxon

Aplicat pentru

Un set de observaţii provenite dintr-o valoare ipotetică comună

Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)

Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero

Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace

Suma rangurilor pentru diferenţele negative = 2+3+1 = 6

Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30

33

Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului

egal cu 8 = 0109

Icircnainte După Diferenţa Rang

64 66 -2 2

66 58 8 5

67 68 -1 3

71 65 6 4

72 75 -3 1

76 67 9 6

78 59 19 8

89 74 15 7

Testul Kruskal-Wallis (ge 3 eşantioane independente)

Test de ranguri aplicate pe mai mult de 3 eşantioane

H = parametrul testului

n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)

Tk = suma rangurilor

Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie

pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni

34

df = k-1 (k = numărul de eşantioane)

df = 3-1 = 2

Hcritic(α=005) = 599

H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie

pozitivă şi respectiv biopsie negativă

Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie

a tipului de studiu pe eşantioane perechi)

1 Definirea numărului de tratamente k

2 Obţinerea rangurilor pentru fiecare tratament

3 Sumarea rangurilor fiecărui tratament

4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)

5 Dacă Fr gt Frcritic rarr respingem H0

Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost

măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi

n = 9 k = 3 T12 = 225 T2

2 = 38025 T32 = 38025

Frcritic = 599

Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de

prostată

35

De reţinut

Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei

Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-

of-Fit

Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z

Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t

Compararea mediilor a 3 sau mai multe eşantioane ANOVA

Compararea mediilor a două populaţii (σ) testul Z

Compararea mediilor a două eşantioane (s) testul t

Compararea mediilor a două eşantioane perechi (s) testul t

ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi

cu cel pentru compararea a două eşantioane perechi

Ranguri

Distribuţia datelor nu are importanţă

Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)

Trei sau mai multe eşantioane Kruskal-Wallis

Trei sau mai multe eşantioane perechi Friedman

Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia

Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a

datelor)

Variabile nominale

Un singur eşantion sau eşantioane perechi

Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte

Eşantioane perechi testul Mc Nemar

Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2

Icircn analiza proporţiilor există teste diferite pentru

Compararea unei frecvenţe cu o frecvenţă cunoscută

Compararea a două frecvenţe

Semnificaţia statistică

Valoarea p (p value)

Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor

două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E

posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării

aleatorii

36

Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală

urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii

Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este

probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un

experiment de dimensiunea acestuia

Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că

diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii

diferite

Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca

fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă

ar fi fost adevărată

Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă

1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe

baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De

fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001

2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie

3 Se aplică testul statistic aferent pentru a calcula valoarea p

4 Se compară valoarea p cu valoarea ndash prag

5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe

semnificativă dpdv statisticrdquo

6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e

semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să

conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă

Teste de semnificaţie

Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului

populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)

Testarea ipotezelor implică posibile erori

Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile

sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui

grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul

icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005

ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există

37

nici o diferenţă

Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ

statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de

ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost

ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau

dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă

cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă

semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe

ipotetice variate icircn cazul icircn care ele există

Măsuri ale frecvenţei

Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)

Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate

Generic formula pe care se bazează toate cele trei este

unde x şi y sunt cantităţile de comparat

Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea

unei frecvenţe pe grupe de sex vacircrstă etc

Proporţia implică icircn mod necesar ca x să fie inclus icircn y

Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară

frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp

Pentru calcularea unei rate trebuie ţinut cont de trei aspecte

bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin

bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp

bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo

Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un

tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei

populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei

aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)

38

Indicatori

Rata de incidenţă

Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă

icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii

Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o

perioadă de timp

Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de

timp x

Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei

susceptibili de a dezvolta icircmbolnăvirea studiată

Numitorul poate fi

bull Numărul mediu al populaţiei icircn perioada de timp studiată

bull Mărimea populaţiei icircn mijlocul perioadei de studiu

bull Mărimea populaţiei la icircnceputul studiului

Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă

Este obligatorie menţionarea perioadei de timp

Prevalenţa

Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la

un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă

schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa

momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)

39

Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include

numai cazuri noi respectiv include cazuri noi şi vechi

Rata de atac

Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este

folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp

raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori

Rata persoană-timp

Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din

momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte

migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost

observate

Riscul relativ (RR)

Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment

legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele

prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două

grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la

bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la

bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai

mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo

Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2

Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn

cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă

(Tabelul 1)

Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR

Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la

neexpuşi

40

Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de

culegere a datelor

Odds ratio (OR)

Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin

raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general

studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)

Tabelul 2 Tabelul 2 x 2 pentru calcularea OR

Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală

Rate de mortalitate

Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp

specificată Există mai multe tipuri de rate de mortalitate

o Mortalitate specifică pe sex

o Mortalitate specifică pe rasă

o Mortalitate specifică pe boală

o Mortalitate neonatală

o Mortalitate postneonatală

o Mortalitate infantilă

o Mortalitate maternă

Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP

41

Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de

viaţă şi vacircrsta la care survine decesul dacă este prematur

Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu

Ani de viaţă pierduţi datorat dizabilităţii

Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt

utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru

cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite

grupuri

Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de

risc şi o boală se folosesc riscul relativ şi odds ratio

35 Analiza şi interpretarea datelor

După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date

trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul

Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor

colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului

studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu

plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde

prezenţa biostatisticianului este necesară

Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu

elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat

iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului

iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate

depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori

testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere

clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza

Interpretarea rezultatelor statistice

Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne

motive (număr mic de date) acceptarea ei să fie falsă

Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine

gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia

ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument

de decizie Intervalul de confidenţă

42

Interpretarea statistica ne interpretarea clinică

Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă

Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice

obţinute pe eşantionul studiat

Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare

Ce interpretăm Rezultatele

personale obţinute icircn urma studiului

care au fost prezentate icircn secţiunea bdquoRezultaterdquo

Explicăm rezultatele obţinute

Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale

Interpretarea trebuie să se realizeze icircn

lumina limitelor studiului

contextul cultural social şi educaţional al locului unde s-a realizat cercetarea

contextul a ceea ce se cunoaşte din literatura de specialitate

Interpretăm doar rezultatele personale obţinute icircn urma studiului

Interpretarea statistică nu este tot una cu interpretarea clinică

Interpretarea statistică este importantă

Interpretarea clinică este foarte importantă

Intervalul de confidenţă

Media calculată pe baza unui eşantion nu va echivala media populaţiei

Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului

Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a

populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a

populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)

pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru

orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare

dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de

confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de

date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de

5

Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel

Dacă valoarea p este mică

Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare

aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o

medie diferită Diferenţa este semnificativă dpdv statistic

43

Icircn continuare

Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa

reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică

pentru a fi interesante din punct de vedere ştiinţific

Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC

oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care

este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a

obţine o concluzie clară

Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o

diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că

datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din

punct de vedere ştiinţific

Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul

detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat

Erorile studiilor medicale

Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura

anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară

caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea

asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri

legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias

Erorile potenţiale icircn studiile epidemiologice

1 Erori icircntacircmplătoare

2 Erori sistematice

3 Confuzia

4 Validitatea

1 Erori icircntacircmplătoare

Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a

parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel

de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot

fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii

(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor

de măsură (eroarea de măsurare)

44

2 Erori sistematice

Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate

care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu

acurateţe mare Acurateţea nu este afectată de mărimea eşantionului

Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de

experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea

dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus

şi greu de cuantificat (consum de alcool personalitate etc)

Principalele tipuri de erori din această categorie sunt

bull Biasul de selecţie

bull Biasul de informaţie

Biasul de selecţie

Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul

trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion

inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale

persoanelor incluse

Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se

ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia

Biasul de informaţie

Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de

instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze

expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere

nesemnificativă sau chiar să nu şi-o amintească de loc

3 Confuzia

Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune

prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este

cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă

de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte

important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor

protector

4 Validitatea

Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă

Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte

estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional

Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă

45

conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se

demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)

Validitatea externă se poate realiza numai dacă studiul este valid intern

Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii

studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de

studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt

laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi

validă din punct de vedere intern)

3 6 Prezentarea rezultatelor

După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite

Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor

icircntr-o formă bdquodigerabilărdquo este necesară

Scopul prezentării datelor

1 Transmiterea concluziilor studiului

a Datele corecte şi importante merită comunicate

b Datele trebuie să confirme sau să infirme ipoteza studiului

c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală

2 Acordarea posibilităţii altor cercetători să aprecieze studiul

a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti

b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor

prezentate

Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru

fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie

statistică

Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de

valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras

(Tabel 3)

Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)

46

Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct

numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor

precum şi prezentarea acestora sub formă inteligibilă

Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care

convin cercetătorului

Prezentarea datelor se poate face

1 Figuri şi tabele icircn articole scrise

2 Figuri şi tabele icircn prezentări orale

3 Figuri şi tabele icircn postere

4 Text scris sau incluse icircn text

5 Site-uri de WEB

Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor

Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie

Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele

exprimacircnd exact ceea ce acestea exprimă

Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate

anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel

să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se

acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca

mai sus sugestive sunt formatele simple şi puţin icircncărcate

Dacă nu există reguli impuse se respectă

1 Mesaj simplu fără falsificarea datelor

2 De obicei este necesar atacirct tabelul cacirct şi graficul

3 Să fie simplu şi clar

Tabele

Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile

coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică

elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de

1 Se folosesc doar linii orizontale

2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn

evidenţi prin linie de separare (Tabelul 4)

Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland

Noua Zeelandă)

(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)

47

3 Numerele sunt aliniate icircn funcţie de virgulă

4 Indicii statistici sunt explicaţi sub tabel

5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană

6 Abrevierile pot fi folosite

7 Numărul de zecimale trebuie limitat la maxim două

8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel

9 Plasarea legendei este obligatorie sub tabel

10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)

Icircn cazul prezentărilor orale sau a posterelor este indicat ca

1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării

2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte

3 Folosirea de simboluri este permisă

Clasificarea tabelelor

Tabelele se clasifică după

i) conţinut

bull cu distribuţii de frecvenţe

bull de clase de frecvenţe

bull de contingenţă

ii) structura

bull cu doua coloane

bull cu subclasificări

bull ldquomasterrdquo

Tabele ce conţin distribuţii de frecvenţe

O modalitate comodă de a prezenta o mulţime de date brute este

1 Se ordonează datele in ordine crescătoare

2 Se determine frecvenţa fiecărei valori

3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane

(Tabelul 5)

Tabelul 5 Distribuţii de frecvenţă absolută

48

Tabelul claselor de frecvenţe

1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă

2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)

Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)

Tabele de contingenţă

1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a

tabelelor de contingenţă

2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a

combinaţiilor de perechi ordonate de valori

3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre

a factor de risc si

b starea sănătăţii

4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)

5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)

Tabelul 7 Tabel de contingenţă 2 x 2

49

Grafice

Există două categorii de moduri grafice sub care se pot prezenta datele

1 Ilustraţii şi fotografii

2 Grafice

1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă

pentru lucrare

2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit

Putem vorbi despre mai multe tipuri de grafice

bull Grafice pentru reprezentarea datelor cantitative

1048707 Grafic cartezian (X Y)

1048707 Histograma

1048707 Poligonul de frecvenţe

1048707 Diagrama bdquoscatterrdquo

bull Grafice pentru reprezentarea datelor calitative

1048707 Grafic cu bare

1048707 Diagrama tip bdquoboxplotrdquo

1048707 Diagrama bdquopierdquo

1048707 Cartograma

Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi

dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)

Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)

Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie

Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)

Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)

50

Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir

de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele

două variabile studiate (Figura 6)

Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2

(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2

rămacircne aproximativ constantă)

Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea

comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea

comparativă a mai multor variabile

Figura 7 Grafic calitativ cu bare

51

Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo

Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două

posibilităţi reprezentate grafic este mai frecventă (Figura 8)

Figura 8 Reprezentare tip bdquopierdquo

Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli

sau a oricărui element comparativ Se foloseşte de epidemiologi

Rezultate

Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare

Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o

manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu

explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția

bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la

ilustraţii tabele grafice

Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi

nici rezultatele care invalidează eventual ipoteza

Discuţii

Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd

cultura ştiinţifică şi inteligenţa autorilor

Acest capitol răspunde la trei obiective

Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia

calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de

selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează

rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv

52

este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn

care a fost abordată problema fără a face o revistă a literaturii

Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea

rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul

Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor

afirmaţii nesusţinute de conţinutul lucrării

Concluzii

Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate

să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie

Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de

concluzii va scădea valoarea lucrării

Bibliografia (lista referinţelor citarea icircn text)

Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn

lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente

Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli

- să conţină cele mai importante şi recente lucrări

- să includă numai lucrări publicate

- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate

Bibliografie

Elisabeta Jaba ndash Statistică Ed Economică 1998

Mihai Ţarcă ndash Statistică volI Ed UAIC 1979

Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale

Ed University Press 2009

Sorana Daniela Bolboacă ndash Metodologia cercetării curs

53

Page 3: cercetarea medicala - metodologie

bull profilaxia icircmbolnăvirilor include totalitatea măsurilor care pot influenţa cauzele modificabile ale unei boli şi

se efectuează icircn patru trepte profilaxia primordială primară secundară şi terţiară

Justificarea studiului clinic

Justificarea studiului pleacă de la informaţiile existente legate de subiectul pe care cercetarea

intenţionează să icircl dezbată informaţii existente icircn literatura de specialitate

Cercetarea bibliografică permite identificarea unor lipsuri icircn legătură cu problema luată icircn studiu

inexistenţa de date referitoare la o icircmbolnăvire dintr-o zonă geografică (ţară judeţ comunitate) explicarea şi

emiterea unor soluţii de remediu Toate acestea ar putea fi elemente care justifică iniţierea şi derularea unui

studiu

Icircn justificarea studiului se poate insista pe

bull caracterul nou actual inedit al problemei

bull un nivel ridicat al morbidităţii sau mortalităţii unui fenomen de sănătate

bull gravitatea evenimentului

Calităţile studiului de cercetare

Un bun studiu de cercetare trebuie să fie pertinent nou fezabil să respecte etica medicală

Un studiu este pertinent cacircnd are repercusiuni asupra viitorului clinic al unui fenomen de sănătate pertinența

practică icircnsemnacircnd o mai bună cunoaştere a bolii a prognosticului ei ameliorarea tehnicilor de diagnostic şi

de tratament etc

O altă cerinţă se referă la ineditul studiului faptul de a fi nou icircn sensul de a aduce informaţii noi să nu repete

un studiu deja finalizat şi cu concluzii ferme

Cercetătorul trebuie icircnainte de a demara studiul icircnainte de a investi timp bani energie să estimeze dacă

studiul este fezabil Icircn acest sens trebuie să se asigure că

bull are un număr suficient de subiecţi determinări de laborator etc pentru a putea trage concluzii adecvate

bull nu există constracircngeri tehnologice sau financiare

bull studiul este accesibil şi acceptat de populaţie

bull nu are costuri de timp dar mai ales financiare mari

bull nu are scopuri prea ambiţioase sau scopuri multiple icircn general un studiu ar trebui să aibă un singur scop să

găsească rezolvarea la o singură icircntrebare

Studiul medical trebuie să respecte etica medicală cele patru principii

bull interesul şi beneficiul cercetării

bull inocuitatea (nevătămarea cercetării)

bull respectul faţă de persoanele incluse icircn studiu (respectul intimităţii persoanelorconfidenţialitatea datelor)

bull păstrarea echităţii şi respectul valorilor morale

In efectuarea unui studiu este necesară parcurgerea următoarelor etape

1 Pregătirea studiului

3

2 Elaborarea protocolului

3 Culegerea informaţiilor (datelor)

4 Prelucrarea datelor

5 Analiza şi interpretarea rezultatelor

6 Prezentarea rezultatelor

7 Redactarea studiului

3 Etapele unui studiu de cercetare

31 Pregătirea studiului de cercetare

Pregătirea studiului de cercetare comportă mai multe sub-etape

bull Documentarea bibliografică

bull Definirea fenomenului

bull Formularea temei de cercetare

bull Aspecte manageriale

Documentarea bibliografică

Cercetarea bibliografică are misiunea de a realiza un compromis icircntre excesul de documente (anual se

publică icircn icircntreaga lume peste 20000 de reviste cu caracter medical) şi pierderea de informaţii pertinente

Cercetarea bibliografică necesită o selectare şi o evaluare a literaturii de specialitate pe o anumită problemă şi

se realizează prin parcurgerea a trei etape

a) Prima etapă este cercetarea bibliografică propriu-zisă adică identificarea publicaţiilor care se referă la

subiectul icircn discuţie

Etapele documentării bibliografice sunt

bull Definirea şi delimitarea precisă a subiectului de cercetat

bull Stabilirea unei liste de bdquocuvinte cheierdquo prin lectura referinţelor bibliografice

bull Traducerea icircn limbi de circulaţie internaţională

bull Stabilirea unei liste cu documentele de cercetat

bull Consultarea unor tratate sau cărţi de referinţă

bull Consultarea publicaţiilor primare

bull Redactarea fişelor bibliografice şi aranjarea lor icircn ordine alfabetică

bull Introducerea referinţelor bibliografice icircn textul propriu-zis

Literatura primară de specialitate

Reprezintă toate materialele scrise care conţin studii originale

Articole ştiinţifice Au calitatea esenţială că informaţiile publicate sunt recente intervalul de timp scurs de la

scriere la publicare fiind icircn general foarte scurt

4

Teze de doctorat licenţă Se pot găsi icircn bibliotecile instituţiilor de icircnvăţămacircnt superior Sunt utile pentru că

icircn general tratează pe larg o anumită problemă care poate fi de interes avacircnd şi o bibliografie recentă

Brevete şi mărci Sunt acele sisteme de protecţie a produselor şi tehnologiilor Sunt utile icircn general icircn

cercetarea experimentală

Literatura secundară de specialitate

Tratate de specialitate Sunt foarte importante icircn faza incipieintă a unui studiu pentru aprofundarea problemei

de cercetat Informaţiile prezente icircn astfel de publicaţii sunt ordonate cu noţiuni de bază definiţii teorii

posibile etc

Cărţi de referinţă Sunt monografii care studiază pe larg un fenomen putacircnd fi foarte utile atacirct cercetătorilor

debutanţi cacirct şi celor iniţiaţi

Literatura terţiară de specialitate este reprezentată de indexuri reviste cu extrase de articole şi rezumate

Cercetarea bibliografică bdquoon-linerdquo permite accesul la nenumărate surse de informare utilizacircnd icircn acest scop

motoare de căutare

b) A doua etapă este lectura critică activă a publicaţiilor selectate pentru a judeca valoarea publicaţiilor

indiferent dacă este vorba de calitatea cercetării sau de pertinenţa rezultatelor publicate

Evaluarea corectă critică a unui articol va permite cititorului să aprecieze dacă publicaţia este credibilă

rezultatele corespund realităţii (validitatea internă) respectiv dacă informaţiile conţinute icircn publicaţie sunt

aplicabile icircn practica medicală dacă se pot generaliza dacă sunt aplicabile icircn proiectul de cercetare al

viitorului investigator (validitatea externă)

Lectura critică a literaturii medicale se bazează pe folosirea unei grile de lectură care are meritul de a putea fi

aplicată tuturor tipurilor de publicaţii Această grilă are 8 criterii de evaluare pentru fiecare criteriu trebuie să

se răspundă la următoarele icircntrebări

bull este posibil să se găsească icircn articol informaţia pentru criteriul icircn cauză

bull dacă criteriul abordat este corect

bull dacă criteriul este incorect icircn ce măsură ameninţă validitatea studiului

Cele 8 criterii de evaluare sunt

1 Obiectivul vizează următoarele preocupări medicale

bull istoria naturală a unei boli evoluţia şi prognosticul ei

bull performanţa unui test diagnostic

bull impactul unei intervenţii (terapeutice de depistare de prevenţie sau de educaţie)

Lectura critică va aşeza articolul icircn una din aceste situaţii apoi icircn raport cu obiectivul va stabili dacă are

ipoteze de verificat

5

2 Tipul de studiu Cititorul trebuie să recunoască planul de studiul pentru a verifica dacă tipul de studiu este

adaptat icircntrebării puse Va merge progresiv cu urmărirea de la raportul de caz-seria de cazuri la studiul

transversal studiul caz-control studiul de cohortă şi trialul controlat

3 Factorii studiaţi (variabila independentă) pot fi factori de expunere sau de intervenţie Cititorul trebuie să

poată recunoaşte factorul să aprecieze cum a fost măsurat dacă s-a folosit aceeaşi metodă de măsurare pentru

loturile icircn studiu ce metodă de comparaţie s-a folosit dacă sunt erori (factor de confuzie)

4 Criteriul de raţionament este evenimentul sau situaţia presupusă a fi rezultatul factorului studiat boala

decesul supravieţuirea complicaţiile etc Definirea precisă şi metoda de măsurare a rezultatului expunerii va

permite cititorului să aprecieze validitatea informaţiilor

5 Populaţia studiată (eşantionul) Se va urmări dacă este definită populaţia de referinţă şi populaţia de

studiat analizacircndu-se corectitudinea selecţiei randomizarea proporţia de subiecţi la sfacircrşitul studiului

validitatea externă a rezultatelor

6 Analiza datelor Cititorul trebuie să aprecieze dacă s-au examinat toate erorile inclusiv factorul de confuzie

dacă nu validitatea studiului ar putea fi compromisă

7 Rezultatele Principalele aspecte pe care cititorul le va urmări la acest capitol sunt dacă ele se datoresc

numai şansei dacă s-a făcut calculul statistic dacă s-a apreciat relaţia expunere-efect (RR OR RA) dacă a

fost apreciată semnificaţia clinică sau biologică care nu este identică cu semnificaţia statistică

8 Sinteza lecturii critice analizează concluziile autorilor dacă ele răspund icircntrebărilor formulate la icircnceputul

studiului dacă rezultatele sunt aplicabile la populaţia studiată dacă rezultatele sunt acceptabile pentru practica

proprie a cititorului dacă rezultatele justifică vreo schimbare icircn practica clinică respectiv vor ameliora starea

pacienţilor Această abordare cere cititorului cunoaşterea noţiunilor de bază icircn metodologia cercetării

ştiinţifice fiind vorba icircn acelaşi timp şi de un demers clinic

c) A treia etapă icircn cercetarea bibliografică constă icircn combinarea datelor din mai multe studii referitoare la

acelaşi subiect şi care se realizează prin meta-analiză Tehnica meta-analizei permite să se sporească

eficacitatea testării ipotezelor să crească forţa statistică a rezultatelor şi să se obţină informaţii care nu pot fi

convenabil extrase din fiecare cercetare

Definirea fenomenului

Definirea fenomenului se bazează pe

bull Cunoaşterea prealabilă a problemei prin documentare riguroasă documentare care poate justifica pertinenţa

temei propuse (revista literaturii de specialitate)

Icircn prima etapă se cercetează bibliografia propriu-zisă adică se identifică publicaţiile care se referă la subiectul

icircn discuţie apoi se vor selecta publicaţiile necesare studiului apreciind validitatea lor (problemele de

documentare bibliografică vor constitui un capitol separat)

bull Formularea unei ipoteze ştiinţifice sub-etapă care reprezintă fondul problemei

6

Ipoteza este o afirmaţie (nu o icircntrebare) despre o posibilă relaţie icircntre factorii studiaţi şi criteriile de

raţionament Ipoteza poate fi ipoteză ldquonulărdquo - nu există această relaţie şi ldquoalternativărdquo - există relaţia Ipoteza

va trebui apoi dovedită sau respinsă testul statistic calculează probabilitatea conform căreia asociaţia observată

este reală sau ea survine din icircntacircmplare

bull Motivarea organizării studiului Trebuie făcută o motivare corectă legată de inexistenţa unor studii

referitoare la problema pe care o va dezbate studiul

Formularea temei de studiu

Pentru formularea temei de studiu trebuiesc menţionate obiectivul sau obiectivele şi tipul de studiu ales pentru

cercetarea respectivă Există icircn general patru tipuri de obiective

bull obiective care se referă la evoluţia şi prognosticul unei icircmbolnăviri obiective prin care se icircncearcă

icircnţelegerea şi cunoaşterea unor evenimente ce pot să apară la un pacient pe parcursul bolii

bull obiective care se referă la etiologia bolii (cauze de natură bacteriană virală parazitară) sau la cauzalitate

(relaţia factor de risc-boală)

bull obiective legate de performanţa unor teste de diagnostic sau de screening de evaluare a strategiei de

diagnostic sau de interpretare a unui test

bull obiective care se referă la impactul unei intervenţii evaluarea unei intervenţii terapeutice de depistare a unor

boli de prevenţie de educare pentru sănătate

Obiectivele unui studiu se icircmpart icircn obiectivul major unul din cele patru enumerate şi obiective

secundare care pot aborda şi alte fenomene biologice decacirct cel major cu condiţia să nu altereze realizarea

acestuia Alegerea tipului de studiu este stracircns legată de obiectivul ales Dacă obiectivul este descrierea

distribuţiei caracteristicilor unei populaţii aprecierea frecvenţei unui fenomen de sănătate analiza acelui

fenomen icircn funcţie de timp loc persoană se va alege un studiu epidemiologic descriptiv studiu care nu are o

ipoteză fixată anterior O ipoteză se poate formula ca rezultat al studiului descriptiv dar nu se va face

verificarea ei icircn cadrul studiului Dacă intenţia studiului este de a emite o judecată asupra unei posibile relaţii

icircntre factorii studiaţi atunci problema de cercetat este fundamentată de o ipoteză care trebuie verificată

dovedită iar studiul care realizează acest lucru respectiv limitele studiilor utilizate

Aspectele manageriale

Aspectele manageriale includ

bull justificarea bugetului estimarea sumei necesară realizării studiului și apreciarea durate studiului

bull defalcarea bugetului pe necesități legate de achziționare de aparatură reactanți truse etc pentru personal

(munca depusă pregătire deplasări icircn teren participări la congrese sau conferințe documentare) materiale

consumabile etc

7

32 Elaborarea proiectului

Protocolul de cercetare este un document care emite obiectivul și ipoteza studiului definește condițiile de

desfășurare și realizare a viitorului studiu clinic Elaborarea protocolului este importantă pentru cercetătorii

participanţi la studiu comisiile de etică şi finanţatori

Protocolul include mai multe formulare care trebuie să cuprindă

a) Titlul proiectului

b) Sumarul proiectului

c) Descrierea proiectului

d) Normele deontologice de cercetare

e) Modalitățile de diseminarea și valorificarea rezultatelor

f) Perspective de continuare a cercetării

g) Anexe

Prezentarea proiectului va include următoarele fișiere

bull resursele umane (membrii echipei afilierea acestora)

bull relevanța temei pentru dezvoltarea cunoașterii icircn domeniu

bull stadiul actual al cunoașterii și bibliografia aferentă

bull justificarea studiului

bull enunțarea obiectivelor și ipoteza de lucru

bull metodologia propriu-zisă

Referitor la metodologia utilizată vor trebui menționate

bull factorulfactorii studiați care reprezintă variabila independentă respectiv dacă este cazul modalitățile de

măsurare

bull criteriile de raționament- variabila dependentă (situația sau evenimentul ce se presupune a fi rezultatul

factorului studiat cum ar fi boala handicapul complicații decesul)

bull tipul de studiu care se va aplica icircmpreună cu design-ul acestuia

bull eșantioanele de lucru și modalitățile de eșantionaj

bull metodele de culegere și de prelucrare a datelor

bull planificarea activităților

bull structura bugetului fiind eligibile următoarele categorii de cheltuieli de capital (echipamente software

upgrading) pentru personal (full sau part-time instruire asigurări de sănătate) de informare (documentare

abonamente) mobilități (vizite la alte unități de cercetare participări la

congrese) materiale consumabile (truse reactanți papetărie) valorificare a rezultatelor (lucrări științifice de

etapă sau lucrarea finală) cheltuieli indirecte (de regie)

bull modalităţile de valorificare a rezultatelor

bull legături de alte proiecte

8

Protocolul mai conține anexe curriculum vitae al investigatorului principal și al coinvestigatorilor

calendarul activităților avizul Comisiei de etică documente speciale și

consimțămacircntul informat icircn cazul studiilor pe subiecți umani

Icircnainte de implementare protocolul va fi verificat de experți pentru eligibilitate (dacă sunt icircndeplinite

condițiile de acceptare finanțare) calitate și pertinență icircn sensul că protocolul trebuie să fie clar exprimat

corect icircntocmit bine așezat și cu repercursiuni favorabile pentru viitor

33 Culegerea informaţiei

Pentru a realiza o cercetare medicală culegerea datelor este prima etapă şi realizează icircn funcţie de

obiectivele propuse tipul studiului timpul disponibil şi resurse umane şi financiare

Există două mari posibilităţi de culegere

bull Icircn funcţie de elementele studiate

o Culegerea exaustivă Toţi subiecţii populaţiei pe care dorim să o studiem Greu de realizat din cauza

costurilor foarte mari sau a alterării populaţiei de studiu

o Prin eşantionare Este metoda folosită icircn studii medicale

bull Icircn funcţie de durata culegerii

o Transversală Se studiază un grup la un moment dat

o Longitudinală Extinsă in timp

- Retrospectivă ndash icircnregistrări medicale

- Prospectivă ndash date culese la intervale prestabilite de timp

Populaţia ţintă

Este orice colectivitate icircntreagă de oameni animale plante sau obiecte de la care putem colecta date Populaţia

ţintă este icircntregul grup care ne interesează pe care dorim să-l descriem sau să tragem concluzii despre el

Pentru a putea realiza generalizări spre populaţia ţintă deseori suntem obligaţi să folosim un eşantion (selecţie)

care icircnsă trebuie să fie reprezentativ pentru populaţia pe care vrem să o studiem Pentru fiecare populaţie de

studiu sunt posibile mai multe eşantioane Pe baza acestor eşantioane se calculează un estimator Pe baza

acestui estimator calculat care poate fi medie aritmetică procent etc se pot trage concluzii despre icircntreaga

populaţie Este foarte important ca investigatorul să definească foarte atent şi complet populaţia icircnainte de a

realiza eşantionul inclusiv descrierea criteriilor de includere şi excludere icircn populaţia de studiu

Eşantionul

Un eşantion este practic un grup de elemente selectate dintr-un grup mai extins (populaţia ţintă) Studiind

eşantionul selectat se pot trage concluzii despre grupul de unde a fost ales (populaţia ţintă)

Este icircn general ales pentru studiu pentru că

bull Populaţia ţintă este prea mare şi nu poate fi studiată ca icircntreg

bull Nu avem acces din diverse motive decacirct la parte din populaţia de studiu

9

bull Un studiu pe icircntreaga populaţie poate distruge populaţia

bull Eşantioanele pot fi studiate mai rapid

bull Costul şi resursele necesare studiului sunt mai reduse

Numărul elementelor dintr-un eşantion se numeşte talia sau volumul selecţiei

Acesta fiind icircn general mai mic decacirct icircntreaga populaţie poate fi observat icircn detaliu iar dacă este reprezentativ

se pot afla prin intermediul său proprietăţile populaţiei ţintă

Eşantionul trebuie să fie reprezentativ pentru populaţia generală De aceea dintre metodele de eşantionare se

folosesc tehnicile de randomizare Trebuie să satisfacă două condiţii principale

bull condiţie de ordin cantitativ talia să fie suficient de mare

bull condiţie de ordin calitativ trebuie extras aleator din populaţia ţintă

Metode de eşantionare

Putem vorbi icircn linii mari de două posibilităţi de eşantionare prin metode probabilistice şi prin metode

nonprobabilistice

Eşantionarea probabilistică este metoda cea mai folosită icircn studiile medicale fiind şi cea indicată pentru a

realiza reprezentativitatea calitativă

Icircn medicină se folosesc patru tipuri de eşantionări

1 Simplu randomizat

2 Sistematic

3 Stratificat

4 Cluster (icircn cuiburi)

1 Eşantionul simplu randomizat Fiecare element din populaţia ţintă are o şansă egală non zero de a fi

inclus icircn eşantion Se ia la icircntacircmplare un număr de elemente egal cu talia eşantionului Dezavantajul acestui tip

de eşantionare este că presupune cunoaşterea icircntregii populaţii ţintă

2 Eşantionul sistematic După aflarea taliei eşantionului şi a populaţiei ţintă se calculează factorul de

eşantionare k icircmpărţind talia populaţiei ţintă la volumul eşantionului Apoi fiecare al k-lea element este

selectat spre includere

Acelaşi mare dezavantaj apare şi icircn acest caz fiind obligatorie cunoaşterea icircntregii populaţii de studiu

3 Eşantionul stratificat Există icircn cele mai multe cazuri probleme medicale care studiindu-se pe eşantion

prezintă variabilităţi icircn funcţie de caracteristicile populaţiei (sex vacircrstă nivel de pregătire etc) Icircn acest caz

este obligatorie realizarea similitudinii demografice a eşantionului cu populaţia de studiu Din date provenite

de la Centrul de Statistică putem dezvolta ca procente o structură a populaţiei Această structură trebuie să se

regăsească (procentual) şi icircntre membrii eşantionului O importantă şansă ca reprezentativitatea calitativă să fie

corectă este conferită de respectarea

acestei similitudini demografice

10

4 Eşantionul bdquoclusterrdquo sau icircn cuiburi Icircn cazul unui studiu amplu cu scop de a investiga populaţia unei

icircntregi ţări sau regiuni putem ajunge icircn imposibilitatea de a alege şi mai ales investiga indivizi răspacircndiţi prin

icircntreaga zonă Din acest motiv se desemnează la icircntacircmplare un număr calculabil de

grupuri populaţionale extinse icircn toată zona de studiu Aceste grupuri poartă numele de bdquocuiburirdquo La nivelul

fiecărui bdquocuibrdquo se aplică o tehnică precedentă de selecţie a cazurilor Se poate sau de cele mai multe ori se face

la nivel de bdquocuibrdquo stratificarea iar apoi selecţia propriu-zisă se realizează sistematic sau simplu randomizat

Este metoda de eşantionare cel mai frecvent utilizată icircn cercetarea medicală de amploare Pentru ca eventualele

erori să nu se poată strecura s-a definit şi un indice DEF (design effect) cu care trebuie multiplicată talia

selecţiei care pentru eşantionarea icircn bdquocuiburirdquo este egal cu 2 astfel putem obţine şi o reprezentativitate

calitativă dar şi una cantitativă

Eşantionarea nonprobabilistică este o metodă neindicată icircn studiile medicale datorită lipsei de forţă icircn ceea ce

priveşte posibilitatea de aplicare a concluziilor asupra populaţiei de studiu

Se definesc şi icircn acest caz patru metode

1 Eşantion de convenienţă Membrii unui astfel de eşantion sunt aleşi numai pentru că sunt la icircndemacircnă

disponibili de a răspunde le un eventual chestionar

2 Eşantion pe cote Similar cu tipul de eşantion stratificat se referă la faptul că selecţia se face formacircnd

eşantionul din primele 30 de persoane care respectă un criteriu impus

3 Eşantion cu un scop Elementele incluse icircn eşantion sunt alese după un criteriu care exclude din start marea

majoritate a populaţiei

4 Eşantion raţional Selecţia se face prin prisma unui raţionament al celui care conduce studiul

Parametru şi estimator

Parametrul este o valoare de obicei necunoscută (şi care trebuie să fie estimată prin studiu) folosită pentru a

reprezenta o anumită caracteristică a populaţiei de studiu De exemplu media populaţiei (icircnălţime) este un

parametru populaţional Raportat la o populaţie parametrul este o valoare fixă şi exactă care nu variază

Fiecare eşantion extras din populaţie va indica o valoare a mediei care nu poate decacirct să estimeze parametrul

Icircn general parametrii sunt notaţi cu litere greceşti (ex Media = μ)

Estimatorul este o valoare calculată dintr-un eşantion studiat Este folosit pentru a putea aprecia parametrul

populaţional pe care icircn căutăm Este de asemenea posibil ca dintr-o populaţie să formăm mai multe eşantioane

mediile lor de cele mai multe ori nefiind identice icircntre ele şi nici identice cu media populaţiei Estimatorii

sunt notaţi cu litere latine (ex Media = μ)

Dacă valoarea mediei calculată pe eşantion este de exemplu 168 cm atunci putem estima ca valoarea mediei

icircn populaţie este 168 cm

11

Tipuri de culegere a datelor

1 Culegere de tip eşantion reprezentativ Grupul de indivizi incluşi icircn studiu sunt reprezentativi (calitativ şi

cantitativ) pentru populaţia generală Poate fi utilizat pentru studii descriptive (cel mai frecvent) dar uneori şi

pentru studii analitice

Este necesar pentru acest tip de culegere a datelor ca iniţial să fie cunoscută talia eşantionului (calculabilă icircn

funcţie de prevalenţă şi precizie) Pentru evaluarea datelor culese se utilizează tabelul de contingenţă 2 x 2

astfel (Figura 1)

Figura 1 - Tabelul de contingenţă 2 x 2

Unde

a ndash persoane expuse unui factor de risc care au boala studiată

b ndash persoane expuse unui factor de risc care nu au boala studiată

c - persoane neexpuse unui factor de risc care au boala studiată

d - persoane neexpuse unui factor de risc care nu au boala studiată

După aranjarea datelor icircn tabelul de contingenţă (2 x 2) se poate icircncepe analiza statistică a datelor atacirct ca

procente calculabile cacirct şi din punct de vedere a aplicării de teste statistice pentru elucidarea semnificaţiei

statistice

Este posibilă din acest tip de culegere de date calcularea

1 Prevalenţei unei boli

2 Frecvenţei expunerii

3 Gradul de asociere icircntre factorul eventual de risc şi boala

2 Culegerea de tip expus ndash neexpus Icircmparte subiecţii icircn două categorii expuşi sau neexpuşi factorului de risc

studiat Ca evoluţie următoare a studiului după o astfel de culegere a datelor se poate evalua icircn timp apariţia

icircmbolnăvirii despre care se efectuează studiul Icircn timp longitudinal prospectiv se poate calcula dacă factorul

studiat reprezintă un risc de icircmbolnăvire este indiferent sau chiar este cu efect protectiv Numărul subiecţilor

din cele două grupuri poate fi egal sau poate fi diferit Numărul acestora poate fi calculat icircn vederea obţinerii

unei bune reprezentativităţi cu ajutorul formulelor de selecţie Avacircnd icircn vedere calitatea longitudinală a

12

studiului este important ca numărul ales să fie mai mare pentru a putea suplinii eventualele pierderi din

urmărire Practic rezultatele sunt introduse icircn tabelul 2 x 2 de unde se pot calcula indicatorii doriţi (Figura 2)

Avacircnd icircn vedere modul de culegere a datelor este permisă calcularea de indicatori numai pe orizontală

orice comparare icircntre coloana dreaptă şi stacircngă fiind incorectă Avantajul acestui tip de culegere a datelor ar fi

eventualul număr mai redus de subiecţi dar dezavantajul major este cel al costurilor de urmărire icircn timp dar

trebuie luată icircn calcul şi pierderea de subiecţi din evidenţe Factorul controlat este deci prezenţa expunerii iar

factorul aleator este prezenţa bolii

Figura 2 Tabelul de contingenţă pentru tipul de culegere expus ndash neexpus

4 Culegerea de tip caz ndash martor Icircn acest caz ceea ce ghidează colectarea datelor este prezenţa sau absenţa

bolii icircn momentul prezent Se vor culege date de la două loturi constituite după criteriul de bolnav B+ şi de fără

boală B+ Datele culese sunt icircn trecut deci caracterul datelor va fi retrospectiv Icircn acest caz factorul controlat

este boala factorul aleator fiind expunerea (Figura 3)

Calculul de indicatori icircn acest caz se va putea efectua numai icircntre coloane orice calcul icircntre valorile de pe linii

fiind greşit Rezultate semnificative se pot obţine icircn acest caz utilizacircnd loturi mai mici de studiu prin

comparaţie cu tipul eşantion reprezentativ permiţacircnd icircn acelaşi timp studiul bolilor rare (cu prevalenţă mică)

Figura 3 Tabelul de contingenţă pentru tipul de culegere caz ndash martor

Metode de culegere a datelor

Metoda aleasă pentru culegerea datelor trebuie să fie aleasă după un atent studiu bibliografic icircn vederea

stabilirii celui mai eficient mod de a răspunde temei de studiu

Metodele de culegere trebuie să fie bine aplicabile şi consistente ca aport informaţional necesar

13

1 Fiziologice Sunt colectate date despre anumite caracteristici fiziologice ale pacienţilor (TA glicemie

colesterol etc) Această metodă aduce rezultate obiective cacirct timp instrumentul de evaluare este bine calibrat

şi prezintă variaţii mici

2 Metode observaţionale Instrumentul de culegere a datelor trebuie să fie sincronizat cu protocolul conceput

de cercetător Datele culese trebuie să fie de asemenea consistente adică să fie colectate de aceeaşi manieră

conducătorul studiului trebuind să instruiască investigatorii (colectorii de date) Icircnregistrarea datelor trebuie să

fie de asemenea sistematică şi bine standardizată Observaţii de control trebuie icircn mod obligatoriu făcute

pentru a putea aprecia icircn mod corect orice deviere datorată unor factorii externi Este obligatorie luarea icircn

consideraţie a aspectelor etice

3 Interviul Poate fi structurat cu un set specific de icircntrebări sau nestructurat cu o temă generală cu care se

icircncepe interviul Interviurile pot fi icircnregistrate sau intervievatorul poate nota pur şi simplu răspunsurile Există

două tipuri generice de interviu interviul de profunzime care se referă la o discuţie icircn general structurată cu

un număr de icircntrebări prestabilite icircn icircncăperea de studiu fiind doară intervievatorul şi persoana chestionată şi

interviul de grup unde prin conversaţii pornind de la temă generală expusă şi condusă de intervievator se

obţin date despre subiecţii participanţi la studiu Ambele metode de interviu au indicaţiile lor precise Un

interviu pe teme intime nu va putea fi corect icircn ceea ce priveşte datele colectate dacă se aplică un interviu de

grup

4 Chestionarul Document scris adresat unor persoane pentru a răspunde la una sau mai multe icircntrebări

Trebuie să aducă răspunsurile la icircntrebările care motivează studiul constituind ansamblul icircntrebărilor destinate

culegerii de informaţii (date) Redactarea chestionarului trebuie să ţină cont de structura acestuia introducere

conţinut exprimarea icircntrebărilor grafica chestionarului

5 Icircnregistrări preexistente

Icircn cercetarea medicală sunt cel mai frecvent utilizate Informaţiile dorite sunt deja existente ceea ce icirci revine

cercetătorului este ca să structureze datele icircn funcţie de scopul studiului pe care icircn conduce Aceste surse sunt

bull Foi de observaţie

bull Registre de consultaţie

bull Buletine de analize

bull Registre de operaţii

Icircn cazul icircn care nici o metodă de culegere a datelor nu este pe placul celui ce conduce studiul există

posibilitatea de a construi un instrument nou de culegere a datelor

Acest proces trebuie să urmărească nişte paşi obligatorii fiind mare consumator de timp

bull Definirea structurii cu care se va face măsurarea

bull Formularea itemilor de măsură

bull Analiza validităţii instrumentului de măsură ndash măsoară acesta fenomenul corect

bull Elaborarea de instrucţiuni de utilizare pentru investigatori

14

bull Pretestarea instrumentului

bull Aprecierea validităţii interne şi externe a datelor culese

Instrumente de cercetare

Formularea clară a temei de cercetare necesită o foarte bună definire a factorilor studiaţi şi a criteriilor de

judecată Acestea din urmă sunt ultimele care vor trebui definite icircn cadrul protocolului de studiu

Alegerea unui instrument de măsură

Nu există un instrument de măsură perfect sau universal corect Alegerea sa dintre cele existente şi cele deja

utilizate depind de trei factori

bull Obiectivul studiului

bull Boala studiată

bull Populaţia icircn studiu

De aceste trei elemente trebuie ţinut cont icircn fiecare etapă a dezvoltării instrumentului

Definirea obiectivului

Studiu transversal Dacă se doreşte studierea unui simptom sau a unei caracteristici ale populaţiei se poate

icircmpărţi populaţia de studiu icircn mai multe grupuri Este practic vorba de a determina diferenţele dintre subiecţi

icircn cea ce priveşte o variabilă necesară studiată printr-un studiu transversal (utilizarea dozării de Ac HBS

pentru a evalua progresele bolnavilor de hepatită tip B)

Studiu longitudinal Icircn acest caz nu se poate icircmpărţii populaţia de studiu icircn mai multe grupuri datele obţinute

fiind de la acelaşi subiect colectate după un interval de timp

Icircn funcţie de boală şi populaţie se aleg şi instrumentele de măsură cele mai adecvate

Instrumentele cercetării reprezintă un mecanism specific sau o strategie pe care cercetătorul o utilizează pentru

colectarea prelucrarea şi inferenţa datelor Aceste instrumente sunt

1 Studiul icircn bibliotecă

2 Computerul

3 Determinările experimentale

4 Statistica

5 Mintea umană

6 Facilităţi de limbaj şi comunicare

Determinările experimentale

Măsurarea constă icircn aprecierea şi cuantificarea fenomenelor calitativ sau cantitativ Interpretarea

datelor se referă la transformarea lor icircn unităţi de descoperire a unor fenomene mai puţin cercetate

Standardele acceptate se referă la norme medii distribuţii etc Tot icircn cadrul interpretării datelor datele

obţinute sunt caracterizate pe scale de valori nominal ordinal de interval sau de raport

Validarea şi reproductibilitatea măsurătorilor sunt aspecte importante şi foarte necesare pentru o

cercetare corect fundamentată care doreşte obţinerea unor concluzii pertinente

15

Statistica Este implicată icircn condensarea şi procesarea unui volum mai mare de date astfel icircncacirct să se poată

interpreta corect valorile obţinute şi să se permită comparările Utilizarea unor teste statistice specifice permite

determinarea semnificaţiei (diferenţei) statistice astfel icircncacirct estimatorii să poată fi aplicaţi la populaţia

generală Furnizează informaţii şi privind corelarea sau relaţionarea icircntre date

Mintea umană este cea care reuşeşte să integreze şi să icircnţeleagă rezultatele obţinute Semnificaţia ştiinţifică

este stabilită icircn funcţie de rezultatele statisticii de mintea umană conform afirmaţiei bdquosemnificaţia ştiinţifică

nu este egală cu semnificaţia statisticărdquo Metodele aplicate pentru a putea ajunge la o concluzie pertinentă sunt

logica deductivă raţionamentul inductiv şi gacircndirea critică

Limbaj şi comunicare Exprimarea orală sau icircn scris permite nuanţarea unor aspecte seci cifrice ale unor

studii Icircn acest mod devine mai evidentă semnificaţia ştiinţifică a unor rezultate statistice

34 Prelucrarea datelor

Instrumentele de prelucrare

Statistica este o ştiinţă ramură a matematicii care studiază evoluţia fenomenelor şi proceselor

colective pe baza observării lor ştiinţifice a culegerii şi prelucrării detaliate a informaţiilor statistice cu scopul

de a formula şi explica legile legităţile şi regularităţile ce le guvernează

Statistica permite deci aprecierea unor parametrii populaţionali prin studiul unui număr redus de

elemente ale populaţiei icircn studiu (ţintă) O populaţie poate fi definită printr-un şir de valori care pot fi grupate

icircn funcţie de parametrul studiat (glicemie colesterol TAD TAS etc) Pentru fiecare astfel de şir se defineşte

o variabilă (care va purta nume propriu glicemie colesterol etc) Practic variabila este considerată o funcţie

ia valori posibil diferite de la un element la altul icircn funcţie de caracteristicile proprii acestora Sunt clasificate

icircn două grupe variabile cantitative (caracteristică măsurabilă) şi calitative (caracteristică ce nu poate fi

măsurată)

La racircndul lor variabilele calitative pot fi

bull Nominale ndash grupuri de elemente ce nu pot fi ordonate (culoarea părului)

bull Nominale ordonate ndash concluziile pot fi grupate (eficienţa unui tratament slabă bună foarte bună)

bull Binare ndash apar numai două posibilităţi (bolnav sănătos)

Variabilele cantitative pot fi

bull Continue ndash o variabilă măsurabilă care poate lua o infinitate de valori

bull Discrete ndash variabile care nu pot lua decacirct valori icircntregi

Statistica descriptivă

Există două ramuri ale statisticii statistica descriptivă şi statistica inferenţială

Statistica descriptivă (după cum rezultă din denumire) se ocupă cu descrierea unor valori obţinute ale unei

variabile studiate

16

Valorile pe care variabila le ia se constituie icircntr-o serie statistică Indicatorii care definesc o variabilă (serie)

sunt

1 Ale tendinţei centrale

Media aritmetică - notată de regulă cu

Mediana - este acea valoare din şirul de date care icircmparte icircn două părţi egale şirul ordonat de valori (atenţie

şirul este ordonat crescător) situacircndu-se la mijlocul seriei statistice

Dacă numărul de valori n este un număr impar atunci mediana este valoarea unde

Dacă n este par deci avem un număr par de valori mediana este definitatilde ca fiind

unde k = n2

Modul - constituie valoarea care apare cel mai des deci valoarea cu numărul cel mai mare de apariţii

2 De dispersie

Amplitudinea - este diferenţa dintre valoarea maximă şi cea minimă

A = Amax - Amin

Amplitudinea relativă - notată A este raportul dintre amplitudinea absolută şi media aritmetică a seriei de

date

Varianţa notată este un indicator de icircmprăştiere a datelor Formula de calcul este

Abaterea standard (S) sau deviaţia standard reprezintă rădăcina pătrată din varianţă (dispersie)

Coeficientul de variaţie se calculează ca un raport procentual icircntre abaterea standard şi valoarea medie a şirului

de valori

Eroarea standard intervine icircn estimarea intervalelor de confidenţă Se calculează astfel

17

3 De asimetrie (skewness) indică distribuţia datelor dacă sunt sau nu distribuite normal

4 De boltire (kurtosis) estimează boltirea sau aplatizarea curbei de distribuţie

Prezentarea descriptivă a datelor se face prin icircnregistrarea datelor culese icircn tabele care să reprezinte icircn mod

sintetic valorile măsurate

Icircn concluzie statistica descriptivă permite

bull Stabilirea comparabilităţii icircntre grupurile de studiu şi aprecierea prezenţei erorilor sau confuziei

bull Reprezentarea datelor icircn tabele permite evaluarea fiecărui pacient şi dacă a existat pierderi din studiu

Statistica inferenţială

Statistica inferenţială (inductivă) este partea de analiză a datelor care permite extrapolarea unei

concluzii trase pe baza unui eşantion spre populaţia ţintă pentru care a fost efectuat studiul

Scopul analizei statistice este de a evidenţia efectul unui tratament sau al unui factor de risc prin date obţinute

din eşantionul studiat spre populaţia ţintă Aceasta implică testarea ipotezelor statistice sau altfel spus testarea

semnificaţiei statistice Este una dintre cele mai importante momente ale studiului Cum rezultatele sunt

obţinute prin studiul unui eşantion există posibilitatea ca acestea să fie datorate icircntacircmplării Testele

statistice ne ajută să apreciem icircn ce măsură rezultatele sunt icircntacircmplătoare şi mai ales icircn ce măsură şi dacă se

pot aplica populaţiei generale Icircn acest scop se impune o valoare limită alfa 005 care reprezintă limita

superioară a probabilităţii ca rezultatul obţinut să fie greşit (datorat icircntacircmplării) Astfel icircn funcţie de tipul

variabilelor şi indicatorii descriptivi aplicaţi şi evaluaţi se aplică teste de semnificaţie statistică (Tabelul 1)

Tabelul 1 Alegerea testelor de semnificaţie statistică

Tipul datelor

18

Diferenţierea variabilelor din punctul de vedere a distribuţiei se face folosind testul de normalitate

Kolmogorov ndash Smirnov

Testul statistic reprezintă metoda de comparaţie a două sau mai multe populaţii prin intermediul unor

variabile observate ale lor

Scopul unui test statistic este de a defini realitatea

Definirea icircntrebării de cercetare (ipoteza clinică)

Tratamentul cu Nebivolol este la fel de eficient ca şi cel cu Valsartan icircn tratamentul

hipertensiunii arteriale

Transpunerea icircntrebării de cercetare icircn termeni statistici (ipoteza statistică)

Media tensiunii arteriale a pacienţilor trataţi cu Valsartan nu diferă semnificativ de media

tensiunii arteriale a pacienţilor trataţi cu Nebivolol

Etapele unui test statistic

1 Formularea problemei icircn termenii ipotezelor statistice

2 Alegerea şi calcularea parametrului statistic al testului

3 Regiunea critică

4 Concluzia testului

1 Formularea problemei icircn termenii ipotezelor statistice

Ipoteza nulă ipoteza care trebuie testată testul efectuacircndu-se sub prezumţia că ipoteza nulă ar

fi adevărată

Ipoteza alternativă acea ipoteză care icircntr-un sens sau altul contrazice ipoteza nulă Această

ipoteză se mai numeşte şi ipoteza de lucru

Ipoteza nulă tipuri

O coadă (ldquoone-tailedrdquo sau ldquoone-siderdquo)

Media este mai mare

Media este mai mică

Două cozi (ldquoone-tailedrdquo sau ldquoone-siderdquo)

Media este egală

2 Alegerea şi calcularea parametrului statistic al testului

Parametrul statistic al testului exprimă icircntr-o anumită formă diferenţa dintre elementele comparate

Ţinacircnd seama de faptul că eşantionul sau eşantioanele utilizate sunt aleator extrase din populaţiile care

fac obiectul testului parametrul statistic este o variabilă aleatoare de selecţie care urmează o anumită

lege de probabilitate

Un parametru statistic al testului bun trebuie să icircndeplinească două condiţii

19

Trebuie să se comporte diferit atunci cacircnd ipoteza nulă H0 este adevărată faţă de situaţia icircn

care ipoteza alternativă H1 este adevărată

Distribuţia de probabilitate a parametrului statistic al testului sub prezumţia că H0 este

adevărată este cunoscută

3 Regiunea critică

- Trebuie să fim capabili să decidem icircn funcţie de valoarea parametrului statistic calculat care dintre

ipoteze cea nulă sau cea alternativă este adevărată

- Dacă valoarea parametrului statistic aparţine regiunii critice ipoteza nulă H0 va fi respinsă şi va fi

acceptată ipoteza alternativă H1

- Dacă valoarea parametrului statistic nu aparţine regiunii critice ipoteza nulă H0 va fi acceptată

- Decidem mărimea regiunii critice

Pentru aceasta trebuie să specificăm mărimea riscului de eroare pe care icircl acceptăm

Pe scurt definim nivelul de semnificaţie notat cu a sau mărimea riscului pe care

suntem dispuşi să ni-l asumăm icircn respingerea ipotezei nule H0 icircn cazul icircn care aceasta

este adevărată De obicei se alege un nivel de semnificaţie icircntre 1 şi 5

Probabilitatea unei erori de tipul I

probabilitatea de respingere a ipotezei nule H0 icircn favoarea ipotezei alternative H1 icircn

condiţiile icircn care H0 este adevărată

probabilitatea unei erori de tipul I se notează cu a şi se mai numeşte nivel de

semnificaţie al testului

Probabilitatea unei erori de tipul II

probabilitatea acceptării ipotezei nule icircn condiţiile icircn care ipoteza alternativă H1 este

adevărată

această probabilitate se notează cu b

- Unilaterală la dreapta ndash valoarea parametrului statistic al testului este mai mare sau egală cu

valoarea din dreapta a intervalului critic

- Unilaterală la stacircnga ndash valoarea parametrului statistic al testului este mai mică sau egală cu

valoarea din stacircnga a intervalului critic

- Bilaterală ndash valoarea parametrului statistic al testului este mai mică sau egală cu valoarea extremă

din stacircnga regiunii critice sau mai mare sau egală cu valoarea extremă din dreapta regiunii critice

valorile extreme ale regiunii critice avacircnd nivele egale de semnificaţie

4 Concluzia testului

- Ipoteza nulă H0 este respinsă dacă valoarea parametrului statistic aparţine regiunii critice

20

- Regiunea critică trebuie astfel aleasă icircncacirct dacă ipoteza alternativă H1 este adevărată

probabilitatea de respingere a ipotezei nule H0 este mai mare decacirct icircn cazul icircn care ipoteza nulă H0

ar fi adevărată

- Acceptarea ipotezei nule H0 atunci cacircnd ipoteza alternativă H1 este adevărată este cunoscută ca şi

eroarea de tipul II

a probabilitatea ei se notează cu b

b măsoară bdquonivelul de eroarerdquo

- Icircn testarea oricărei ipoteze statistice există patru situaţii care determină dacă decizia noastră este

corectă sau nu

Cazuri

H0 este adevărată H0 este falsă

Concluzie H0 se acceptă decizie corectă eroare de tipul

II

H0 se

respinge

eroare de tipul I decizie corectă

Luarea deciziei pe baza valorii probabilităţii p de semnificaţie a testului

Icircn momentul icircn care prelucrăm statistic o serie de date dorim să ştim dacă rezultatele obţinute sunt sau

nu semnificative statistic

Răspunsul la această icircntrebare este dat de valoarea lui p calculată de orice program statistic la

prelucrarea unor date

Icircn cazul testelor statistice ipoteza nulă este respinsă dacă nivelul de semnificaţie este mai mic decacirct

005 iar programele de prelucrare statistică a datelor vor afişa o steluţă () icircn tabelul rezultatelor

21

Dacă p le 005 respingem ipoteza nulă şi acceptăm ipoteza alternativă (am obţinut semnificaţia

statistică)

Dacă p gt 005 acceptăm ipoteza nulă (nu am obţinut semnificaţia statistică)

p = 013

NU respingem ipoteza nulă

Risc de eroare de tip II

α = 005

p = 002

Respingem ipoteza nulă

Risc de eroare de tip I

Semnificaţia lui p

Criteriu de luare a deciziei cu privire la o ipoteză statistică nulă

Cuantifică şansa ca o decizie de respingere a ipotezei nule să fie greşită

Măsură a semnificaţiei statistice şi NU CLINICĂ

22

Semnificaţia lui p (reguli empirice)

001 le p lt 005 rezultatul e semnificativ statistic

0001 le p lt 001 rezultatul e icircnalt semnificativ statistic

p lt 0001 rezultatul e foarte icircnalt semnificativ statistic

p ge 005 rezultatul e considerat nesemnificativ statistic

Limite ale valorii p

Valoarea p NU ne dă informaţii despre

Şansa de beneficiu a unui pacient individual

Procentul de pacienţi care vor avea un beneficiu icircn urma instituirii procedurii medicale

Gradul de beneficiu expectat pentru un anumit pacient

Puterea unui test statistic

Este capacitatea de a detecta o diferenţă acolo unde există

Creşterea volumului eşantionului determină creşterea puterii testului statistic aplicat

Valoarea este icircn relaţie directă cu eroarea de tip II

Puterea = 1 ndash β

Cea mai utilizată modalitate de creştere a puterii unui test statistic este de a creşte volumul

eşantionului

Tipul scalei de măsură ndash testul statistic

Denumire test Interval Nominal Observaţii

Corelaţie Pearson 2 0 Există o relaţie liniară

χ2 0 2

Student 1 1 Doar 2 grupuri

ANOVA 1 1 2 sau mai multe grupuri

Student perechi 1 1 Eşantioane perechi

Măsurători repetate (ANOVA) 1 1 Mai mult de 2 grupuri date

perechi

Inferenţa statistică pe date calitativ e

Tabela de contingenţă 2times2

Riscuri şi raţii

Testul χ2 (testarea asocierii icircn tabela de contingenţă)

Testul Fisher

23

Testul z pentru proporţii

Testul McNemar

Tabela de contingenţă 2times2

Scale de tip nominal (dicotomiale tabela de contingenţă de 2times2) sau ordinal (tabela de contingenţă de

rtimesc)

Frecvenţa absolută (numărul de evenimente per categorie)

Tabela de contingenţă de 2times2 4 categorii

AP = adevărat pozitiv

FP = fals pozitiv

FN = fals negativ

AN = adevărat negativ

Ulcer deschis Ulcer vindecat Total

Recurenţă + AP = 1 FP = 5 = 1+5 = 6

Recurenţă - FN = 7 AN = 16 = 7+16 = 23

Total =1+7=8 =5+16=21 29

Riscuri şi raţii Mărimi ale asocierii

Denumire Formula Definiţie

Rata falşilor pozitivi =FP(FP+AN) Probabilitatea unui test fals + (α)

Rata falşilor negativi =FN(FN+AP) Probabilitatea unui test fals ndash (β)

Sensibilitate =AP(AP+FN) Probabilitatea unui test real + (1- β)

Specificitate =AN(AN+FP) Probabilitatea unui test real ndash (1- α)

Acurateţe =(AP+AN)n Probabilitatea generală a unei decizii corecte

Valoarea predictivă pozitivă =AP(AP+FP) Probabilitatea ca un test pozitiv să fie corect

Valoarea predictivă negativă =AN(AN+FN) Probabilitatea ca un test negativ să fie corect

Riscul relativ =AP(FP+AN)FN(AP+FP)

Rata şansei =(AP∙AN)(FN∙FP)

Riscul atribuabil =AP(AP+FP)-FN(FN+AN)

24

Denumire Formula

Rata falşilor pozitivi = 5(5+1) = 08334

Rata falşilor negativi = 7(7+16) = 03043

Sensibilitate = 1(1+7) = 01250

Specificitate = 16(16+5) = 07619

Acurateţe = (1+16)29 = 05862

Valoarea predictivă pozitivă = 1(1+5) = 01667

Valoarea predictivă negativă = 16(16+7) = 06957

Riscul relativ = 1(5+16)7(1+5) = 2142 = 050

Rata şansei = (1∙16)(7∙5) = 04571

Riscul atribuabil = 1(1+5)-7(7+16) = 01667-03043=-01376

Testarea asocierii icircn tabela de contingenţă

Testul χ2

Nu trebuie utilizat pentru eşantioane de volum mic

Testul este valid doar dacă valoarea expectată (aşteptată) pentru fiecare celulă este cel puţin

egală cu 1 şi frecvenţa absolută observată este de minim 5

Dacă aceste condiţii nu sunt icircndeplinite se aplică testul exact al lui Fisher (Fisherrsquos Exact Test)

Indică dacă cele două variabile sunt sau nu independente DAR NU cuantifică puterea asocierii

dintre ele

Problema S-a investigat icircntr-un studiu asocierea dintre obezitatea (ca factor de risc) şi bolile

cardio-vasculare la persoanele icircn etate (gt 60 ani) Din totalul de 620 persoane investigate s-au

identificat 150 persoane cu obezitate şi boală cardio-vasculară 230 persoane fără obezitate şi

fără boală cardio-vasculară şi 60 persoane fără obezitate dar cu boală cardio-vasculară Există

o asociere icircntre obezitate şi boala cardio-vasculară (df=1 α=005 χ2critic = 384)

Testul χ2 exemplu

H025

Nu există asociere icircntre obezitate şi bolile cardio-vasculare

Obezitatea şi bolile cardio-vasculare sunt independente

H1

Există asociere icircntre obezitate şi bolile cardio-vasculare

Obezitatea şi bolile cardio-vasculare sunt asociate

a = 005 pragul de semnificaţie al testului

urmează o lege cu (r-1)(c-1) grade de libertate

χ2 = parametrul testului χ2

fio = frecvenţa observată

fit = frecvenţa teoretică

Regiunea critică este [χα2 yen)

Pentru α = 005 χα2 = 384

OBSERVAT BCV+ BCV- Total

Obezitate + AP = 150 FP = 180 330

Obezitate - FN = 60 AN = 230 290

Total 210 410 620

TEORETIC BCV+ BCV- Total

Obezitate + = 330times210620 = 330times410620 330

Obezitate - = 290times210620 = 290times410620 290

Total 210 410 620

TEORETIC BCV+ BCV- Total

Obezitate + = 330times210620 = 330times410620 330

26

Obezitate - = 290times210620 = 290times410620 290

Total 210 410 620

TEORETIC BCV+ BCV-

Obezitate + = 112 = 218

Obezitate - = 98 = 192

Deoarece 4177Icirc[384 yen) se respinge H0 cu un risc de eroare de 5

Există asociere icircntre obezitate şi bolile cardio-vasculare

Testul Fisher

Corecţie a testului χ2

Valoarea p asociată parametrului ne dă probabilitatea ca valoarea observată de independenţă să fie

atribuită doar şansei

O valoare p mică indică că există alte cauze decacirct şansa influenţează rezultatul şi astfel cele două

variabile investigate nu sunt independente

Testul Fisher = dispersia corectată a factorului x dispersia corectată a factorilor reziduali

Icircn acest context regula adunării dispersiilor se poate scrie unde

este variaţia lui y pe seama variaţiei variabilei x

este variaţia lui y pe seama influenţei factorilor reziduali (neicircnregistraţi)

este variaţia totală a caracteristicii y

Testul Fisher empiric se calculează după formula

27

se compară cu Ftab pentru nx şi nz grade de libertate la un anumit prag de semnificaţie stabilit

Dacă Fc gt Ftab rezultă că variaţia factorului de grupare x este semnificativă pentru variaţia caracteristicii y

Testul z pentru proporţii

1 Compararea unei frecvenţe observate cu o frecvenţă teoretică

2 Testarea egalităţii a două frecvenţe

Testul z Compararea unei frecvenţe observate cu o frecvenţă teoretică

Scop Investigarea semnificaţiei diferenţei icircntre o frecvenţă teoretică p (icircntr-o populaţie) şi o frecvenţă

observată f pe un eşantion reprezentativ (variabilă calitativă (binare))

Condiţii de aplicare Testul este corect aplicat dacă numărul n al observaţiilor eşantionului este

suficient de mare (n∙p n∙(1-p)gt10

Parametrul

n = volumul eşantionului

Suntem interesaţi de investigarea prevalenţei hepatitei B la personalul care lucrează icircn laboratoarele

clinicilor de boli infecţioase din Transilvania Se ştie din studii anterioare că prevalenţa hepatitei B icircn

populaţia generală din Transilvania este de 9 S-a luat icircn studiu un eşantion de 100 persoane şi s-a

obţinut o prevalenţă a hepatitei B de 6 Există diferenţă semnificativă icircntre frecvenţa hepatitei B la

personalul care lucrează icircn laboratoarele spitalelor de boli infecţioase din Transilvania faţă de

populaţia generală

f = 006 p = 009 n = 100

Ipoteza nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat

faţă de frecvenţa hepatitei B icircn populaţia generală

Ipoteza alternativă test bilateral Există diferenţă semnificativă icircntre frecvenţa hepatitei B la

nivelul eşantionului şi prevalenţa hepatitei B icircn populaţia generală

f = 006 p = 009 n = 100

Pragul de semnificaţie a = 005

Regiunea critică test bilateral (-yen -196 ]Egrave[196 yen)

28

Concluzia testului

Deoarece parametrul statistic calculat al testului nu aparţine regiunii critice se acceptă ipoteza

nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat faţă de

frecvenţa hepatitei B icircn populaţia generală

Testul McNemar

Evaluarea dependenţei variabilelor calitative perechi (dorim să determinăm dacă o anumită

caracteristică este sau nu asociată cu o anumită patologie)

Identificăm n pacienţi care prezintă patologia de interes (eg Cancer bronho-pulmonar) şi n

pacienţi cu aceleaşi caracteristici ca şi primul grup dar care nu o prezintă

Martor = da Martor = nu

Caz = da a b

Caz = nu c d

Testul McNemar - exemplu fumat vs cancer

Martor = da Martor = nu

Cancer = da a = 2 b = 5

Cancer = nu c = 0 d = 3

29

χ2critic(α=005) = 384

32 lt 384 rarr acceptăm ipoteza nulă

Fumatul nu este icircn relaţie cu apariţia cancerului bronho-pulmonar

Inferenţa statistică pe date cantitative

Variabile cantitative continue

Testul z şi Student (t) (o medie sau medii perechi)

Testul z şi Student (t) (testarea a două medii)

ANOVA (ge 3 medii)

Ranguri (variabile cantitative discrete sau cantitative care nu icircndeplinesc condiţia de

normalitate)

Testul sumei rangurilor Wilcoxon

Kruskal-Wallis (ge 3 eşantioane independente)

Friedman (ge 3 eşantioane dependente)

Teste de normalitate variabile cantitative continue

Shapiro-Wilk

Kolmogorov-Smirnov

Shapiro-Wilk

Chi-Square Goodness-of-Fit

Dacă datele urmează o distribuţie normală aplicăm un test parametric

Dacă datele nu urmează o distribuţie normală aplicăm un test de comparare al rangurilor

30

Testul Z de comparare a mediei unui eşantion cu media unei populaţii

Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ

extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie

s2 care se cunoaşte

Condiţii de aplicare

1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru

compararea mediei unui eşantion cu media unei populaţii)

2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal

distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă

3 Talia eşantionului este mare ( ge 30)

Ipoteze

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media

eşantionului şi media populaţiei

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

(-yen -196 ] Egrave [196 yen)

Parametrul testului

n = volumul eşantionului

= media eşantionului

s = deviaţia standard a populaţiei

Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)

Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard

cunoscută

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi

media standard

Condiţii de aplicare

Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se

realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această

condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea

31

Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai

puternic

Numărul de grade de libertate (df) df = n-1

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

Parametrul testului

n = volumul eşantionului

micro0 = media standard

= media eşantionului

s = deviaţia standard a eşantionului

Testul ANOVA compararea mediilor a mai multe eşantioane

H0 = toate mediile sunt egale

H1 = nu toate mediile sunt egale

Condiţii de aplicare

1 Datele sunt independente unele faţă de celelalte

2 Datele fiecărui grup sunt normal distribuite

3 Deviaţia standard este aceeaşi pentru toate grupurile

Id Medicament

A B C D E F

1 5 6 7 10 5 9

2 6 8 8 11 8 8

3 7 7 9 13 6 7

4 8 9 11 12 4 5

32

5 9 10 10 9 7 6

Suma 35 40 45 55 30 35

Media 7 8 9 11 6 7

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =

= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)

Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2

F = (suma pătratelor(icircntre))(suma pătratelor(icircn))

Suma pătratelor (icircntre) = 16times5 = 80

Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60

Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn

interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare

SP df Media pătratelor F = MPicircntreMPicircn

Icircntre 80 5 = 805 = 16 = 1625 = 64

Icircn 60 24 = 6024 = 25

Total 140 29 -

Testul sumei rangurilor Wilcoxon

Aplicat pentru

Un set de observaţii provenite dintr-o valoare ipotetică comună

Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)

Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero

Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace

Suma rangurilor pentru diferenţele negative = 2+3+1 = 6

Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30

33

Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului

egal cu 8 = 0109

Icircnainte După Diferenţa Rang

64 66 -2 2

66 58 8 5

67 68 -1 3

71 65 6 4

72 75 -3 1

76 67 9 6

78 59 19 8

89 74 15 7

Testul Kruskal-Wallis (ge 3 eşantioane independente)

Test de ranguri aplicate pe mai mult de 3 eşantioane

H = parametrul testului

n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)

Tk = suma rangurilor

Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie

pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni

34

df = k-1 (k = numărul de eşantioane)

df = 3-1 = 2

Hcritic(α=005) = 599

H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie

pozitivă şi respectiv biopsie negativă

Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie

a tipului de studiu pe eşantioane perechi)

1 Definirea numărului de tratamente k

2 Obţinerea rangurilor pentru fiecare tratament

3 Sumarea rangurilor fiecărui tratament

4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)

5 Dacă Fr gt Frcritic rarr respingem H0

Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost

măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi

n = 9 k = 3 T12 = 225 T2

2 = 38025 T32 = 38025

Frcritic = 599

Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de

prostată

35

De reţinut

Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei

Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-

of-Fit

Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z

Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t

Compararea mediilor a 3 sau mai multe eşantioane ANOVA

Compararea mediilor a două populaţii (σ) testul Z

Compararea mediilor a două eşantioane (s) testul t

Compararea mediilor a două eşantioane perechi (s) testul t

ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi

cu cel pentru compararea a două eşantioane perechi

Ranguri

Distribuţia datelor nu are importanţă

Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)

Trei sau mai multe eşantioane Kruskal-Wallis

Trei sau mai multe eşantioane perechi Friedman

Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia

Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a

datelor)

Variabile nominale

Un singur eşantion sau eşantioane perechi

Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte

Eşantioane perechi testul Mc Nemar

Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2

Icircn analiza proporţiilor există teste diferite pentru

Compararea unei frecvenţe cu o frecvenţă cunoscută

Compararea a două frecvenţe

Semnificaţia statistică

Valoarea p (p value)

Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor

două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E

posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării

aleatorii

36

Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală

urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii

Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este

probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un

experiment de dimensiunea acestuia

Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că

diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii

diferite

Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca

fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă

ar fi fost adevărată

Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă

1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe

baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De

fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001

2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie

3 Se aplică testul statistic aferent pentru a calcula valoarea p

4 Se compară valoarea p cu valoarea ndash prag

5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe

semnificativă dpdv statisticrdquo

6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e

semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să

conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă

Teste de semnificaţie

Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului

populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)

Testarea ipotezelor implică posibile erori

Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile

sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui

grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul

icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005

ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există

37

nici o diferenţă

Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ

statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de

ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost

ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau

dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă

cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă

semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe

ipotetice variate icircn cazul icircn care ele există

Măsuri ale frecvenţei

Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)

Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate

Generic formula pe care se bazează toate cele trei este

unde x şi y sunt cantităţile de comparat

Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea

unei frecvenţe pe grupe de sex vacircrstă etc

Proporţia implică icircn mod necesar ca x să fie inclus icircn y

Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară

frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp

Pentru calcularea unei rate trebuie ţinut cont de trei aspecte

bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin

bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp

bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo

Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un

tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei

populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei

aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)

38

Indicatori

Rata de incidenţă

Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă

icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii

Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o

perioadă de timp

Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de

timp x

Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei

susceptibili de a dezvolta icircmbolnăvirea studiată

Numitorul poate fi

bull Numărul mediu al populaţiei icircn perioada de timp studiată

bull Mărimea populaţiei icircn mijlocul perioadei de studiu

bull Mărimea populaţiei la icircnceputul studiului

Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă

Este obligatorie menţionarea perioadei de timp

Prevalenţa

Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la

un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă

schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa

momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)

39

Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include

numai cazuri noi respectiv include cazuri noi şi vechi

Rata de atac

Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este

folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp

raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori

Rata persoană-timp

Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din

momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte

migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost

observate

Riscul relativ (RR)

Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment

legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele

prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două

grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la

bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la

bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai

mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo

Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2

Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn

cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă

(Tabelul 1)

Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR

Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la

neexpuşi

40

Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de

culegere a datelor

Odds ratio (OR)

Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin

raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general

studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)

Tabelul 2 Tabelul 2 x 2 pentru calcularea OR

Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală

Rate de mortalitate

Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp

specificată Există mai multe tipuri de rate de mortalitate

o Mortalitate specifică pe sex

o Mortalitate specifică pe rasă

o Mortalitate specifică pe boală

o Mortalitate neonatală

o Mortalitate postneonatală

o Mortalitate infantilă

o Mortalitate maternă

Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP

41

Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de

viaţă şi vacircrsta la care survine decesul dacă este prematur

Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu

Ani de viaţă pierduţi datorat dizabilităţii

Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt

utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru

cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite

grupuri

Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de

risc şi o boală se folosesc riscul relativ şi odds ratio

35 Analiza şi interpretarea datelor

După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date

trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul

Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor

colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului

studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu

plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde

prezenţa biostatisticianului este necesară

Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu

elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat

iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului

iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate

depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori

testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere

clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza

Interpretarea rezultatelor statistice

Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne

motive (număr mic de date) acceptarea ei să fie falsă

Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine

gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia

ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument

de decizie Intervalul de confidenţă

42

Interpretarea statistica ne interpretarea clinică

Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă

Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice

obţinute pe eşantionul studiat

Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare

Ce interpretăm Rezultatele

personale obţinute icircn urma studiului

care au fost prezentate icircn secţiunea bdquoRezultaterdquo

Explicăm rezultatele obţinute

Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale

Interpretarea trebuie să se realizeze icircn

lumina limitelor studiului

contextul cultural social şi educaţional al locului unde s-a realizat cercetarea

contextul a ceea ce se cunoaşte din literatura de specialitate

Interpretăm doar rezultatele personale obţinute icircn urma studiului

Interpretarea statistică nu este tot una cu interpretarea clinică

Interpretarea statistică este importantă

Interpretarea clinică este foarte importantă

Intervalul de confidenţă

Media calculată pe baza unui eşantion nu va echivala media populaţiei

Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului

Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a

populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a

populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)

pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru

orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare

dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de

confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de

date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de

5

Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel

Dacă valoarea p este mică

Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare

aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o

medie diferită Diferenţa este semnificativă dpdv statistic

43

Icircn continuare

Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa

reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică

pentru a fi interesante din punct de vedere ştiinţific

Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC

oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care

este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a

obţine o concluzie clară

Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o

diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că

datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din

punct de vedere ştiinţific

Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul

detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat

Erorile studiilor medicale

Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura

anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară

caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea

asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri

legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias

Erorile potenţiale icircn studiile epidemiologice

1 Erori icircntacircmplătoare

2 Erori sistematice

3 Confuzia

4 Validitatea

1 Erori icircntacircmplătoare

Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a

parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel

de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot

fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii

(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor

de măsură (eroarea de măsurare)

44

2 Erori sistematice

Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate

care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu

acurateţe mare Acurateţea nu este afectată de mărimea eşantionului

Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de

experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea

dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus

şi greu de cuantificat (consum de alcool personalitate etc)

Principalele tipuri de erori din această categorie sunt

bull Biasul de selecţie

bull Biasul de informaţie

Biasul de selecţie

Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul

trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion

inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale

persoanelor incluse

Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se

ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia

Biasul de informaţie

Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de

instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze

expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere

nesemnificativă sau chiar să nu şi-o amintească de loc

3 Confuzia

Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune

prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este

cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă

de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte

important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor

protector

4 Validitatea

Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă

Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte

estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional

Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă

45

conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se

demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)

Validitatea externă se poate realiza numai dacă studiul este valid intern

Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii

studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de

studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt

laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi

validă din punct de vedere intern)

3 6 Prezentarea rezultatelor

După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite

Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor

icircntr-o formă bdquodigerabilărdquo este necesară

Scopul prezentării datelor

1 Transmiterea concluziilor studiului

a Datele corecte şi importante merită comunicate

b Datele trebuie să confirme sau să infirme ipoteza studiului

c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală

2 Acordarea posibilităţii altor cercetători să aprecieze studiul

a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti

b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor

prezentate

Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru

fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie

statistică

Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de

valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras

(Tabel 3)

Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)

46

Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct

numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor

precum şi prezentarea acestora sub formă inteligibilă

Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care

convin cercetătorului

Prezentarea datelor se poate face

1 Figuri şi tabele icircn articole scrise

2 Figuri şi tabele icircn prezentări orale

3 Figuri şi tabele icircn postere

4 Text scris sau incluse icircn text

5 Site-uri de WEB

Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor

Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie

Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele

exprimacircnd exact ceea ce acestea exprimă

Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate

anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel

să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se

acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca

mai sus sugestive sunt formatele simple şi puţin icircncărcate

Dacă nu există reguli impuse se respectă

1 Mesaj simplu fără falsificarea datelor

2 De obicei este necesar atacirct tabelul cacirct şi graficul

3 Să fie simplu şi clar

Tabele

Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile

coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică

elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de

1 Se folosesc doar linii orizontale

2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn

evidenţi prin linie de separare (Tabelul 4)

Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland

Noua Zeelandă)

(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)

47

3 Numerele sunt aliniate icircn funcţie de virgulă

4 Indicii statistici sunt explicaţi sub tabel

5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană

6 Abrevierile pot fi folosite

7 Numărul de zecimale trebuie limitat la maxim două

8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel

9 Plasarea legendei este obligatorie sub tabel

10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)

Icircn cazul prezentărilor orale sau a posterelor este indicat ca

1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării

2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte

3 Folosirea de simboluri este permisă

Clasificarea tabelelor

Tabelele se clasifică după

i) conţinut

bull cu distribuţii de frecvenţe

bull de clase de frecvenţe

bull de contingenţă

ii) structura

bull cu doua coloane

bull cu subclasificări

bull ldquomasterrdquo

Tabele ce conţin distribuţii de frecvenţe

O modalitate comodă de a prezenta o mulţime de date brute este

1 Se ordonează datele in ordine crescătoare

2 Se determine frecvenţa fiecărei valori

3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane

(Tabelul 5)

Tabelul 5 Distribuţii de frecvenţă absolută

48

Tabelul claselor de frecvenţe

1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă

2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)

Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)

Tabele de contingenţă

1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a

tabelelor de contingenţă

2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a

combinaţiilor de perechi ordonate de valori

3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre

a factor de risc si

b starea sănătăţii

4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)

5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)

Tabelul 7 Tabel de contingenţă 2 x 2

49

Grafice

Există două categorii de moduri grafice sub care se pot prezenta datele

1 Ilustraţii şi fotografii

2 Grafice

1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă

pentru lucrare

2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit

Putem vorbi despre mai multe tipuri de grafice

bull Grafice pentru reprezentarea datelor cantitative

1048707 Grafic cartezian (X Y)

1048707 Histograma

1048707 Poligonul de frecvenţe

1048707 Diagrama bdquoscatterrdquo

bull Grafice pentru reprezentarea datelor calitative

1048707 Grafic cu bare

1048707 Diagrama tip bdquoboxplotrdquo

1048707 Diagrama bdquopierdquo

1048707 Cartograma

Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi

dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)

Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)

Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie

Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)

Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)

50

Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir

de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele

două variabile studiate (Figura 6)

Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2

(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2

rămacircne aproximativ constantă)

Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea

comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea

comparativă a mai multor variabile

Figura 7 Grafic calitativ cu bare

51

Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo

Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două

posibilităţi reprezentate grafic este mai frecventă (Figura 8)

Figura 8 Reprezentare tip bdquopierdquo

Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli

sau a oricărui element comparativ Se foloseşte de epidemiologi

Rezultate

Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare

Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o

manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu

explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția

bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la

ilustraţii tabele grafice

Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi

nici rezultatele care invalidează eventual ipoteza

Discuţii

Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd

cultura ştiinţifică şi inteligenţa autorilor

Acest capitol răspunde la trei obiective

Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia

calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de

selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează

rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv

52

este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn

care a fost abordată problema fără a face o revistă a literaturii

Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea

rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul

Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor

afirmaţii nesusţinute de conţinutul lucrării

Concluzii

Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate

să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie

Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de

concluzii va scădea valoarea lucrării

Bibliografia (lista referinţelor citarea icircn text)

Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn

lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente

Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli

- să conţină cele mai importante şi recente lucrări

- să includă numai lucrări publicate

- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate

Bibliografie

Elisabeta Jaba ndash Statistică Ed Economică 1998

Mihai Ţarcă ndash Statistică volI Ed UAIC 1979

Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale

Ed University Press 2009

Sorana Daniela Bolboacă ndash Metodologia cercetării curs

53

Page 4: cercetarea medicala - metodologie

2 Elaborarea protocolului

3 Culegerea informaţiilor (datelor)

4 Prelucrarea datelor

5 Analiza şi interpretarea rezultatelor

6 Prezentarea rezultatelor

7 Redactarea studiului

3 Etapele unui studiu de cercetare

31 Pregătirea studiului de cercetare

Pregătirea studiului de cercetare comportă mai multe sub-etape

bull Documentarea bibliografică

bull Definirea fenomenului

bull Formularea temei de cercetare

bull Aspecte manageriale

Documentarea bibliografică

Cercetarea bibliografică are misiunea de a realiza un compromis icircntre excesul de documente (anual se

publică icircn icircntreaga lume peste 20000 de reviste cu caracter medical) şi pierderea de informaţii pertinente

Cercetarea bibliografică necesită o selectare şi o evaluare a literaturii de specialitate pe o anumită problemă şi

se realizează prin parcurgerea a trei etape

a) Prima etapă este cercetarea bibliografică propriu-zisă adică identificarea publicaţiilor care se referă la

subiectul icircn discuţie

Etapele documentării bibliografice sunt

bull Definirea şi delimitarea precisă a subiectului de cercetat

bull Stabilirea unei liste de bdquocuvinte cheierdquo prin lectura referinţelor bibliografice

bull Traducerea icircn limbi de circulaţie internaţională

bull Stabilirea unei liste cu documentele de cercetat

bull Consultarea unor tratate sau cărţi de referinţă

bull Consultarea publicaţiilor primare

bull Redactarea fişelor bibliografice şi aranjarea lor icircn ordine alfabetică

bull Introducerea referinţelor bibliografice icircn textul propriu-zis

Literatura primară de specialitate

Reprezintă toate materialele scrise care conţin studii originale

Articole ştiinţifice Au calitatea esenţială că informaţiile publicate sunt recente intervalul de timp scurs de la

scriere la publicare fiind icircn general foarte scurt

4

Teze de doctorat licenţă Se pot găsi icircn bibliotecile instituţiilor de icircnvăţămacircnt superior Sunt utile pentru că

icircn general tratează pe larg o anumită problemă care poate fi de interes avacircnd şi o bibliografie recentă

Brevete şi mărci Sunt acele sisteme de protecţie a produselor şi tehnologiilor Sunt utile icircn general icircn

cercetarea experimentală

Literatura secundară de specialitate

Tratate de specialitate Sunt foarte importante icircn faza incipieintă a unui studiu pentru aprofundarea problemei

de cercetat Informaţiile prezente icircn astfel de publicaţii sunt ordonate cu noţiuni de bază definiţii teorii

posibile etc

Cărţi de referinţă Sunt monografii care studiază pe larg un fenomen putacircnd fi foarte utile atacirct cercetătorilor

debutanţi cacirct şi celor iniţiaţi

Literatura terţiară de specialitate este reprezentată de indexuri reviste cu extrase de articole şi rezumate

Cercetarea bibliografică bdquoon-linerdquo permite accesul la nenumărate surse de informare utilizacircnd icircn acest scop

motoare de căutare

b) A doua etapă este lectura critică activă a publicaţiilor selectate pentru a judeca valoarea publicaţiilor

indiferent dacă este vorba de calitatea cercetării sau de pertinenţa rezultatelor publicate

Evaluarea corectă critică a unui articol va permite cititorului să aprecieze dacă publicaţia este credibilă

rezultatele corespund realităţii (validitatea internă) respectiv dacă informaţiile conţinute icircn publicaţie sunt

aplicabile icircn practica medicală dacă se pot generaliza dacă sunt aplicabile icircn proiectul de cercetare al

viitorului investigator (validitatea externă)

Lectura critică a literaturii medicale se bazează pe folosirea unei grile de lectură care are meritul de a putea fi

aplicată tuturor tipurilor de publicaţii Această grilă are 8 criterii de evaluare pentru fiecare criteriu trebuie să

se răspundă la următoarele icircntrebări

bull este posibil să se găsească icircn articol informaţia pentru criteriul icircn cauză

bull dacă criteriul abordat este corect

bull dacă criteriul este incorect icircn ce măsură ameninţă validitatea studiului

Cele 8 criterii de evaluare sunt

1 Obiectivul vizează următoarele preocupări medicale

bull istoria naturală a unei boli evoluţia şi prognosticul ei

bull performanţa unui test diagnostic

bull impactul unei intervenţii (terapeutice de depistare de prevenţie sau de educaţie)

Lectura critică va aşeza articolul icircn una din aceste situaţii apoi icircn raport cu obiectivul va stabili dacă are

ipoteze de verificat

5

2 Tipul de studiu Cititorul trebuie să recunoască planul de studiul pentru a verifica dacă tipul de studiu este

adaptat icircntrebării puse Va merge progresiv cu urmărirea de la raportul de caz-seria de cazuri la studiul

transversal studiul caz-control studiul de cohortă şi trialul controlat

3 Factorii studiaţi (variabila independentă) pot fi factori de expunere sau de intervenţie Cititorul trebuie să

poată recunoaşte factorul să aprecieze cum a fost măsurat dacă s-a folosit aceeaşi metodă de măsurare pentru

loturile icircn studiu ce metodă de comparaţie s-a folosit dacă sunt erori (factor de confuzie)

4 Criteriul de raţionament este evenimentul sau situaţia presupusă a fi rezultatul factorului studiat boala

decesul supravieţuirea complicaţiile etc Definirea precisă şi metoda de măsurare a rezultatului expunerii va

permite cititorului să aprecieze validitatea informaţiilor

5 Populaţia studiată (eşantionul) Se va urmări dacă este definită populaţia de referinţă şi populaţia de

studiat analizacircndu-se corectitudinea selecţiei randomizarea proporţia de subiecţi la sfacircrşitul studiului

validitatea externă a rezultatelor

6 Analiza datelor Cititorul trebuie să aprecieze dacă s-au examinat toate erorile inclusiv factorul de confuzie

dacă nu validitatea studiului ar putea fi compromisă

7 Rezultatele Principalele aspecte pe care cititorul le va urmări la acest capitol sunt dacă ele se datoresc

numai şansei dacă s-a făcut calculul statistic dacă s-a apreciat relaţia expunere-efect (RR OR RA) dacă a

fost apreciată semnificaţia clinică sau biologică care nu este identică cu semnificaţia statistică

8 Sinteza lecturii critice analizează concluziile autorilor dacă ele răspund icircntrebărilor formulate la icircnceputul

studiului dacă rezultatele sunt aplicabile la populaţia studiată dacă rezultatele sunt acceptabile pentru practica

proprie a cititorului dacă rezultatele justifică vreo schimbare icircn practica clinică respectiv vor ameliora starea

pacienţilor Această abordare cere cititorului cunoaşterea noţiunilor de bază icircn metodologia cercetării

ştiinţifice fiind vorba icircn acelaşi timp şi de un demers clinic

c) A treia etapă icircn cercetarea bibliografică constă icircn combinarea datelor din mai multe studii referitoare la

acelaşi subiect şi care se realizează prin meta-analiză Tehnica meta-analizei permite să se sporească

eficacitatea testării ipotezelor să crească forţa statistică a rezultatelor şi să se obţină informaţii care nu pot fi

convenabil extrase din fiecare cercetare

Definirea fenomenului

Definirea fenomenului se bazează pe

bull Cunoaşterea prealabilă a problemei prin documentare riguroasă documentare care poate justifica pertinenţa

temei propuse (revista literaturii de specialitate)

Icircn prima etapă se cercetează bibliografia propriu-zisă adică se identifică publicaţiile care se referă la subiectul

icircn discuţie apoi se vor selecta publicaţiile necesare studiului apreciind validitatea lor (problemele de

documentare bibliografică vor constitui un capitol separat)

bull Formularea unei ipoteze ştiinţifice sub-etapă care reprezintă fondul problemei

6

Ipoteza este o afirmaţie (nu o icircntrebare) despre o posibilă relaţie icircntre factorii studiaţi şi criteriile de

raţionament Ipoteza poate fi ipoteză ldquonulărdquo - nu există această relaţie şi ldquoalternativărdquo - există relaţia Ipoteza

va trebui apoi dovedită sau respinsă testul statistic calculează probabilitatea conform căreia asociaţia observată

este reală sau ea survine din icircntacircmplare

bull Motivarea organizării studiului Trebuie făcută o motivare corectă legată de inexistenţa unor studii

referitoare la problema pe care o va dezbate studiul

Formularea temei de studiu

Pentru formularea temei de studiu trebuiesc menţionate obiectivul sau obiectivele şi tipul de studiu ales pentru

cercetarea respectivă Există icircn general patru tipuri de obiective

bull obiective care se referă la evoluţia şi prognosticul unei icircmbolnăviri obiective prin care se icircncearcă

icircnţelegerea şi cunoaşterea unor evenimente ce pot să apară la un pacient pe parcursul bolii

bull obiective care se referă la etiologia bolii (cauze de natură bacteriană virală parazitară) sau la cauzalitate

(relaţia factor de risc-boală)

bull obiective legate de performanţa unor teste de diagnostic sau de screening de evaluare a strategiei de

diagnostic sau de interpretare a unui test

bull obiective care se referă la impactul unei intervenţii evaluarea unei intervenţii terapeutice de depistare a unor

boli de prevenţie de educare pentru sănătate

Obiectivele unui studiu se icircmpart icircn obiectivul major unul din cele patru enumerate şi obiective

secundare care pot aborda şi alte fenomene biologice decacirct cel major cu condiţia să nu altereze realizarea

acestuia Alegerea tipului de studiu este stracircns legată de obiectivul ales Dacă obiectivul este descrierea

distribuţiei caracteristicilor unei populaţii aprecierea frecvenţei unui fenomen de sănătate analiza acelui

fenomen icircn funcţie de timp loc persoană se va alege un studiu epidemiologic descriptiv studiu care nu are o

ipoteză fixată anterior O ipoteză se poate formula ca rezultat al studiului descriptiv dar nu se va face

verificarea ei icircn cadrul studiului Dacă intenţia studiului este de a emite o judecată asupra unei posibile relaţii

icircntre factorii studiaţi atunci problema de cercetat este fundamentată de o ipoteză care trebuie verificată

dovedită iar studiul care realizează acest lucru respectiv limitele studiilor utilizate

Aspectele manageriale

Aspectele manageriale includ

bull justificarea bugetului estimarea sumei necesară realizării studiului și apreciarea durate studiului

bull defalcarea bugetului pe necesități legate de achziționare de aparatură reactanți truse etc pentru personal

(munca depusă pregătire deplasări icircn teren participări la congrese sau conferințe documentare) materiale

consumabile etc

7

32 Elaborarea proiectului

Protocolul de cercetare este un document care emite obiectivul și ipoteza studiului definește condițiile de

desfășurare și realizare a viitorului studiu clinic Elaborarea protocolului este importantă pentru cercetătorii

participanţi la studiu comisiile de etică şi finanţatori

Protocolul include mai multe formulare care trebuie să cuprindă

a) Titlul proiectului

b) Sumarul proiectului

c) Descrierea proiectului

d) Normele deontologice de cercetare

e) Modalitățile de diseminarea și valorificarea rezultatelor

f) Perspective de continuare a cercetării

g) Anexe

Prezentarea proiectului va include următoarele fișiere

bull resursele umane (membrii echipei afilierea acestora)

bull relevanța temei pentru dezvoltarea cunoașterii icircn domeniu

bull stadiul actual al cunoașterii și bibliografia aferentă

bull justificarea studiului

bull enunțarea obiectivelor și ipoteza de lucru

bull metodologia propriu-zisă

Referitor la metodologia utilizată vor trebui menționate

bull factorulfactorii studiați care reprezintă variabila independentă respectiv dacă este cazul modalitățile de

măsurare

bull criteriile de raționament- variabila dependentă (situația sau evenimentul ce se presupune a fi rezultatul

factorului studiat cum ar fi boala handicapul complicații decesul)

bull tipul de studiu care se va aplica icircmpreună cu design-ul acestuia

bull eșantioanele de lucru și modalitățile de eșantionaj

bull metodele de culegere și de prelucrare a datelor

bull planificarea activităților

bull structura bugetului fiind eligibile următoarele categorii de cheltuieli de capital (echipamente software

upgrading) pentru personal (full sau part-time instruire asigurări de sănătate) de informare (documentare

abonamente) mobilități (vizite la alte unități de cercetare participări la

congrese) materiale consumabile (truse reactanți papetărie) valorificare a rezultatelor (lucrări științifice de

etapă sau lucrarea finală) cheltuieli indirecte (de regie)

bull modalităţile de valorificare a rezultatelor

bull legături de alte proiecte

8

Protocolul mai conține anexe curriculum vitae al investigatorului principal și al coinvestigatorilor

calendarul activităților avizul Comisiei de etică documente speciale și

consimțămacircntul informat icircn cazul studiilor pe subiecți umani

Icircnainte de implementare protocolul va fi verificat de experți pentru eligibilitate (dacă sunt icircndeplinite

condițiile de acceptare finanțare) calitate și pertinență icircn sensul că protocolul trebuie să fie clar exprimat

corect icircntocmit bine așezat și cu repercursiuni favorabile pentru viitor

33 Culegerea informaţiei

Pentru a realiza o cercetare medicală culegerea datelor este prima etapă şi realizează icircn funcţie de

obiectivele propuse tipul studiului timpul disponibil şi resurse umane şi financiare

Există două mari posibilităţi de culegere

bull Icircn funcţie de elementele studiate

o Culegerea exaustivă Toţi subiecţii populaţiei pe care dorim să o studiem Greu de realizat din cauza

costurilor foarte mari sau a alterării populaţiei de studiu

o Prin eşantionare Este metoda folosită icircn studii medicale

bull Icircn funcţie de durata culegerii

o Transversală Se studiază un grup la un moment dat

o Longitudinală Extinsă in timp

- Retrospectivă ndash icircnregistrări medicale

- Prospectivă ndash date culese la intervale prestabilite de timp

Populaţia ţintă

Este orice colectivitate icircntreagă de oameni animale plante sau obiecte de la care putem colecta date Populaţia

ţintă este icircntregul grup care ne interesează pe care dorim să-l descriem sau să tragem concluzii despre el

Pentru a putea realiza generalizări spre populaţia ţintă deseori suntem obligaţi să folosim un eşantion (selecţie)

care icircnsă trebuie să fie reprezentativ pentru populaţia pe care vrem să o studiem Pentru fiecare populaţie de

studiu sunt posibile mai multe eşantioane Pe baza acestor eşantioane se calculează un estimator Pe baza

acestui estimator calculat care poate fi medie aritmetică procent etc se pot trage concluzii despre icircntreaga

populaţie Este foarte important ca investigatorul să definească foarte atent şi complet populaţia icircnainte de a

realiza eşantionul inclusiv descrierea criteriilor de includere şi excludere icircn populaţia de studiu

Eşantionul

Un eşantion este practic un grup de elemente selectate dintr-un grup mai extins (populaţia ţintă) Studiind

eşantionul selectat se pot trage concluzii despre grupul de unde a fost ales (populaţia ţintă)

Este icircn general ales pentru studiu pentru că

bull Populaţia ţintă este prea mare şi nu poate fi studiată ca icircntreg

bull Nu avem acces din diverse motive decacirct la parte din populaţia de studiu

9

bull Un studiu pe icircntreaga populaţie poate distruge populaţia

bull Eşantioanele pot fi studiate mai rapid

bull Costul şi resursele necesare studiului sunt mai reduse

Numărul elementelor dintr-un eşantion se numeşte talia sau volumul selecţiei

Acesta fiind icircn general mai mic decacirct icircntreaga populaţie poate fi observat icircn detaliu iar dacă este reprezentativ

se pot afla prin intermediul său proprietăţile populaţiei ţintă

Eşantionul trebuie să fie reprezentativ pentru populaţia generală De aceea dintre metodele de eşantionare se

folosesc tehnicile de randomizare Trebuie să satisfacă două condiţii principale

bull condiţie de ordin cantitativ talia să fie suficient de mare

bull condiţie de ordin calitativ trebuie extras aleator din populaţia ţintă

Metode de eşantionare

Putem vorbi icircn linii mari de două posibilităţi de eşantionare prin metode probabilistice şi prin metode

nonprobabilistice

Eşantionarea probabilistică este metoda cea mai folosită icircn studiile medicale fiind şi cea indicată pentru a

realiza reprezentativitatea calitativă

Icircn medicină se folosesc patru tipuri de eşantionări

1 Simplu randomizat

2 Sistematic

3 Stratificat

4 Cluster (icircn cuiburi)

1 Eşantionul simplu randomizat Fiecare element din populaţia ţintă are o şansă egală non zero de a fi

inclus icircn eşantion Se ia la icircntacircmplare un număr de elemente egal cu talia eşantionului Dezavantajul acestui tip

de eşantionare este că presupune cunoaşterea icircntregii populaţii ţintă

2 Eşantionul sistematic După aflarea taliei eşantionului şi a populaţiei ţintă se calculează factorul de

eşantionare k icircmpărţind talia populaţiei ţintă la volumul eşantionului Apoi fiecare al k-lea element este

selectat spre includere

Acelaşi mare dezavantaj apare şi icircn acest caz fiind obligatorie cunoaşterea icircntregii populaţii de studiu

3 Eşantionul stratificat Există icircn cele mai multe cazuri probleme medicale care studiindu-se pe eşantion

prezintă variabilităţi icircn funcţie de caracteristicile populaţiei (sex vacircrstă nivel de pregătire etc) Icircn acest caz

este obligatorie realizarea similitudinii demografice a eşantionului cu populaţia de studiu Din date provenite

de la Centrul de Statistică putem dezvolta ca procente o structură a populaţiei Această structură trebuie să se

regăsească (procentual) şi icircntre membrii eşantionului O importantă şansă ca reprezentativitatea calitativă să fie

corectă este conferită de respectarea

acestei similitudini demografice

10

4 Eşantionul bdquoclusterrdquo sau icircn cuiburi Icircn cazul unui studiu amplu cu scop de a investiga populaţia unei

icircntregi ţări sau regiuni putem ajunge icircn imposibilitatea de a alege şi mai ales investiga indivizi răspacircndiţi prin

icircntreaga zonă Din acest motiv se desemnează la icircntacircmplare un număr calculabil de

grupuri populaţionale extinse icircn toată zona de studiu Aceste grupuri poartă numele de bdquocuiburirdquo La nivelul

fiecărui bdquocuibrdquo se aplică o tehnică precedentă de selecţie a cazurilor Se poate sau de cele mai multe ori se face

la nivel de bdquocuibrdquo stratificarea iar apoi selecţia propriu-zisă se realizează sistematic sau simplu randomizat

Este metoda de eşantionare cel mai frecvent utilizată icircn cercetarea medicală de amploare Pentru ca eventualele

erori să nu se poată strecura s-a definit şi un indice DEF (design effect) cu care trebuie multiplicată talia

selecţiei care pentru eşantionarea icircn bdquocuiburirdquo este egal cu 2 astfel putem obţine şi o reprezentativitate

calitativă dar şi una cantitativă

Eşantionarea nonprobabilistică este o metodă neindicată icircn studiile medicale datorită lipsei de forţă icircn ceea ce

priveşte posibilitatea de aplicare a concluziilor asupra populaţiei de studiu

Se definesc şi icircn acest caz patru metode

1 Eşantion de convenienţă Membrii unui astfel de eşantion sunt aleşi numai pentru că sunt la icircndemacircnă

disponibili de a răspunde le un eventual chestionar

2 Eşantion pe cote Similar cu tipul de eşantion stratificat se referă la faptul că selecţia se face formacircnd

eşantionul din primele 30 de persoane care respectă un criteriu impus

3 Eşantion cu un scop Elementele incluse icircn eşantion sunt alese după un criteriu care exclude din start marea

majoritate a populaţiei

4 Eşantion raţional Selecţia se face prin prisma unui raţionament al celui care conduce studiul

Parametru şi estimator

Parametrul este o valoare de obicei necunoscută (şi care trebuie să fie estimată prin studiu) folosită pentru a

reprezenta o anumită caracteristică a populaţiei de studiu De exemplu media populaţiei (icircnălţime) este un

parametru populaţional Raportat la o populaţie parametrul este o valoare fixă şi exactă care nu variază

Fiecare eşantion extras din populaţie va indica o valoare a mediei care nu poate decacirct să estimeze parametrul

Icircn general parametrii sunt notaţi cu litere greceşti (ex Media = μ)

Estimatorul este o valoare calculată dintr-un eşantion studiat Este folosit pentru a putea aprecia parametrul

populaţional pe care icircn căutăm Este de asemenea posibil ca dintr-o populaţie să formăm mai multe eşantioane

mediile lor de cele mai multe ori nefiind identice icircntre ele şi nici identice cu media populaţiei Estimatorii

sunt notaţi cu litere latine (ex Media = μ)

Dacă valoarea mediei calculată pe eşantion este de exemplu 168 cm atunci putem estima ca valoarea mediei

icircn populaţie este 168 cm

11

Tipuri de culegere a datelor

1 Culegere de tip eşantion reprezentativ Grupul de indivizi incluşi icircn studiu sunt reprezentativi (calitativ şi

cantitativ) pentru populaţia generală Poate fi utilizat pentru studii descriptive (cel mai frecvent) dar uneori şi

pentru studii analitice

Este necesar pentru acest tip de culegere a datelor ca iniţial să fie cunoscută talia eşantionului (calculabilă icircn

funcţie de prevalenţă şi precizie) Pentru evaluarea datelor culese se utilizează tabelul de contingenţă 2 x 2

astfel (Figura 1)

Figura 1 - Tabelul de contingenţă 2 x 2

Unde

a ndash persoane expuse unui factor de risc care au boala studiată

b ndash persoane expuse unui factor de risc care nu au boala studiată

c - persoane neexpuse unui factor de risc care au boala studiată

d - persoane neexpuse unui factor de risc care nu au boala studiată

După aranjarea datelor icircn tabelul de contingenţă (2 x 2) se poate icircncepe analiza statistică a datelor atacirct ca

procente calculabile cacirct şi din punct de vedere a aplicării de teste statistice pentru elucidarea semnificaţiei

statistice

Este posibilă din acest tip de culegere de date calcularea

1 Prevalenţei unei boli

2 Frecvenţei expunerii

3 Gradul de asociere icircntre factorul eventual de risc şi boala

2 Culegerea de tip expus ndash neexpus Icircmparte subiecţii icircn două categorii expuşi sau neexpuşi factorului de risc

studiat Ca evoluţie următoare a studiului după o astfel de culegere a datelor se poate evalua icircn timp apariţia

icircmbolnăvirii despre care se efectuează studiul Icircn timp longitudinal prospectiv se poate calcula dacă factorul

studiat reprezintă un risc de icircmbolnăvire este indiferent sau chiar este cu efect protectiv Numărul subiecţilor

din cele două grupuri poate fi egal sau poate fi diferit Numărul acestora poate fi calculat icircn vederea obţinerii

unei bune reprezentativităţi cu ajutorul formulelor de selecţie Avacircnd icircn vedere calitatea longitudinală a

12

studiului este important ca numărul ales să fie mai mare pentru a putea suplinii eventualele pierderi din

urmărire Practic rezultatele sunt introduse icircn tabelul 2 x 2 de unde se pot calcula indicatorii doriţi (Figura 2)

Avacircnd icircn vedere modul de culegere a datelor este permisă calcularea de indicatori numai pe orizontală

orice comparare icircntre coloana dreaptă şi stacircngă fiind incorectă Avantajul acestui tip de culegere a datelor ar fi

eventualul număr mai redus de subiecţi dar dezavantajul major este cel al costurilor de urmărire icircn timp dar

trebuie luată icircn calcul şi pierderea de subiecţi din evidenţe Factorul controlat este deci prezenţa expunerii iar

factorul aleator este prezenţa bolii

Figura 2 Tabelul de contingenţă pentru tipul de culegere expus ndash neexpus

4 Culegerea de tip caz ndash martor Icircn acest caz ceea ce ghidează colectarea datelor este prezenţa sau absenţa

bolii icircn momentul prezent Se vor culege date de la două loturi constituite după criteriul de bolnav B+ şi de fără

boală B+ Datele culese sunt icircn trecut deci caracterul datelor va fi retrospectiv Icircn acest caz factorul controlat

este boala factorul aleator fiind expunerea (Figura 3)

Calculul de indicatori icircn acest caz se va putea efectua numai icircntre coloane orice calcul icircntre valorile de pe linii

fiind greşit Rezultate semnificative se pot obţine icircn acest caz utilizacircnd loturi mai mici de studiu prin

comparaţie cu tipul eşantion reprezentativ permiţacircnd icircn acelaşi timp studiul bolilor rare (cu prevalenţă mică)

Figura 3 Tabelul de contingenţă pentru tipul de culegere caz ndash martor

Metode de culegere a datelor

Metoda aleasă pentru culegerea datelor trebuie să fie aleasă după un atent studiu bibliografic icircn vederea

stabilirii celui mai eficient mod de a răspunde temei de studiu

Metodele de culegere trebuie să fie bine aplicabile şi consistente ca aport informaţional necesar

13

1 Fiziologice Sunt colectate date despre anumite caracteristici fiziologice ale pacienţilor (TA glicemie

colesterol etc) Această metodă aduce rezultate obiective cacirct timp instrumentul de evaluare este bine calibrat

şi prezintă variaţii mici

2 Metode observaţionale Instrumentul de culegere a datelor trebuie să fie sincronizat cu protocolul conceput

de cercetător Datele culese trebuie să fie de asemenea consistente adică să fie colectate de aceeaşi manieră

conducătorul studiului trebuind să instruiască investigatorii (colectorii de date) Icircnregistrarea datelor trebuie să

fie de asemenea sistematică şi bine standardizată Observaţii de control trebuie icircn mod obligatoriu făcute

pentru a putea aprecia icircn mod corect orice deviere datorată unor factorii externi Este obligatorie luarea icircn

consideraţie a aspectelor etice

3 Interviul Poate fi structurat cu un set specific de icircntrebări sau nestructurat cu o temă generală cu care se

icircncepe interviul Interviurile pot fi icircnregistrate sau intervievatorul poate nota pur şi simplu răspunsurile Există

două tipuri generice de interviu interviul de profunzime care se referă la o discuţie icircn general structurată cu

un număr de icircntrebări prestabilite icircn icircncăperea de studiu fiind doară intervievatorul şi persoana chestionată şi

interviul de grup unde prin conversaţii pornind de la temă generală expusă şi condusă de intervievator se

obţin date despre subiecţii participanţi la studiu Ambele metode de interviu au indicaţiile lor precise Un

interviu pe teme intime nu va putea fi corect icircn ceea ce priveşte datele colectate dacă se aplică un interviu de

grup

4 Chestionarul Document scris adresat unor persoane pentru a răspunde la una sau mai multe icircntrebări

Trebuie să aducă răspunsurile la icircntrebările care motivează studiul constituind ansamblul icircntrebărilor destinate

culegerii de informaţii (date) Redactarea chestionarului trebuie să ţină cont de structura acestuia introducere

conţinut exprimarea icircntrebărilor grafica chestionarului

5 Icircnregistrări preexistente

Icircn cercetarea medicală sunt cel mai frecvent utilizate Informaţiile dorite sunt deja existente ceea ce icirci revine

cercetătorului este ca să structureze datele icircn funcţie de scopul studiului pe care icircn conduce Aceste surse sunt

bull Foi de observaţie

bull Registre de consultaţie

bull Buletine de analize

bull Registre de operaţii

Icircn cazul icircn care nici o metodă de culegere a datelor nu este pe placul celui ce conduce studiul există

posibilitatea de a construi un instrument nou de culegere a datelor

Acest proces trebuie să urmărească nişte paşi obligatorii fiind mare consumator de timp

bull Definirea structurii cu care se va face măsurarea

bull Formularea itemilor de măsură

bull Analiza validităţii instrumentului de măsură ndash măsoară acesta fenomenul corect

bull Elaborarea de instrucţiuni de utilizare pentru investigatori

14

bull Pretestarea instrumentului

bull Aprecierea validităţii interne şi externe a datelor culese

Instrumente de cercetare

Formularea clară a temei de cercetare necesită o foarte bună definire a factorilor studiaţi şi a criteriilor de

judecată Acestea din urmă sunt ultimele care vor trebui definite icircn cadrul protocolului de studiu

Alegerea unui instrument de măsură

Nu există un instrument de măsură perfect sau universal corect Alegerea sa dintre cele existente şi cele deja

utilizate depind de trei factori

bull Obiectivul studiului

bull Boala studiată

bull Populaţia icircn studiu

De aceste trei elemente trebuie ţinut cont icircn fiecare etapă a dezvoltării instrumentului

Definirea obiectivului

Studiu transversal Dacă se doreşte studierea unui simptom sau a unei caracteristici ale populaţiei se poate

icircmpărţi populaţia de studiu icircn mai multe grupuri Este practic vorba de a determina diferenţele dintre subiecţi

icircn cea ce priveşte o variabilă necesară studiată printr-un studiu transversal (utilizarea dozării de Ac HBS

pentru a evalua progresele bolnavilor de hepatită tip B)

Studiu longitudinal Icircn acest caz nu se poate icircmpărţii populaţia de studiu icircn mai multe grupuri datele obţinute

fiind de la acelaşi subiect colectate după un interval de timp

Icircn funcţie de boală şi populaţie se aleg şi instrumentele de măsură cele mai adecvate

Instrumentele cercetării reprezintă un mecanism specific sau o strategie pe care cercetătorul o utilizează pentru

colectarea prelucrarea şi inferenţa datelor Aceste instrumente sunt

1 Studiul icircn bibliotecă

2 Computerul

3 Determinările experimentale

4 Statistica

5 Mintea umană

6 Facilităţi de limbaj şi comunicare

Determinările experimentale

Măsurarea constă icircn aprecierea şi cuantificarea fenomenelor calitativ sau cantitativ Interpretarea

datelor se referă la transformarea lor icircn unităţi de descoperire a unor fenomene mai puţin cercetate

Standardele acceptate se referă la norme medii distribuţii etc Tot icircn cadrul interpretării datelor datele

obţinute sunt caracterizate pe scale de valori nominal ordinal de interval sau de raport

Validarea şi reproductibilitatea măsurătorilor sunt aspecte importante şi foarte necesare pentru o

cercetare corect fundamentată care doreşte obţinerea unor concluzii pertinente

15

Statistica Este implicată icircn condensarea şi procesarea unui volum mai mare de date astfel icircncacirct să se poată

interpreta corect valorile obţinute şi să se permită comparările Utilizarea unor teste statistice specifice permite

determinarea semnificaţiei (diferenţei) statistice astfel icircncacirct estimatorii să poată fi aplicaţi la populaţia

generală Furnizează informaţii şi privind corelarea sau relaţionarea icircntre date

Mintea umană este cea care reuşeşte să integreze şi să icircnţeleagă rezultatele obţinute Semnificaţia ştiinţifică

este stabilită icircn funcţie de rezultatele statisticii de mintea umană conform afirmaţiei bdquosemnificaţia ştiinţifică

nu este egală cu semnificaţia statisticărdquo Metodele aplicate pentru a putea ajunge la o concluzie pertinentă sunt

logica deductivă raţionamentul inductiv şi gacircndirea critică

Limbaj şi comunicare Exprimarea orală sau icircn scris permite nuanţarea unor aspecte seci cifrice ale unor

studii Icircn acest mod devine mai evidentă semnificaţia ştiinţifică a unor rezultate statistice

34 Prelucrarea datelor

Instrumentele de prelucrare

Statistica este o ştiinţă ramură a matematicii care studiază evoluţia fenomenelor şi proceselor

colective pe baza observării lor ştiinţifice a culegerii şi prelucrării detaliate a informaţiilor statistice cu scopul

de a formula şi explica legile legităţile şi regularităţile ce le guvernează

Statistica permite deci aprecierea unor parametrii populaţionali prin studiul unui număr redus de

elemente ale populaţiei icircn studiu (ţintă) O populaţie poate fi definită printr-un şir de valori care pot fi grupate

icircn funcţie de parametrul studiat (glicemie colesterol TAD TAS etc) Pentru fiecare astfel de şir se defineşte

o variabilă (care va purta nume propriu glicemie colesterol etc) Practic variabila este considerată o funcţie

ia valori posibil diferite de la un element la altul icircn funcţie de caracteristicile proprii acestora Sunt clasificate

icircn două grupe variabile cantitative (caracteristică măsurabilă) şi calitative (caracteristică ce nu poate fi

măsurată)

La racircndul lor variabilele calitative pot fi

bull Nominale ndash grupuri de elemente ce nu pot fi ordonate (culoarea părului)

bull Nominale ordonate ndash concluziile pot fi grupate (eficienţa unui tratament slabă bună foarte bună)

bull Binare ndash apar numai două posibilităţi (bolnav sănătos)

Variabilele cantitative pot fi

bull Continue ndash o variabilă măsurabilă care poate lua o infinitate de valori

bull Discrete ndash variabile care nu pot lua decacirct valori icircntregi

Statistica descriptivă

Există două ramuri ale statisticii statistica descriptivă şi statistica inferenţială

Statistica descriptivă (după cum rezultă din denumire) se ocupă cu descrierea unor valori obţinute ale unei

variabile studiate

16

Valorile pe care variabila le ia se constituie icircntr-o serie statistică Indicatorii care definesc o variabilă (serie)

sunt

1 Ale tendinţei centrale

Media aritmetică - notată de regulă cu

Mediana - este acea valoare din şirul de date care icircmparte icircn două părţi egale şirul ordonat de valori (atenţie

şirul este ordonat crescător) situacircndu-se la mijlocul seriei statistice

Dacă numărul de valori n este un număr impar atunci mediana este valoarea unde

Dacă n este par deci avem un număr par de valori mediana este definitatilde ca fiind

unde k = n2

Modul - constituie valoarea care apare cel mai des deci valoarea cu numărul cel mai mare de apariţii

2 De dispersie

Amplitudinea - este diferenţa dintre valoarea maximă şi cea minimă

A = Amax - Amin

Amplitudinea relativă - notată A este raportul dintre amplitudinea absolută şi media aritmetică a seriei de

date

Varianţa notată este un indicator de icircmprăştiere a datelor Formula de calcul este

Abaterea standard (S) sau deviaţia standard reprezintă rădăcina pătrată din varianţă (dispersie)

Coeficientul de variaţie se calculează ca un raport procentual icircntre abaterea standard şi valoarea medie a şirului

de valori

Eroarea standard intervine icircn estimarea intervalelor de confidenţă Se calculează astfel

17

3 De asimetrie (skewness) indică distribuţia datelor dacă sunt sau nu distribuite normal

4 De boltire (kurtosis) estimează boltirea sau aplatizarea curbei de distribuţie

Prezentarea descriptivă a datelor se face prin icircnregistrarea datelor culese icircn tabele care să reprezinte icircn mod

sintetic valorile măsurate

Icircn concluzie statistica descriptivă permite

bull Stabilirea comparabilităţii icircntre grupurile de studiu şi aprecierea prezenţei erorilor sau confuziei

bull Reprezentarea datelor icircn tabele permite evaluarea fiecărui pacient şi dacă a existat pierderi din studiu

Statistica inferenţială

Statistica inferenţială (inductivă) este partea de analiză a datelor care permite extrapolarea unei

concluzii trase pe baza unui eşantion spre populaţia ţintă pentru care a fost efectuat studiul

Scopul analizei statistice este de a evidenţia efectul unui tratament sau al unui factor de risc prin date obţinute

din eşantionul studiat spre populaţia ţintă Aceasta implică testarea ipotezelor statistice sau altfel spus testarea

semnificaţiei statistice Este una dintre cele mai importante momente ale studiului Cum rezultatele sunt

obţinute prin studiul unui eşantion există posibilitatea ca acestea să fie datorate icircntacircmplării Testele

statistice ne ajută să apreciem icircn ce măsură rezultatele sunt icircntacircmplătoare şi mai ales icircn ce măsură şi dacă se

pot aplica populaţiei generale Icircn acest scop se impune o valoare limită alfa 005 care reprezintă limita

superioară a probabilităţii ca rezultatul obţinut să fie greşit (datorat icircntacircmplării) Astfel icircn funcţie de tipul

variabilelor şi indicatorii descriptivi aplicaţi şi evaluaţi se aplică teste de semnificaţie statistică (Tabelul 1)

Tabelul 1 Alegerea testelor de semnificaţie statistică

Tipul datelor

18

Diferenţierea variabilelor din punctul de vedere a distribuţiei se face folosind testul de normalitate

Kolmogorov ndash Smirnov

Testul statistic reprezintă metoda de comparaţie a două sau mai multe populaţii prin intermediul unor

variabile observate ale lor

Scopul unui test statistic este de a defini realitatea

Definirea icircntrebării de cercetare (ipoteza clinică)

Tratamentul cu Nebivolol este la fel de eficient ca şi cel cu Valsartan icircn tratamentul

hipertensiunii arteriale

Transpunerea icircntrebării de cercetare icircn termeni statistici (ipoteza statistică)

Media tensiunii arteriale a pacienţilor trataţi cu Valsartan nu diferă semnificativ de media

tensiunii arteriale a pacienţilor trataţi cu Nebivolol

Etapele unui test statistic

1 Formularea problemei icircn termenii ipotezelor statistice

2 Alegerea şi calcularea parametrului statistic al testului

3 Regiunea critică

4 Concluzia testului

1 Formularea problemei icircn termenii ipotezelor statistice

Ipoteza nulă ipoteza care trebuie testată testul efectuacircndu-se sub prezumţia că ipoteza nulă ar

fi adevărată

Ipoteza alternativă acea ipoteză care icircntr-un sens sau altul contrazice ipoteza nulă Această

ipoteză se mai numeşte şi ipoteza de lucru

Ipoteza nulă tipuri

O coadă (ldquoone-tailedrdquo sau ldquoone-siderdquo)

Media este mai mare

Media este mai mică

Două cozi (ldquoone-tailedrdquo sau ldquoone-siderdquo)

Media este egală

2 Alegerea şi calcularea parametrului statistic al testului

Parametrul statistic al testului exprimă icircntr-o anumită formă diferenţa dintre elementele comparate

Ţinacircnd seama de faptul că eşantionul sau eşantioanele utilizate sunt aleator extrase din populaţiile care

fac obiectul testului parametrul statistic este o variabilă aleatoare de selecţie care urmează o anumită

lege de probabilitate

Un parametru statistic al testului bun trebuie să icircndeplinească două condiţii

19

Trebuie să se comporte diferit atunci cacircnd ipoteza nulă H0 este adevărată faţă de situaţia icircn

care ipoteza alternativă H1 este adevărată

Distribuţia de probabilitate a parametrului statistic al testului sub prezumţia că H0 este

adevărată este cunoscută

3 Regiunea critică

- Trebuie să fim capabili să decidem icircn funcţie de valoarea parametrului statistic calculat care dintre

ipoteze cea nulă sau cea alternativă este adevărată

- Dacă valoarea parametrului statistic aparţine regiunii critice ipoteza nulă H0 va fi respinsă şi va fi

acceptată ipoteza alternativă H1

- Dacă valoarea parametrului statistic nu aparţine regiunii critice ipoteza nulă H0 va fi acceptată

- Decidem mărimea regiunii critice

Pentru aceasta trebuie să specificăm mărimea riscului de eroare pe care icircl acceptăm

Pe scurt definim nivelul de semnificaţie notat cu a sau mărimea riscului pe care

suntem dispuşi să ni-l asumăm icircn respingerea ipotezei nule H0 icircn cazul icircn care aceasta

este adevărată De obicei se alege un nivel de semnificaţie icircntre 1 şi 5

Probabilitatea unei erori de tipul I

probabilitatea de respingere a ipotezei nule H0 icircn favoarea ipotezei alternative H1 icircn

condiţiile icircn care H0 este adevărată

probabilitatea unei erori de tipul I se notează cu a şi se mai numeşte nivel de

semnificaţie al testului

Probabilitatea unei erori de tipul II

probabilitatea acceptării ipotezei nule icircn condiţiile icircn care ipoteza alternativă H1 este

adevărată

această probabilitate se notează cu b

- Unilaterală la dreapta ndash valoarea parametrului statistic al testului este mai mare sau egală cu

valoarea din dreapta a intervalului critic

- Unilaterală la stacircnga ndash valoarea parametrului statistic al testului este mai mică sau egală cu

valoarea din stacircnga a intervalului critic

- Bilaterală ndash valoarea parametrului statistic al testului este mai mică sau egală cu valoarea extremă

din stacircnga regiunii critice sau mai mare sau egală cu valoarea extremă din dreapta regiunii critice

valorile extreme ale regiunii critice avacircnd nivele egale de semnificaţie

4 Concluzia testului

- Ipoteza nulă H0 este respinsă dacă valoarea parametrului statistic aparţine regiunii critice

20

- Regiunea critică trebuie astfel aleasă icircncacirct dacă ipoteza alternativă H1 este adevărată

probabilitatea de respingere a ipotezei nule H0 este mai mare decacirct icircn cazul icircn care ipoteza nulă H0

ar fi adevărată

- Acceptarea ipotezei nule H0 atunci cacircnd ipoteza alternativă H1 este adevărată este cunoscută ca şi

eroarea de tipul II

a probabilitatea ei se notează cu b

b măsoară bdquonivelul de eroarerdquo

- Icircn testarea oricărei ipoteze statistice există patru situaţii care determină dacă decizia noastră este

corectă sau nu

Cazuri

H0 este adevărată H0 este falsă

Concluzie H0 se acceptă decizie corectă eroare de tipul

II

H0 se

respinge

eroare de tipul I decizie corectă

Luarea deciziei pe baza valorii probabilităţii p de semnificaţie a testului

Icircn momentul icircn care prelucrăm statistic o serie de date dorim să ştim dacă rezultatele obţinute sunt sau

nu semnificative statistic

Răspunsul la această icircntrebare este dat de valoarea lui p calculată de orice program statistic la

prelucrarea unor date

Icircn cazul testelor statistice ipoteza nulă este respinsă dacă nivelul de semnificaţie este mai mic decacirct

005 iar programele de prelucrare statistică a datelor vor afişa o steluţă () icircn tabelul rezultatelor

21

Dacă p le 005 respingem ipoteza nulă şi acceptăm ipoteza alternativă (am obţinut semnificaţia

statistică)

Dacă p gt 005 acceptăm ipoteza nulă (nu am obţinut semnificaţia statistică)

p = 013

NU respingem ipoteza nulă

Risc de eroare de tip II

α = 005

p = 002

Respingem ipoteza nulă

Risc de eroare de tip I

Semnificaţia lui p

Criteriu de luare a deciziei cu privire la o ipoteză statistică nulă

Cuantifică şansa ca o decizie de respingere a ipotezei nule să fie greşită

Măsură a semnificaţiei statistice şi NU CLINICĂ

22

Semnificaţia lui p (reguli empirice)

001 le p lt 005 rezultatul e semnificativ statistic

0001 le p lt 001 rezultatul e icircnalt semnificativ statistic

p lt 0001 rezultatul e foarte icircnalt semnificativ statistic

p ge 005 rezultatul e considerat nesemnificativ statistic

Limite ale valorii p

Valoarea p NU ne dă informaţii despre

Şansa de beneficiu a unui pacient individual

Procentul de pacienţi care vor avea un beneficiu icircn urma instituirii procedurii medicale

Gradul de beneficiu expectat pentru un anumit pacient

Puterea unui test statistic

Este capacitatea de a detecta o diferenţă acolo unde există

Creşterea volumului eşantionului determină creşterea puterii testului statistic aplicat

Valoarea este icircn relaţie directă cu eroarea de tip II

Puterea = 1 ndash β

Cea mai utilizată modalitate de creştere a puterii unui test statistic este de a creşte volumul

eşantionului

Tipul scalei de măsură ndash testul statistic

Denumire test Interval Nominal Observaţii

Corelaţie Pearson 2 0 Există o relaţie liniară

χ2 0 2

Student 1 1 Doar 2 grupuri

ANOVA 1 1 2 sau mai multe grupuri

Student perechi 1 1 Eşantioane perechi

Măsurători repetate (ANOVA) 1 1 Mai mult de 2 grupuri date

perechi

Inferenţa statistică pe date calitativ e

Tabela de contingenţă 2times2

Riscuri şi raţii

Testul χ2 (testarea asocierii icircn tabela de contingenţă)

Testul Fisher

23

Testul z pentru proporţii

Testul McNemar

Tabela de contingenţă 2times2

Scale de tip nominal (dicotomiale tabela de contingenţă de 2times2) sau ordinal (tabela de contingenţă de

rtimesc)

Frecvenţa absolută (numărul de evenimente per categorie)

Tabela de contingenţă de 2times2 4 categorii

AP = adevărat pozitiv

FP = fals pozitiv

FN = fals negativ

AN = adevărat negativ

Ulcer deschis Ulcer vindecat Total

Recurenţă + AP = 1 FP = 5 = 1+5 = 6

Recurenţă - FN = 7 AN = 16 = 7+16 = 23

Total =1+7=8 =5+16=21 29

Riscuri şi raţii Mărimi ale asocierii

Denumire Formula Definiţie

Rata falşilor pozitivi =FP(FP+AN) Probabilitatea unui test fals + (α)

Rata falşilor negativi =FN(FN+AP) Probabilitatea unui test fals ndash (β)

Sensibilitate =AP(AP+FN) Probabilitatea unui test real + (1- β)

Specificitate =AN(AN+FP) Probabilitatea unui test real ndash (1- α)

Acurateţe =(AP+AN)n Probabilitatea generală a unei decizii corecte

Valoarea predictivă pozitivă =AP(AP+FP) Probabilitatea ca un test pozitiv să fie corect

Valoarea predictivă negativă =AN(AN+FN) Probabilitatea ca un test negativ să fie corect

Riscul relativ =AP(FP+AN)FN(AP+FP)

Rata şansei =(AP∙AN)(FN∙FP)

Riscul atribuabil =AP(AP+FP)-FN(FN+AN)

24

Denumire Formula

Rata falşilor pozitivi = 5(5+1) = 08334

Rata falşilor negativi = 7(7+16) = 03043

Sensibilitate = 1(1+7) = 01250

Specificitate = 16(16+5) = 07619

Acurateţe = (1+16)29 = 05862

Valoarea predictivă pozitivă = 1(1+5) = 01667

Valoarea predictivă negativă = 16(16+7) = 06957

Riscul relativ = 1(5+16)7(1+5) = 2142 = 050

Rata şansei = (1∙16)(7∙5) = 04571

Riscul atribuabil = 1(1+5)-7(7+16) = 01667-03043=-01376

Testarea asocierii icircn tabela de contingenţă

Testul χ2

Nu trebuie utilizat pentru eşantioane de volum mic

Testul este valid doar dacă valoarea expectată (aşteptată) pentru fiecare celulă este cel puţin

egală cu 1 şi frecvenţa absolută observată este de minim 5

Dacă aceste condiţii nu sunt icircndeplinite se aplică testul exact al lui Fisher (Fisherrsquos Exact Test)

Indică dacă cele două variabile sunt sau nu independente DAR NU cuantifică puterea asocierii

dintre ele

Problema S-a investigat icircntr-un studiu asocierea dintre obezitatea (ca factor de risc) şi bolile

cardio-vasculare la persoanele icircn etate (gt 60 ani) Din totalul de 620 persoane investigate s-au

identificat 150 persoane cu obezitate şi boală cardio-vasculară 230 persoane fără obezitate şi

fără boală cardio-vasculară şi 60 persoane fără obezitate dar cu boală cardio-vasculară Există

o asociere icircntre obezitate şi boala cardio-vasculară (df=1 α=005 χ2critic = 384)

Testul χ2 exemplu

H025

Nu există asociere icircntre obezitate şi bolile cardio-vasculare

Obezitatea şi bolile cardio-vasculare sunt independente

H1

Există asociere icircntre obezitate şi bolile cardio-vasculare

Obezitatea şi bolile cardio-vasculare sunt asociate

a = 005 pragul de semnificaţie al testului

urmează o lege cu (r-1)(c-1) grade de libertate

χ2 = parametrul testului χ2

fio = frecvenţa observată

fit = frecvenţa teoretică

Regiunea critică este [χα2 yen)

Pentru α = 005 χα2 = 384

OBSERVAT BCV+ BCV- Total

Obezitate + AP = 150 FP = 180 330

Obezitate - FN = 60 AN = 230 290

Total 210 410 620

TEORETIC BCV+ BCV- Total

Obezitate + = 330times210620 = 330times410620 330

Obezitate - = 290times210620 = 290times410620 290

Total 210 410 620

TEORETIC BCV+ BCV- Total

Obezitate + = 330times210620 = 330times410620 330

26

Obezitate - = 290times210620 = 290times410620 290

Total 210 410 620

TEORETIC BCV+ BCV-

Obezitate + = 112 = 218

Obezitate - = 98 = 192

Deoarece 4177Icirc[384 yen) se respinge H0 cu un risc de eroare de 5

Există asociere icircntre obezitate şi bolile cardio-vasculare

Testul Fisher

Corecţie a testului χ2

Valoarea p asociată parametrului ne dă probabilitatea ca valoarea observată de independenţă să fie

atribuită doar şansei

O valoare p mică indică că există alte cauze decacirct şansa influenţează rezultatul şi astfel cele două

variabile investigate nu sunt independente

Testul Fisher = dispersia corectată a factorului x dispersia corectată a factorilor reziduali

Icircn acest context regula adunării dispersiilor se poate scrie unde

este variaţia lui y pe seama variaţiei variabilei x

este variaţia lui y pe seama influenţei factorilor reziduali (neicircnregistraţi)

este variaţia totală a caracteristicii y

Testul Fisher empiric se calculează după formula

27

se compară cu Ftab pentru nx şi nz grade de libertate la un anumit prag de semnificaţie stabilit

Dacă Fc gt Ftab rezultă că variaţia factorului de grupare x este semnificativă pentru variaţia caracteristicii y

Testul z pentru proporţii

1 Compararea unei frecvenţe observate cu o frecvenţă teoretică

2 Testarea egalităţii a două frecvenţe

Testul z Compararea unei frecvenţe observate cu o frecvenţă teoretică

Scop Investigarea semnificaţiei diferenţei icircntre o frecvenţă teoretică p (icircntr-o populaţie) şi o frecvenţă

observată f pe un eşantion reprezentativ (variabilă calitativă (binare))

Condiţii de aplicare Testul este corect aplicat dacă numărul n al observaţiilor eşantionului este

suficient de mare (n∙p n∙(1-p)gt10

Parametrul

n = volumul eşantionului

Suntem interesaţi de investigarea prevalenţei hepatitei B la personalul care lucrează icircn laboratoarele

clinicilor de boli infecţioase din Transilvania Se ştie din studii anterioare că prevalenţa hepatitei B icircn

populaţia generală din Transilvania este de 9 S-a luat icircn studiu un eşantion de 100 persoane şi s-a

obţinut o prevalenţă a hepatitei B de 6 Există diferenţă semnificativă icircntre frecvenţa hepatitei B la

personalul care lucrează icircn laboratoarele spitalelor de boli infecţioase din Transilvania faţă de

populaţia generală

f = 006 p = 009 n = 100

Ipoteza nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat

faţă de frecvenţa hepatitei B icircn populaţia generală

Ipoteza alternativă test bilateral Există diferenţă semnificativă icircntre frecvenţa hepatitei B la

nivelul eşantionului şi prevalenţa hepatitei B icircn populaţia generală

f = 006 p = 009 n = 100

Pragul de semnificaţie a = 005

Regiunea critică test bilateral (-yen -196 ]Egrave[196 yen)

28

Concluzia testului

Deoarece parametrul statistic calculat al testului nu aparţine regiunii critice se acceptă ipoteza

nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat faţă de

frecvenţa hepatitei B icircn populaţia generală

Testul McNemar

Evaluarea dependenţei variabilelor calitative perechi (dorim să determinăm dacă o anumită

caracteristică este sau nu asociată cu o anumită patologie)

Identificăm n pacienţi care prezintă patologia de interes (eg Cancer bronho-pulmonar) şi n

pacienţi cu aceleaşi caracteristici ca şi primul grup dar care nu o prezintă

Martor = da Martor = nu

Caz = da a b

Caz = nu c d

Testul McNemar - exemplu fumat vs cancer

Martor = da Martor = nu

Cancer = da a = 2 b = 5

Cancer = nu c = 0 d = 3

29

χ2critic(α=005) = 384

32 lt 384 rarr acceptăm ipoteza nulă

Fumatul nu este icircn relaţie cu apariţia cancerului bronho-pulmonar

Inferenţa statistică pe date cantitative

Variabile cantitative continue

Testul z şi Student (t) (o medie sau medii perechi)

Testul z şi Student (t) (testarea a două medii)

ANOVA (ge 3 medii)

Ranguri (variabile cantitative discrete sau cantitative care nu icircndeplinesc condiţia de

normalitate)

Testul sumei rangurilor Wilcoxon

Kruskal-Wallis (ge 3 eşantioane independente)

Friedman (ge 3 eşantioane dependente)

Teste de normalitate variabile cantitative continue

Shapiro-Wilk

Kolmogorov-Smirnov

Shapiro-Wilk

Chi-Square Goodness-of-Fit

Dacă datele urmează o distribuţie normală aplicăm un test parametric

Dacă datele nu urmează o distribuţie normală aplicăm un test de comparare al rangurilor

30

Testul Z de comparare a mediei unui eşantion cu media unei populaţii

Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ

extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie

s2 care se cunoaşte

Condiţii de aplicare

1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru

compararea mediei unui eşantion cu media unei populaţii)

2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal

distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă

3 Talia eşantionului este mare ( ge 30)

Ipoteze

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media

eşantionului şi media populaţiei

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

(-yen -196 ] Egrave [196 yen)

Parametrul testului

n = volumul eşantionului

= media eşantionului

s = deviaţia standard a populaţiei

Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)

Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard

cunoscută

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi

media standard

Condiţii de aplicare

Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se

realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această

condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea

31

Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai

puternic

Numărul de grade de libertate (df) df = n-1

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

Parametrul testului

n = volumul eşantionului

micro0 = media standard

= media eşantionului

s = deviaţia standard a eşantionului

Testul ANOVA compararea mediilor a mai multe eşantioane

H0 = toate mediile sunt egale

H1 = nu toate mediile sunt egale

Condiţii de aplicare

1 Datele sunt independente unele faţă de celelalte

2 Datele fiecărui grup sunt normal distribuite

3 Deviaţia standard este aceeaşi pentru toate grupurile

Id Medicament

A B C D E F

1 5 6 7 10 5 9

2 6 8 8 11 8 8

3 7 7 9 13 6 7

4 8 9 11 12 4 5

32

5 9 10 10 9 7 6

Suma 35 40 45 55 30 35

Media 7 8 9 11 6 7

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =

= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)

Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2

F = (suma pătratelor(icircntre))(suma pătratelor(icircn))

Suma pătratelor (icircntre) = 16times5 = 80

Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60

Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn

interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare

SP df Media pătratelor F = MPicircntreMPicircn

Icircntre 80 5 = 805 = 16 = 1625 = 64

Icircn 60 24 = 6024 = 25

Total 140 29 -

Testul sumei rangurilor Wilcoxon

Aplicat pentru

Un set de observaţii provenite dintr-o valoare ipotetică comună

Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)

Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero

Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace

Suma rangurilor pentru diferenţele negative = 2+3+1 = 6

Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30

33

Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului

egal cu 8 = 0109

Icircnainte După Diferenţa Rang

64 66 -2 2

66 58 8 5

67 68 -1 3

71 65 6 4

72 75 -3 1

76 67 9 6

78 59 19 8

89 74 15 7

Testul Kruskal-Wallis (ge 3 eşantioane independente)

Test de ranguri aplicate pe mai mult de 3 eşantioane

H = parametrul testului

n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)

Tk = suma rangurilor

Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie

pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni

34

df = k-1 (k = numărul de eşantioane)

df = 3-1 = 2

Hcritic(α=005) = 599

H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie

pozitivă şi respectiv biopsie negativă

Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie

a tipului de studiu pe eşantioane perechi)

1 Definirea numărului de tratamente k

2 Obţinerea rangurilor pentru fiecare tratament

3 Sumarea rangurilor fiecărui tratament

4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)

5 Dacă Fr gt Frcritic rarr respingem H0

Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost

măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi

n = 9 k = 3 T12 = 225 T2

2 = 38025 T32 = 38025

Frcritic = 599

Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de

prostată

35

De reţinut

Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei

Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-

of-Fit

Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z

Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t

Compararea mediilor a 3 sau mai multe eşantioane ANOVA

Compararea mediilor a două populaţii (σ) testul Z

Compararea mediilor a două eşantioane (s) testul t

Compararea mediilor a două eşantioane perechi (s) testul t

ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi

cu cel pentru compararea a două eşantioane perechi

Ranguri

Distribuţia datelor nu are importanţă

Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)

Trei sau mai multe eşantioane Kruskal-Wallis

Trei sau mai multe eşantioane perechi Friedman

Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia

Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a

datelor)

Variabile nominale

Un singur eşantion sau eşantioane perechi

Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte

Eşantioane perechi testul Mc Nemar

Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2

Icircn analiza proporţiilor există teste diferite pentru

Compararea unei frecvenţe cu o frecvenţă cunoscută

Compararea a două frecvenţe

Semnificaţia statistică

Valoarea p (p value)

Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor

două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E

posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării

aleatorii

36

Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală

urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii

Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este

probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un

experiment de dimensiunea acestuia

Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că

diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii

diferite

Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca

fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă

ar fi fost adevărată

Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă

1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe

baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De

fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001

2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie

3 Se aplică testul statistic aferent pentru a calcula valoarea p

4 Se compară valoarea p cu valoarea ndash prag

5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe

semnificativă dpdv statisticrdquo

6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e

semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să

conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă

Teste de semnificaţie

Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului

populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)

Testarea ipotezelor implică posibile erori

Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile

sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui

grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul

icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005

ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există

37

nici o diferenţă

Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ

statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de

ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost

ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau

dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă

cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă

semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe

ipotetice variate icircn cazul icircn care ele există

Măsuri ale frecvenţei

Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)

Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate

Generic formula pe care se bazează toate cele trei este

unde x şi y sunt cantităţile de comparat

Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea

unei frecvenţe pe grupe de sex vacircrstă etc

Proporţia implică icircn mod necesar ca x să fie inclus icircn y

Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară

frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp

Pentru calcularea unei rate trebuie ţinut cont de trei aspecte

bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin

bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp

bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo

Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un

tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei

populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei

aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)

38

Indicatori

Rata de incidenţă

Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă

icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii

Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o

perioadă de timp

Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de

timp x

Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei

susceptibili de a dezvolta icircmbolnăvirea studiată

Numitorul poate fi

bull Numărul mediu al populaţiei icircn perioada de timp studiată

bull Mărimea populaţiei icircn mijlocul perioadei de studiu

bull Mărimea populaţiei la icircnceputul studiului

Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă

Este obligatorie menţionarea perioadei de timp

Prevalenţa

Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la

un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă

schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa

momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)

39

Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include

numai cazuri noi respectiv include cazuri noi şi vechi

Rata de atac

Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este

folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp

raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori

Rata persoană-timp

Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din

momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte

migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost

observate

Riscul relativ (RR)

Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment

legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele

prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două

grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la

bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la

bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai

mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo

Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2

Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn

cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă

(Tabelul 1)

Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR

Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la

neexpuşi

40

Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de

culegere a datelor

Odds ratio (OR)

Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin

raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general

studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)

Tabelul 2 Tabelul 2 x 2 pentru calcularea OR

Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală

Rate de mortalitate

Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp

specificată Există mai multe tipuri de rate de mortalitate

o Mortalitate specifică pe sex

o Mortalitate specifică pe rasă

o Mortalitate specifică pe boală

o Mortalitate neonatală

o Mortalitate postneonatală

o Mortalitate infantilă

o Mortalitate maternă

Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP

41

Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de

viaţă şi vacircrsta la care survine decesul dacă este prematur

Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu

Ani de viaţă pierduţi datorat dizabilităţii

Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt

utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru

cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite

grupuri

Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de

risc şi o boală se folosesc riscul relativ şi odds ratio

35 Analiza şi interpretarea datelor

După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date

trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul

Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor

colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului

studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu

plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde

prezenţa biostatisticianului este necesară

Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu

elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat

iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului

iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate

depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori

testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere

clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza

Interpretarea rezultatelor statistice

Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne

motive (număr mic de date) acceptarea ei să fie falsă

Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine

gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia

ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument

de decizie Intervalul de confidenţă

42

Interpretarea statistica ne interpretarea clinică

Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă

Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice

obţinute pe eşantionul studiat

Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare

Ce interpretăm Rezultatele

personale obţinute icircn urma studiului

care au fost prezentate icircn secţiunea bdquoRezultaterdquo

Explicăm rezultatele obţinute

Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale

Interpretarea trebuie să se realizeze icircn

lumina limitelor studiului

contextul cultural social şi educaţional al locului unde s-a realizat cercetarea

contextul a ceea ce se cunoaşte din literatura de specialitate

Interpretăm doar rezultatele personale obţinute icircn urma studiului

Interpretarea statistică nu este tot una cu interpretarea clinică

Interpretarea statistică este importantă

Interpretarea clinică este foarte importantă

Intervalul de confidenţă

Media calculată pe baza unui eşantion nu va echivala media populaţiei

Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului

Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a

populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a

populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)

pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru

orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare

dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de

confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de

date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de

5

Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel

Dacă valoarea p este mică

Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare

aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o

medie diferită Diferenţa este semnificativă dpdv statistic

43

Icircn continuare

Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa

reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică

pentru a fi interesante din punct de vedere ştiinţific

Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC

oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care

este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a

obţine o concluzie clară

Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o

diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că

datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din

punct de vedere ştiinţific

Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul

detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat

Erorile studiilor medicale

Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura

anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară

caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea

asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri

legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias

Erorile potenţiale icircn studiile epidemiologice

1 Erori icircntacircmplătoare

2 Erori sistematice

3 Confuzia

4 Validitatea

1 Erori icircntacircmplătoare

Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a

parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel

de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot

fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii

(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor

de măsură (eroarea de măsurare)

44

2 Erori sistematice

Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate

care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu

acurateţe mare Acurateţea nu este afectată de mărimea eşantionului

Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de

experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea

dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus

şi greu de cuantificat (consum de alcool personalitate etc)

Principalele tipuri de erori din această categorie sunt

bull Biasul de selecţie

bull Biasul de informaţie

Biasul de selecţie

Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul

trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion

inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale

persoanelor incluse

Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se

ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia

Biasul de informaţie

Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de

instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze

expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere

nesemnificativă sau chiar să nu şi-o amintească de loc

3 Confuzia

Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune

prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este

cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă

de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte

important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor

protector

4 Validitatea

Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă

Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte

estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional

Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă

45

conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se

demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)

Validitatea externă se poate realiza numai dacă studiul este valid intern

Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii

studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de

studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt

laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi

validă din punct de vedere intern)

3 6 Prezentarea rezultatelor

După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite

Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor

icircntr-o formă bdquodigerabilărdquo este necesară

Scopul prezentării datelor

1 Transmiterea concluziilor studiului

a Datele corecte şi importante merită comunicate

b Datele trebuie să confirme sau să infirme ipoteza studiului

c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală

2 Acordarea posibilităţii altor cercetători să aprecieze studiul

a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti

b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor

prezentate

Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru

fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie

statistică

Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de

valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras

(Tabel 3)

Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)

46

Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct

numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor

precum şi prezentarea acestora sub formă inteligibilă

Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care

convin cercetătorului

Prezentarea datelor se poate face

1 Figuri şi tabele icircn articole scrise

2 Figuri şi tabele icircn prezentări orale

3 Figuri şi tabele icircn postere

4 Text scris sau incluse icircn text

5 Site-uri de WEB

Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor

Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie

Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele

exprimacircnd exact ceea ce acestea exprimă

Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate

anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel

să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se

acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca

mai sus sugestive sunt formatele simple şi puţin icircncărcate

Dacă nu există reguli impuse se respectă

1 Mesaj simplu fără falsificarea datelor

2 De obicei este necesar atacirct tabelul cacirct şi graficul

3 Să fie simplu şi clar

Tabele

Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile

coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică

elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de

1 Se folosesc doar linii orizontale

2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn

evidenţi prin linie de separare (Tabelul 4)

Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland

Noua Zeelandă)

(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)

47

3 Numerele sunt aliniate icircn funcţie de virgulă

4 Indicii statistici sunt explicaţi sub tabel

5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană

6 Abrevierile pot fi folosite

7 Numărul de zecimale trebuie limitat la maxim două

8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel

9 Plasarea legendei este obligatorie sub tabel

10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)

Icircn cazul prezentărilor orale sau a posterelor este indicat ca

1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării

2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte

3 Folosirea de simboluri este permisă

Clasificarea tabelelor

Tabelele se clasifică după

i) conţinut

bull cu distribuţii de frecvenţe

bull de clase de frecvenţe

bull de contingenţă

ii) structura

bull cu doua coloane

bull cu subclasificări

bull ldquomasterrdquo

Tabele ce conţin distribuţii de frecvenţe

O modalitate comodă de a prezenta o mulţime de date brute este

1 Se ordonează datele in ordine crescătoare

2 Se determine frecvenţa fiecărei valori

3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane

(Tabelul 5)

Tabelul 5 Distribuţii de frecvenţă absolută

48

Tabelul claselor de frecvenţe

1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă

2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)

Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)

Tabele de contingenţă

1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a

tabelelor de contingenţă

2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a

combinaţiilor de perechi ordonate de valori

3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre

a factor de risc si

b starea sănătăţii

4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)

5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)

Tabelul 7 Tabel de contingenţă 2 x 2

49

Grafice

Există două categorii de moduri grafice sub care se pot prezenta datele

1 Ilustraţii şi fotografii

2 Grafice

1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă

pentru lucrare

2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit

Putem vorbi despre mai multe tipuri de grafice

bull Grafice pentru reprezentarea datelor cantitative

1048707 Grafic cartezian (X Y)

1048707 Histograma

1048707 Poligonul de frecvenţe

1048707 Diagrama bdquoscatterrdquo

bull Grafice pentru reprezentarea datelor calitative

1048707 Grafic cu bare

1048707 Diagrama tip bdquoboxplotrdquo

1048707 Diagrama bdquopierdquo

1048707 Cartograma

Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi

dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)

Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)

Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie

Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)

Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)

50

Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir

de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele

două variabile studiate (Figura 6)

Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2

(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2

rămacircne aproximativ constantă)

Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea

comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea

comparativă a mai multor variabile

Figura 7 Grafic calitativ cu bare

51

Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo

Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două

posibilităţi reprezentate grafic este mai frecventă (Figura 8)

Figura 8 Reprezentare tip bdquopierdquo

Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli

sau a oricărui element comparativ Se foloseşte de epidemiologi

Rezultate

Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare

Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o

manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu

explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția

bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la

ilustraţii tabele grafice

Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi

nici rezultatele care invalidează eventual ipoteza

Discuţii

Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd

cultura ştiinţifică şi inteligenţa autorilor

Acest capitol răspunde la trei obiective

Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia

calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de

selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează

rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv

52

este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn

care a fost abordată problema fără a face o revistă a literaturii

Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea

rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul

Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor

afirmaţii nesusţinute de conţinutul lucrării

Concluzii

Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate

să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie

Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de

concluzii va scădea valoarea lucrării

Bibliografia (lista referinţelor citarea icircn text)

Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn

lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente

Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli

- să conţină cele mai importante şi recente lucrări

- să includă numai lucrări publicate

- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate

Bibliografie

Elisabeta Jaba ndash Statistică Ed Economică 1998

Mihai Ţarcă ndash Statistică volI Ed UAIC 1979

Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale

Ed University Press 2009

Sorana Daniela Bolboacă ndash Metodologia cercetării curs

53

Page 5: cercetarea medicala - metodologie

Teze de doctorat licenţă Se pot găsi icircn bibliotecile instituţiilor de icircnvăţămacircnt superior Sunt utile pentru că

icircn general tratează pe larg o anumită problemă care poate fi de interes avacircnd şi o bibliografie recentă

Brevete şi mărci Sunt acele sisteme de protecţie a produselor şi tehnologiilor Sunt utile icircn general icircn

cercetarea experimentală

Literatura secundară de specialitate

Tratate de specialitate Sunt foarte importante icircn faza incipieintă a unui studiu pentru aprofundarea problemei

de cercetat Informaţiile prezente icircn astfel de publicaţii sunt ordonate cu noţiuni de bază definiţii teorii

posibile etc

Cărţi de referinţă Sunt monografii care studiază pe larg un fenomen putacircnd fi foarte utile atacirct cercetătorilor

debutanţi cacirct şi celor iniţiaţi

Literatura terţiară de specialitate este reprezentată de indexuri reviste cu extrase de articole şi rezumate

Cercetarea bibliografică bdquoon-linerdquo permite accesul la nenumărate surse de informare utilizacircnd icircn acest scop

motoare de căutare

b) A doua etapă este lectura critică activă a publicaţiilor selectate pentru a judeca valoarea publicaţiilor

indiferent dacă este vorba de calitatea cercetării sau de pertinenţa rezultatelor publicate

Evaluarea corectă critică a unui articol va permite cititorului să aprecieze dacă publicaţia este credibilă

rezultatele corespund realităţii (validitatea internă) respectiv dacă informaţiile conţinute icircn publicaţie sunt

aplicabile icircn practica medicală dacă se pot generaliza dacă sunt aplicabile icircn proiectul de cercetare al

viitorului investigator (validitatea externă)

Lectura critică a literaturii medicale se bazează pe folosirea unei grile de lectură care are meritul de a putea fi

aplicată tuturor tipurilor de publicaţii Această grilă are 8 criterii de evaluare pentru fiecare criteriu trebuie să

se răspundă la următoarele icircntrebări

bull este posibil să se găsească icircn articol informaţia pentru criteriul icircn cauză

bull dacă criteriul abordat este corect

bull dacă criteriul este incorect icircn ce măsură ameninţă validitatea studiului

Cele 8 criterii de evaluare sunt

1 Obiectivul vizează următoarele preocupări medicale

bull istoria naturală a unei boli evoluţia şi prognosticul ei

bull performanţa unui test diagnostic

bull impactul unei intervenţii (terapeutice de depistare de prevenţie sau de educaţie)

Lectura critică va aşeza articolul icircn una din aceste situaţii apoi icircn raport cu obiectivul va stabili dacă are

ipoteze de verificat

5

2 Tipul de studiu Cititorul trebuie să recunoască planul de studiul pentru a verifica dacă tipul de studiu este

adaptat icircntrebării puse Va merge progresiv cu urmărirea de la raportul de caz-seria de cazuri la studiul

transversal studiul caz-control studiul de cohortă şi trialul controlat

3 Factorii studiaţi (variabila independentă) pot fi factori de expunere sau de intervenţie Cititorul trebuie să

poată recunoaşte factorul să aprecieze cum a fost măsurat dacă s-a folosit aceeaşi metodă de măsurare pentru

loturile icircn studiu ce metodă de comparaţie s-a folosit dacă sunt erori (factor de confuzie)

4 Criteriul de raţionament este evenimentul sau situaţia presupusă a fi rezultatul factorului studiat boala

decesul supravieţuirea complicaţiile etc Definirea precisă şi metoda de măsurare a rezultatului expunerii va

permite cititorului să aprecieze validitatea informaţiilor

5 Populaţia studiată (eşantionul) Se va urmări dacă este definită populaţia de referinţă şi populaţia de

studiat analizacircndu-se corectitudinea selecţiei randomizarea proporţia de subiecţi la sfacircrşitul studiului

validitatea externă a rezultatelor

6 Analiza datelor Cititorul trebuie să aprecieze dacă s-au examinat toate erorile inclusiv factorul de confuzie

dacă nu validitatea studiului ar putea fi compromisă

7 Rezultatele Principalele aspecte pe care cititorul le va urmări la acest capitol sunt dacă ele se datoresc

numai şansei dacă s-a făcut calculul statistic dacă s-a apreciat relaţia expunere-efect (RR OR RA) dacă a

fost apreciată semnificaţia clinică sau biologică care nu este identică cu semnificaţia statistică

8 Sinteza lecturii critice analizează concluziile autorilor dacă ele răspund icircntrebărilor formulate la icircnceputul

studiului dacă rezultatele sunt aplicabile la populaţia studiată dacă rezultatele sunt acceptabile pentru practica

proprie a cititorului dacă rezultatele justifică vreo schimbare icircn practica clinică respectiv vor ameliora starea

pacienţilor Această abordare cere cititorului cunoaşterea noţiunilor de bază icircn metodologia cercetării

ştiinţifice fiind vorba icircn acelaşi timp şi de un demers clinic

c) A treia etapă icircn cercetarea bibliografică constă icircn combinarea datelor din mai multe studii referitoare la

acelaşi subiect şi care se realizează prin meta-analiză Tehnica meta-analizei permite să se sporească

eficacitatea testării ipotezelor să crească forţa statistică a rezultatelor şi să se obţină informaţii care nu pot fi

convenabil extrase din fiecare cercetare

Definirea fenomenului

Definirea fenomenului se bazează pe

bull Cunoaşterea prealabilă a problemei prin documentare riguroasă documentare care poate justifica pertinenţa

temei propuse (revista literaturii de specialitate)

Icircn prima etapă se cercetează bibliografia propriu-zisă adică se identifică publicaţiile care se referă la subiectul

icircn discuţie apoi se vor selecta publicaţiile necesare studiului apreciind validitatea lor (problemele de

documentare bibliografică vor constitui un capitol separat)

bull Formularea unei ipoteze ştiinţifice sub-etapă care reprezintă fondul problemei

6

Ipoteza este o afirmaţie (nu o icircntrebare) despre o posibilă relaţie icircntre factorii studiaţi şi criteriile de

raţionament Ipoteza poate fi ipoteză ldquonulărdquo - nu există această relaţie şi ldquoalternativărdquo - există relaţia Ipoteza

va trebui apoi dovedită sau respinsă testul statistic calculează probabilitatea conform căreia asociaţia observată

este reală sau ea survine din icircntacircmplare

bull Motivarea organizării studiului Trebuie făcută o motivare corectă legată de inexistenţa unor studii

referitoare la problema pe care o va dezbate studiul

Formularea temei de studiu

Pentru formularea temei de studiu trebuiesc menţionate obiectivul sau obiectivele şi tipul de studiu ales pentru

cercetarea respectivă Există icircn general patru tipuri de obiective

bull obiective care se referă la evoluţia şi prognosticul unei icircmbolnăviri obiective prin care se icircncearcă

icircnţelegerea şi cunoaşterea unor evenimente ce pot să apară la un pacient pe parcursul bolii

bull obiective care se referă la etiologia bolii (cauze de natură bacteriană virală parazitară) sau la cauzalitate

(relaţia factor de risc-boală)

bull obiective legate de performanţa unor teste de diagnostic sau de screening de evaluare a strategiei de

diagnostic sau de interpretare a unui test

bull obiective care se referă la impactul unei intervenţii evaluarea unei intervenţii terapeutice de depistare a unor

boli de prevenţie de educare pentru sănătate

Obiectivele unui studiu se icircmpart icircn obiectivul major unul din cele patru enumerate şi obiective

secundare care pot aborda şi alte fenomene biologice decacirct cel major cu condiţia să nu altereze realizarea

acestuia Alegerea tipului de studiu este stracircns legată de obiectivul ales Dacă obiectivul este descrierea

distribuţiei caracteristicilor unei populaţii aprecierea frecvenţei unui fenomen de sănătate analiza acelui

fenomen icircn funcţie de timp loc persoană se va alege un studiu epidemiologic descriptiv studiu care nu are o

ipoteză fixată anterior O ipoteză se poate formula ca rezultat al studiului descriptiv dar nu se va face

verificarea ei icircn cadrul studiului Dacă intenţia studiului este de a emite o judecată asupra unei posibile relaţii

icircntre factorii studiaţi atunci problema de cercetat este fundamentată de o ipoteză care trebuie verificată

dovedită iar studiul care realizează acest lucru respectiv limitele studiilor utilizate

Aspectele manageriale

Aspectele manageriale includ

bull justificarea bugetului estimarea sumei necesară realizării studiului și apreciarea durate studiului

bull defalcarea bugetului pe necesități legate de achziționare de aparatură reactanți truse etc pentru personal

(munca depusă pregătire deplasări icircn teren participări la congrese sau conferințe documentare) materiale

consumabile etc

7

32 Elaborarea proiectului

Protocolul de cercetare este un document care emite obiectivul și ipoteza studiului definește condițiile de

desfășurare și realizare a viitorului studiu clinic Elaborarea protocolului este importantă pentru cercetătorii

participanţi la studiu comisiile de etică şi finanţatori

Protocolul include mai multe formulare care trebuie să cuprindă

a) Titlul proiectului

b) Sumarul proiectului

c) Descrierea proiectului

d) Normele deontologice de cercetare

e) Modalitățile de diseminarea și valorificarea rezultatelor

f) Perspective de continuare a cercetării

g) Anexe

Prezentarea proiectului va include următoarele fișiere

bull resursele umane (membrii echipei afilierea acestora)

bull relevanța temei pentru dezvoltarea cunoașterii icircn domeniu

bull stadiul actual al cunoașterii și bibliografia aferentă

bull justificarea studiului

bull enunțarea obiectivelor și ipoteza de lucru

bull metodologia propriu-zisă

Referitor la metodologia utilizată vor trebui menționate

bull factorulfactorii studiați care reprezintă variabila independentă respectiv dacă este cazul modalitățile de

măsurare

bull criteriile de raționament- variabila dependentă (situația sau evenimentul ce se presupune a fi rezultatul

factorului studiat cum ar fi boala handicapul complicații decesul)

bull tipul de studiu care se va aplica icircmpreună cu design-ul acestuia

bull eșantioanele de lucru și modalitățile de eșantionaj

bull metodele de culegere și de prelucrare a datelor

bull planificarea activităților

bull structura bugetului fiind eligibile următoarele categorii de cheltuieli de capital (echipamente software

upgrading) pentru personal (full sau part-time instruire asigurări de sănătate) de informare (documentare

abonamente) mobilități (vizite la alte unități de cercetare participări la

congrese) materiale consumabile (truse reactanți papetărie) valorificare a rezultatelor (lucrări științifice de

etapă sau lucrarea finală) cheltuieli indirecte (de regie)

bull modalităţile de valorificare a rezultatelor

bull legături de alte proiecte

8

Protocolul mai conține anexe curriculum vitae al investigatorului principal și al coinvestigatorilor

calendarul activităților avizul Comisiei de etică documente speciale și

consimțămacircntul informat icircn cazul studiilor pe subiecți umani

Icircnainte de implementare protocolul va fi verificat de experți pentru eligibilitate (dacă sunt icircndeplinite

condițiile de acceptare finanțare) calitate și pertinență icircn sensul că protocolul trebuie să fie clar exprimat

corect icircntocmit bine așezat și cu repercursiuni favorabile pentru viitor

33 Culegerea informaţiei

Pentru a realiza o cercetare medicală culegerea datelor este prima etapă şi realizează icircn funcţie de

obiectivele propuse tipul studiului timpul disponibil şi resurse umane şi financiare

Există două mari posibilităţi de culegere

bull Icircn funcţie de elementele studiate

o Culegerea exaustivă Toţi subiecţii populaţiei pe care dorim să o studiem Greu de realizat din cauza

costurilor foarte mari sau a alterării populaţiei de studiu

o Prin eşantionare Este metoda folosită icircn studii medicale

bull Icircn funcţie de durata culegerii

o Transversală Se studiază un grup la un moment dat

o Longitudinală Extinsă in timp

- Retrospectivă ndash icircnregistrări medicale

- Prospectivă ndash date culese la intervale prestabilite de timp

Populaţia ţintă

Este orice colectivitate icircntreagă de oameni animale plante sau obiecte de la care putem colecta date Populaţia

ţintă este icircntregul grup care ne interesează pe care dorim să-l descriem sau să tragem concluzii despre el

Pentru a putea realiza generalizări spre populaţia ţintă deseori suntem obligaţi să folosim un eşantion (selecţie)

care icircnsă trebuie să fie reprezentativ pentru populaţia pe care vrem să o studiem Pentru fiecare populaţie de

studiu sunt posibile mai multe eşantioane Pe baza acestor eşantioane se calculează un estimator Pe baza

acestui estimator calculat care poate fi medie aritmetică procent etc se pot trage concluzii despre icircntreaga

populaţie Este foarte important ca investigatorul să definească foarte atent şi complet populaţia icircnainte de a

realiza eşantionul inclusiv descrierea criteriilor de includere şi excludere icircn populaţia de studiu

Eşantionul

Un eşantion este practic un grup de elemente selectate dintr-un grup mai extins (populaţia ţintă) Studiind

eşantionul selectat se pot trage concluzii despre grupul de unde a fost ales (populaţia ţintă)

Este icircn general ales pentru studiu pentru că

bull Populaţia ţintă este prea mare şi nu poate fi studiată ca icircntreg

bull Nu avem acces din diverse motive decacirct la parte din populaţia de studiu

9

bull Un studiu pe icircntreaga populaţie poate distruge populaţia

bull Eşantioanele pot fi studiate mai rapid

bull Costul şi resursele necesare studiului sunt mai reduse

Numărul elementelor dintr-un eşantion se numeşte talia sau volumul selecţiei

Acesta fiind icircn general mai mic decacirct icircntreaga populaţie poate fi observat icircn detaliu iar dacă este reprezentativ

se pot afla prin intermediul său proprietăţile populaţiei ţintă

Eşantionul trebuie să fie reprezentativ pentru populaţia generală De aceea dintre metodele de eşantionare se

folosesc tehnicile de randomizare Trebuie să satisfacă două condiţii principale

bull condiţie de ordin cantitativ talia să fie suficient de mare

bull condiţie de ordin calitativ trebuie extras aleator din populaţia ţintă

Metode de eşantionare

Putem vorbi icircn linii mari de două posibilităţi de eşantionare prin metode probabilistice şi prin metode

nonprobabilistice

Eşantionarea probabilistică este metoda cea mai folosită icircn studiile medicale fiind şi cea indicată pentru a

realiza reprezentativitatea calitativă

Icircn medicină se folosesc patru tipuri de eşantionări

1 Simplu randomizat

2 Sistematic

3 Stratificat

4 Cluster (icircn cuiburi)

1 Eşantionul simplu randomizat Fiecare element din populaţia ţintă are o şansă egală non zero de a fi

inclus icircn eşantion Se ia la icircntacircmplare un număr de elemente egal cu talia eşantionului Dezavantajul acestui tip

de eşantionare este că presupune cunoaşterea icircntregii populaţii ţintă

2 Eşantionul sistematic După aflarea taliei eşantionului şi a populaţiei ţintă se calculează factorul de

eşantionare k icircmpărţind talia populaţiei ţintă la volumul eşantionului Apoi fiecare al k-lea element este

selectat spre includere

Acelaşi mare dezavantaj apare şi icircn acest caz fiind obligatorie cunoaşterea icircntregii populaţii de studiu

3 Eşantionul stratificat Există icircn cele mai multe cazuri probleme medicale care studiindu-se pe eşantion

prezintă variabilităţi icircn funcţie de caracteristicile populaţiei (sex vacircrstă nivel de pregătire etc) Icircn acest caz

este obligatorie realizarea similitudinii demografice a eşantionului cu populaţia de studiu Din date provenite

de la Centrul de Statistică putem dezvolta ca procente o structură a populaţiei Această structură trebuie să se

regăsească (procentual) şi icircntre membrii eşantionului O importantă şansă ca reprezentativitatea calitativă să fie

corectă este conferită de respectarea

acestei similitudini demografice

10

4 Eşantionul bdquoclusterrdquo sau icircn cuiburi Icircn cazul unui studiu amplu cu scop de a investiga populaţia unei

icircntregi ţări sau regiuni putem ajunge icircn imposibilitatea de a alege şi mai ales investiga indivizi răspacircndiţi prin

icircntreaga zonă Din acest motiv se desemnează la icircntacircmplare un număr calculabil de

grupuri populaţionale extinse icircn toată zona de studiu Aceste grupuri poartă numele de bdquocuiburirdquo La nivelul

fiecărui bdquocuibrdquo se aplică o tehnică precedentă de selecţie a cazurilor Se poate sau de cele mai multe ori se face

la nivel de bdquocuibrdquo stratificarea iar apoi selecţia propriu-zisă se realizează sistematic sau simplu randomizat

Este metoda de eşantionare cel mai frecvent utilizată icircn cercetarea medicală de amploare Pentru ca eventualele

erori să nu se poată strecura s-a definit şi un indice DEF (design effect) cu care trebuie multiplicată talia

selecţiei care pentru eşantionarea icircn bdquocuiburirdquo este egal cu 2 astfel putem obţine şi o reprezentativitate

calitativă dar şi una cantitativă

Eşantionarea nonprobabilistică este o metodă neindicată icircn studiile medicale datorită lipsei de forţă icircn ceea ce

priveşte posibilitatea de aplicare a concluziilor asupra populaţiei de studiu

Se definesc şi icircn acest caz patru metode

1 Eşantion de convenienţă Membrii unui astfel de eşantion sunt aleşi numai pentru că sunt la icircndemacircnă

disponibili de a răspunde le un eventual chestionar

2 Eşantion pe cote Similar cu tipul de eşantion stratificat se referă la faptul că selecţia se face formacircnd

eşantionul din primele 30 de persoane care respectă un criteriu impus

3 Eşantion cu un scop Elementele incluse icircn eşantion sunt alese după un criteriu care exclude din start marea

majoritate a populaţiei

4 Eşantion raţional Selecţia se face prin prisma unui raţionament al celui care conduce studiul

Parametru şi estimator

Parametrul este o valoare de obicei necunoscută (şi care trebuie să fie estimată prin studiu) folosită pentru a

reprezenta o anumită caracteristică a populaţiei de studiu De exemplu media populaţiei (icircnălţime) este un

parametru populaţional Raportat la o populaţie parametrul este o valoare fixă şi exactă care nu variază

Fiecare eşantion extras din populaţie va indica o valoare a mediei care nu poate decacirct să estimeze parametrul

Icircn general parametrii sunt notaţi cu litere greceşti (ex Media = μ)

Estimatorul este o valoare calculată dintr-un eşantion studiat Este folosit pentru a putea aprecia parametrul

populaţional pe care icircn căutăm Este de asemenea posibil ca dintr-o populaţie să formăm mai multe eşantioane

mediile lor de cele mai multe ori nefiind identice icircntre ele şi nici identice cu media populaţiei Estimatorii

sunt notaţi cu litere latine (ex Media = μ)

Dacă valoarea mediei calculată pe eşantion este de exemplu 168 cm atunci putem estima ca valoarea mediei

icircn populaţie este 168 cm

11

Tipuri de culegere a datelor

1 Culegere de tip eşantion reprezentativ Grupul de indivizi incluşi icircn studiu sunt reprezentativi (calitativ şi

cantitativ) pentru populaţia generală Poate fi utilizat pentru studii descriptive (cel mai frecvent) dar uneori şi

pentru studii analitice

Este necesar pentru acest tip de culegere a datelor ca iniţial să fie cunoscută talia eşantionului (calculabilă icircn

funcţie de prevalenţă şi precizie) Pentru evaluarea datelor culese se utilizează tabelul de contingenţă 2 x 2

astfel (Figura 1)

Figura 1 - Tabelul de contingenţă 2 x 2

Unde

a ndash persoane expuse unui factor de risc care au boala studiată

b ndash persoane expuse unui factor de risc care nu au boala studiată

c - persoane neexpuse unui factor de risc care au boala studiată

d - persoane neexpuse unui factor de risc care nu au boala studiată

După aranjarea datelor icircn tabelul de contingenţă (2 x 2) se poate icircncepe analiza statistică a datelor atacirct ca

procente calculabile cacirct şi din punct de vedere a aplicării de teste statistice pentru elucidarea semnificaţiei

statistice

Este posibilă din acest tip de culegere de date calcularea

1 Prevalenţei unei boli

2 Frecvenţei expunerii

3 Gradul de asociere icircntre factorul eventual de risc şi boala

2 Culegerea de tip expus ndash neexpus Icircmparte subiecţii icircn două categorii expuşi sau neexpuşi factorului de risc

studiat Ca evoluţie următoare a studiului după o astfel de culegere a datelor se poate evalua icircn timp apariţia

icircmbolnăvirii despre care se efectuează studiul Icircn timp longitudinal prospectiv se poate calcula dacă factorul

studiat reprezintă un risc de icircmbolnăvire este indiferent sau chiar este cu efect protectiv Numărul subiecţilor

din cele două grupuri poate fi egal sau poate fi diferit Numărul acestora poate fi calculat icircn vederea obţinerii

unei bune reprezentativităţi cu ajutorul formulelor de selecţie Avacircnd icircn vedere calitatea longitudinală a

12

studiului este important ca numărul ales să fie mai mare pentru a putea suplinii eventualele pierderi din

urmărire Practic rezultatele sunt introduse icircn tabelul 2 x 2 de unde se pot calcula indicatorii doriţi (Figura 2)

Avacircnd icircn vedere modul de culegere a datelor este permisă calcularea de indicatori numai pe orizontală

orice comparare icircntre coloana dreaptă şi stacircngă fiind incorectă Avantajul acestui tip de culegere a datelor ar fi

eventualul număr mai redus de subiecţi dar dezavantajul major este cel al costurilor de urmărire icircn timp dar

trebuie luată icircn calcul şi pierderea de subiecţi din evidenţe Factorul controlat este deci prezenţa expunerii iar

factorul aleator este prezenţa bolii

Figura 2 Tabelul de contingenţă pentru tipul de culegere expus ndash neexpus

4 Culegerea de tip caz ndash martor Icircn acest caz ceea ce ghidează colectarea datelor este prezenţa sau absenţa

bolii icircn momentul prezent Se vor culege date de la două loturi constituite după criteriul de bolnav B+ şi de fără

boală B+ Datele culese sunt icircn trecut deci caracterul datelor va fi retrospectiv Icircn acest caz factorul controlat

este boala factorul aleator fiind expunerea (Figura 3)

Calculul de indicatori icircn acest caz se va putea efectua numai icircntre coloane orice calcul icircntre valorile de pe linii

fiind greşit Rezultate semnificative se pot obţine icircn acest caz utilizacircnd loturi mai mici de studiu prin

comparaţie cu tipul eşantion reprezentativ permiţacircnd icircn acelaşi timp studiul bolilor rare (cu prevalenţă mică)

Figura 3 Tabelul de contingenţă pentru tipul de culegere caz ndash martor

Metode de culegere a datelor

Metoda aleasă pentru culegerea datelor trebuie să fie aleasă după un atent studiu bibliografic icircn vederea

stabilirii celui mai eficient mod de a răspunde temei de studiu

Metodele de culegere trebuie să fie bine aplicabile şi consistente ca aport informaţional necesar

13

1 Fiziologice Sunt colectate date despre anumite caracteristici fiziologice ale pacienţilor (TA glicemie

colesterol etc) Această metodă aduce rezultate obiective cacirct timp instrumentul de evaluare este bine calibrat

şi prezintă variaţii mici

2 Metode observaţionale Instrumentul de culegere a datelor trebuie să fie sincronizat cu protocolul conceput

de cercetător Datele culese trebuie să fie de asemenea consistente adică să fie colectate de aceeaşi manieră

conducătorul studiului trebuind să instruiască investigatorii (colectorii de date) Icircnregistrarea datelor trebuie să

fie de asemenea sistematică şi bine standardizată Observaţii de control trebuie icircn mod obligatoriu făcute

pentru a putea aprecia icircn mod corect orice deviere datorată unor factorii externi Este obligatorie luarea icircn

consideraţie a aspectelor etice

3 Interviul Poate fi structurat cu un set specific de icircntrebări sau nestructurat cu o temă generală cu care se

icircncepe interviul Interviurile pot fi icircnregistrate sau intervievatorul poate nota pur şi simplu răspunsurile Există

două tipuri generice de interviu interviul de profunzime care se referă la o discuţie icircn general structurată cu

un număr de icircntrebări prestabilite icircn icircncăperea de studiu fiind doară intervievatorul şi persoana chestionată şi

interviul de grup unde prin conversaţii pornind de la temă generală expusă şi condusă de intervievator se

obţin date despre subiecţii participanţi la studiu Ambele metode de interviu au indicaţiile lor precise Un

interviu pe teme intime nu va putea fi corect icircn ceea ce priveşte datele colectate dacă se aplică un interviu de

grup

4 Chestionarul Document scris adresat unor persoane pentru a răspunde la una sau mai multe icircntrebări

Trebuie să aducă răspunsurile la icircntrebările care motivează studiul constituind ansamblul icircntrebărilor destinate

culegerii de informaţii (date) Redactarea chestionarului trebuie să ţină cont de structura acestuia introducere

conţinut exprimarea icircntrebărilor grafica chestionarului

5 Icircnregistrări preexistente

Icircn cercetarea medicală sunt cel mai frecvent utilizate Informaţiile dorite sunt deja existente ceea ce icirci revine

cercetătorului este ca să structureze datele icircn funcţie de scopul studiului pe care icircn conduce Aceste surse sunt

bull Foi de observaţie

bull Registre de consultaţie

bull Buletine de analize

bull Registre de operaţii

Icircn cazul icircn care nici o metodă de culegere a datelor nu este pe placul celui ce conduce studiul există

posibilitatea de a construi un instrument nou de culegere a datelor

Acest proces trebuie să urmărească nişte paşi obligatorii fiind mare consumator de timp

bull Definirea structurii cu care se va face măsurarea

bull Formularea itemilor de măsură

bull Analiza validităţii instrumentului de măsură ndash măsoară acesta fenomenul corect

bull Elaborarea de instrucţiuni de utilizare pentru investigatori

14

bull Pretestarea instrumentului

bull Aprecierea validităţii interne şi externe a datelor culese

Instrumente de cercetare

Formularea clară a temei de cercetare necesită o foarte bună definire a factorilor studiaţi şi a criteriilor de

judecată Acestea din urmă sunt ultimele care vor trebui definite icircn cadrul protocolului de studiu

Alegerea unui instrument de măsură

Nu există un instrument de măsură perfect sau universal corect Alegerea sa dintre cele existente şi cele deja

utilizate depind de trei factori

bull Obiectivul studiului

bull Boala studiată

bull Populaţia icircn studiu

De aceste trei elemente trebuie ţinut cont icircn fiecare etapă a dezvoltării instrumentului

Definirea obiectivului

Studiu transversal Dacă se doreşte studierea unui simptom sau a unei caracteristici ale populaţiei se poate

icircmpărţi populaţia de studiu icircn mai multe grupuri Este practic vorba de a determina diferenţele dintre subiecţi

icircn cea ce priveşte o variabilă necesară studiată printr-un studiu transversal (utilizarea dozării de Ac HBS

pentru a evalua progresele bolnavilor de hepatită tip B)

Studiu longitudinal Icircn acest caz nu se poate icircmpărţii populaţia de studiu icircn mai multe grupuri datele obţinute

fiind de la acelaşi subiect colectate după un interval de timp

Icircn funcţie de boală şi populaţie se aleg şi instrumentele de măsură cele mai adecvate

Instrumentele cercetării reprezintă un mecanism specific sau o strategie pe care cercetătorul o utilizează pentru

colectarea prelucrarea şi inferenţa datelor Aceste instrumente sunt

1 Studiul icircn bibliotecă

2 Computerul

3 Determinările experimentale

4 Statistica

5 Mintea umană

6 Facilităţi de limbaj şi comunicare

Determinările experimentale

Măsurarea constă icircn aprecierea şi cuantificarea fenomenelor calitativ sau cantitativ Interpretarea

datelor se referă la transformarea lor icircn unităţi de descoperire a unor fenomene mai puţin cercetate

Standardele acceptate se referă la norme medii distribuţii etc Tot icircn cadrul interpretării datelor datele

obţinute sunt caracterizate pe scale de valori nominal ordinal de interval sau de raport

Validarea şi reproductibilitatea măsurătorilor sunt aspecte importante şi foarte necesare pentru o

cercetare corect fundamentată care doreşte obţinerea unor concluzii pertinente

15

Statistica Este implicată icircn condensarea şi procesarea unui volum mai mare de date astfel icircncacirct să se poată

interpreta corect valorile obţinute şi să se permită comparările Utilizarea unor teste statistice specifice permite

determinarea semnificaţiei (diferenţei) statistice astfel icircncacirct estimatorii să poată fi aplicaţi la populaţia

generală Furnizează informaţii şi privind corelarea sau relaţionarea icircntre date

Mintea umană este cea care reuşeşte să integreze şi să icircnţeleagă rezultatele obţinute Semnificaţia ştiinţifică

este stabilită icircn funcţie de rezultatele statisticii de mintea umană conform afirmaţiei bdquosemnificaţia ştiinţifică

nu este egală cu semnificaţia statisticărdquo Metodele aplicate pentru a putea ajunge la o concluzie pertinentă sunt

logica deductivă raţionamentul inductiv şi gacircndirea critică

Limbaj şi comunicare Exprimarea orală sau icircn scris permite nuanţarea unor aspecte seci cifrice ale unor

studii Icircn acest mod devine mai evidentă semnificaţia ştiinţifică a unor rezultate statistice

34 Prelucrarea datelor

Instrumentele de prelucrare

Statistica este o ştiinţă ramură a matematicii care studiază evoluţia fenomenelor şi proceselor

colective pe baza observării lor ştiinţifice a culegerii şi prelucrării detaliate a informaţiilor statistice cu scopul

de a formula şi explica legile legităţile şi regularităţile ce le guvernează

Statistica permite deci aprecierea unor parametrii populaţionali prin studiul unui număr redus de

elemente ale populaţiei icircn studiu (ţintă) O populaţie poate fi definită printr-un şir de valori care pot fi grupate

icircn funcţie de parametrul studiat (glicemie colesterol TAD TAS etc) Pentru fiecare astfel de şir se defineşte

o variabilă (care va purta nume propriu glicemie colesterol etc) Practic variabila este considerată o funcţie

ia valori posibil diferite de la un element la altul icircn funcţie de caracteristicile proprii acestora Sunt clasificate

icircn două grupe variabile cantitative (caracteristică măsurabilă) şi calitative (caracteristică ce nu poate fi

măsurată)

La racircndul lor variabilele calitative pot fi

bull Nominale ndash grupuri de elemente ce nu pot fi ordonate (culoarea părului)

bull Nominale ordonate ndash concluziile pot fi grupate (eficienţa unui tratament slabă bună foarte bună)

bull Binare ndash apar numai două posibilităţi (bolnav sănătos)

Variabilele cantitative pot fi

bull Continue ndash o variabilă măsurabilă care poate lua o infinitate de valori

bull Discrete ndash variabile care nu pot lua decacirct valori icircntregi

Statistica descriptivă

Există două ramuri ale statisticii statistica descriptivă şi statistica inferenţială

Statistica descriptivă (după cum rezultă din denumire) se ocupă cu descrierea unor valori obţinute ale unei

variabile studiate

16

Valorile pe care variabila le ia se constituie icircntr-o serie statistică Indicatorii care definesc o variabilă (serie)

sunt

1 Ale tendinţei centrale

Media aritmetică - notată de regulă cu

Mediana - este acea valoare din şirul de date care icircmparte icircn două părţi egale şirul ordonat de valori (atenţie

şirul este ordonat crescător) situacircndu-se la mijlocul seriei statistice

Dacă numărul de valori n este un număr impar atunci mediana este valoarea unde

Dacă n este par deci avem un număr par de valori mediana este definitatilde ca fiind

unde k = n2

Modul - constituie valoarea care apare cel mai des deci valoarea cu numărul cel mai mare de apariţii

2 De dispersie

Amplitudinea - este diferenţa dintre valoarea maximă şi cea minimă

A = Amax - Amin

Amplitudinea relativă - notată A este raportul dintre amplitudinea absolută şi media aritmetică a seriei de

date

Varianţa notată este un indicator de icircmprăştiere a datelor Formula de calcul este

Abaterea standard (S) sau deviaţia standard reprezintă rădăcina pătrată din varianţă (dispersie)

Coeficientul de variaţie se calculează ca un raport procentual icircntre abaterea standard şi valoarea medie a şirului

de valori

Eroarea standard intervine icircn estimarea intervalelor de confidenţă Se calculează astfel

17

3 De asimetrie (skewness) indică distribuţia datelor dacă sunt sau nu distribuite normal

4 De boltire (kurtosis) estimează boltirea sau aplatizarea curbei de distribuţie

Prezentarea descriptivă a datelor se face prin icircnregistrarea datelor culese icircn tabele care să reprezinte icircn mod

sintetic valorile măsurate

Icircn concluzie statistica descriptivă permite

bull Stabilirea comparabilităţii icircntre grupurile de studiu şi aprecierea prezenţei erorilor sau confuziei

bull Reprezentarea datelor icircn tabele permite evaluarea fiecărui pacient şi dacă a existat pierderi din studiu

Statistica inferenţială

Statistica inferenţială (inductivă) este partea de analiză a datelor care permite extrapolarea unei

concluzii trase pe baza unui eşantion spre populaţia ţintă pentru care a fost efectuat studiul

Scopul analizei statistice este de a evidenţia efectul unui tratament sau al unui factor de risc prin date obţinute

din eşantionul studiat spre populaţia ţintă Aceasta implică testarea ipotezelor statistice sau altfel spus testarea

semnificaţiei statistice Este una dintre cele mai importante momente ale studiului Cum rezultatele sunt

obţinute prin studiul unui eşantion există posibilitatea ca acestea să fie datorate icircntacircmplării Testele

statistice ne ajută să apreciem icircn ce măsură rezultatele sunt icircntacircmplătoare şi mai ales icircn ce măsură şi dacă se

pot aplica populaţiei generale Icircn acest scop se impune o valoare limită alfa 005 care reprezintă limita

superioară a probabilităţii ca rezultatul obţinut să fie greşit (datorat icircntacircmplării) Astfel icircn funcţie de tipul

variabilelor şi indicatorii descriptivi aplicaţi şi evaluaţi se aplică teste de semnificaţie statistică (Tabelul 1)

Tabelul 1 Alegerea testelor de semnificaţie statistică

Tipul datelor

18

Diferenţierea variabilelor din punctul de vedere a distribuţiei se face folosind testul de normalitate

Kolmogorov ndash Smirnov

Testul statistic reprezintă metoda de comparaţie a două sau mai multe populaţii prin intermediul unor

variabile observate ale lor

Scopul unui test statistic este de a defini realitatea

Definirea icircntrebării de cercetare (ipoteza clinică)

Tratamentul cu Nebivolol este la fel de eficient ca şi cel cu Valsartan icircn tratamentul

hipertensiunii arteriale

Transpunerea icircntrebării de cercetare icircn termeni statistici (ipoteza statistică)

Media tensiunii arteriale a pacienţilor trataţi cu Valsartan nu diferă semnificativ de media

tensiunii arteriale a pacienţilor trataţi cu Nebivolol

Etapele unui test statistic

1 Formularea problemei icircn termenii ipotezelor statistice

2 Alegerea şi calcularea parametrului statistic al testului

3 Regiunea critică

4 Concluzia testului

1 Formularea problemei icircn termenii ipotezelor statistice

Ipoteza nulă ipoteza care trebuie testată testul efectuacircndu-se sub prezumţia că ipoteza nulă ar

fi adevărată

Ipoteza alternativă acea ipoteză care icircntr-un sens sau altul contrazice ipoteza nulă Această

ipoteză se mai numeşte şi ipoteza de lucru

Ipoteza nulă tipuri

O coadă (ldquoone-tailedrdquo sau ldquoone-siderdquo)

Media este mai mare

Media este mai mică

Două cozi (ldquoone-tailedrdquo sau ldquoone-siderdquo)

Media este egală

2 Alegerea şi calcularea parametrului statistic al testului

Parametrul statistic al testului exprimă icircntr-o anumită formă diferenţa dintre elementele comparate

Ţinacircnd seama de faptul că eşantionul sau eşantioanele utilizate sunt aleator extrase din populaţiile care

fac obiectul testului parametrul statistic este o variabilă aleatoare de selecţie care urmează o anumită

lege de probabilitate

Un parametru statistic al testului bun trebuie să icircndeplinească două condiţii

19

Trebuie să se comporte diferit atunci cacircnd ipoteza nulă H0 este adevărată faţă de situaţia icircn

care ipoteza alternativă H1 este adevărată

Distribuţia de probabilitate a parametrului statistic al testului sub prezumţia că H0 este

adevărată este cunoscută

3 Regiunea critică

- Trebuie să fim capabili să decidem icircn funcţie de valoarea parametrului statistic calculat care dintre

ipoteze cea nulă sau cea alternativă este adevărată

- Dacă valoarea parametrului statistic aparţine regiunii critice ipoteza nulă H0 va fi respinsă şi va fi

acceptată ipoteza alternativă H1

- Dacă valoarea parametrului statistic nu aparţine regiunii critice ipoteza nulă H0 va fi acceptată

- Decidem mărimea regiunii critice

Pentru aceasta trebuie să specificăm mărimea riscului de eroare pe care icircl acceptăm

Pe scurt definim nivelul de semnificaţie notat cu a sau mărimea riscului pe care

suntem dispuşi să ni-l asumăm icircn respingerea ipotezei nule H0 icircn cazul icircn care aceasta

este adevărată De obicei se alege un nivel de semnificaţie icircntre 1 şi 5

Probabilitatea unei erori de tipul I

probabilitatea de respingere a ipotezei nule H0 icircn favoarea ipotezei alternative H1 icircn

condiţiile icircn care H0 este adevărată

probabilitatea unei erori de tipul I se notează cu a şi se mai numeşte nivel de

semnificaţie al testului

Probabilitatea unei erori de tipul II

probabilitatea acceptării ipotezei nule icircn condiţiile icircn care ipoteza alternativă H1 este

adevărată

această probabilitate se notează cu b

- Unilaterală la dreapta ndash valoarea parametrului statistic al testului este mai mare sau egală cu

valoarea din dreapta a intervalului critic

- Unilaterală la stacircnga ndash valoarea parametrului statistic al testului este mai mică sau egală cu

valoarea din stacircnga a intervalului critic

- Bilaterală ndash valoarea parametrului statistic al testului este mai mică sau egală cu valoarea extremă

din stacircnga regiunii critice sau mai mare sau egală cu valoarea extremă din dreapta regiunii critice

valorile extreme ale regiunii critice avacircnd nivele egale de semnificaţie

4 Concluzia testului

- Ipoteza nulă H0 este respinsă dacă valoarea parametrului statistic aparţine regiunii critice

20

- Regiunea critică trebuie astfel aleasă icircncacirct dacă ipoteza alternativă H1 este adevărată

probabilitatea de respingere a ipotezei nule H0 este mai mare decacirct icircn cazul icircn care ipoteza nulă H0

ar fi adevărată

- Acceptarea ipotezei nule H0 atunci cacircnd ipoteza alternativă H1 este adevărată este cunoscută ca şi

eroarea de tipul II

a probabilitatea ei se notează cu b

b măsoară bdquonivelul de eroarerdquo

- Icircn testarea oricărei ipoteze statistice există patru situaţii care determină dacă decizia noastră este

corectă sau nu

Cazuri

H0 este adevărată H0 este falsă

Concluzie H0 se acceptă decizie corectă eroare de tipul

II

H0 se

respinge

eroare de tipul I decizie corectă

Luarea deciziei pe baza valorii probabilităţii p de semnificaţie a testului

Icircn momentul icircn care prelucrăm statistic o serie de date dorim să ştim dacă rezultatele obţinute sunt sau

nu semnificative statistic

Răspunsul la această icircntrebare este dat de valoarea lui p calculată de orice program statistic la

prelucrarea unor date

Icircn cazul testelor statistice ipoteza nulă este respinsă dacă nivelul de semnificaţie este mai mic decacirct

005 iar programele de prelucrare statistică a datelor vor afişa o steluţă () icircn tabelul rezultatelor

21

Dacă p le 005 respingem ipoteza nulă şi acceptăm ipoteza alternativă (am obţinut semnificaţia

statistică)

Dacă p gt 005 acceptăm ipoteza nulă (nu am obţinut semnificaţia statistică)

p = 013

NU respingem ipoteza nulă

Risc de eroare de tip II

α = 005

p = 002

Respingem ipoteza nulă

Risc de eroare de tip I

Semnificaţia lui p

Criteriu de luare a deciziei cu privire la o ipoteză statistică nulă

Cuantifică şansa ca o decizie de respingere a ipotezei nule să fie greşită

Măsură a semnificaţiei statistice şi NU CLINICĂ

22

Semnificaţia lui p (reguli empirice)

001 le p lt 005 rezultatul e semnificativ statistic

0001 le p lt 001 rezultatul e icircnalt semnificativ statistic

p lt 0001 rezultatul e foarte icircnalt semnificativ statistic

p ge 005 rezultatul e considerat nesemnificativ statistic

Limite ale valorii p

Valoarea p NU ne dă informaţii despre

Şansa de beneficiu a unui pacient individual

Procentul de pacienţi care vor avea un beneficiu icircn urma instituirii procedurii medicale

Gradul de beneficiu expectat pentru un anumit pacient

Puterea unui test statistic

Este capacitatea de a detecta o diferenţă acolo unde există

Creşterea volumului eşantionului determină creşterea puterii testului statistic aplicat

Valoarea este icircn relaţie directă cu eroarea de tip II

Puterea = 1 ndash β

Cea mai utilizată modalitate de creştere a puterii unui test statistic este de a creşte volumul

eşantionului

Tipul scalei de măsură ndash testul statistic

Denumire test Interval Nominal Observaţii

Corelaţie Pearson 2 0 Există o relaţie liniară

χ2 0 2

Student 1 1 Doar 2 grupuri

ANOVA 1 1 2 sau mai multe grupuri

Student perechi 1 1 Eşantioane perechi

Măsurători repetate (ANOVA) 1 1 Mai mult de 2 grupuri date

perechi

Inferenţa statistică pe date calitativ e

Tabela de contingenţă 2times2

Riscuri şi raţii

Testul χ2 (testarea asocierii icircn tabela de contingenţă)

Testul Fisher

23

Testul z pentru proporţii

Testul McNemar

Tabela de contingenţă 2times2

Scale de tip nominal (dicotomiale tabela de contingenţă de 2times2) sau ordinal (tabela de contingenţă de

rtimesc)

Frecvenţa absolută (numărul de evenimente per categorie)

Tabela de contingenţă de 2times2 4 categorii

AP = adevărat pozitiv

FP = fals pozitiv

FN = fals negativ

AN = adevărat negativ

Ulcer deschis Ulcer vindecat Total

Recurenţă + AP = 1 FP = 5 = 1+5 = 6

Recurenţă - FN = 7 AN = 16 = 7+16 = 23

Total =1+7=8 =5+16=21 29

Riscuri şi raţii Mărimi ale asocierii

Denumire Formula Definiţie

Rata falşilor pozitivi =FP(FP+AN) Probabilitatea unui test fals + (α)

Rata falşilor negativi =FN(FN+AP) Probabilitatea unui test fals ndash (β)

Sensibilitate =AP(AP+FN) Probabilitatea unui test real + (1- β)

Specificitate =AN(AN+FP) Probabilitatea unui test real ndash (1- α)

Acurateţe =(AP+AN)n Probabilitatea generală a unei decizii corecte

Valoarea predictivă pozitivă =AP(AP+FP) Probabilitatea ca un test pozitiv să fie corect

Valoarea predictivă negativă =AN(AN+FN) Probabilitatea ca un test negativ să fie corect

Riscul relativ =AP(FP+AN)FN(AP+FP)

Rata şansei =(AP∙AN)(FN∙FP)

Riscul atribuabil =AP(AP+FP)-FN(FN+AN)

24

Denumire Formula

Rata falşilor pozitivi = 5(5+1) = 08334

Rata falşilor negativi = 7(7+16) = 03043

Sensibilitate = 1(1+7) = 01250

Specificitate = 16(16+5) = 07619

Acurateţe = (1+16)29 = 05862

Valoarea predictivă pozitivă = 1(1+5) = 01667

Valoarea predictivă negativă = 16(16+7) = 06957

Riscul relativ = 1(5+16)7(1+5) = 2142 = 050

Rata şansei = (1∙16)(7∙5) = 04571

Riscul atribuabil = 1(1+5)-7(7+16) = 01667-03043=-01376

Testarea asocierii icircn tabela de contingenţă

Testul χ2

Nu trebuie utilizat pentru eşantioane de volum mic

Testul este valid doar dacă valoarea expectată (aşteptată) pentru fiecare celulă este cel puţin

egală cu 1 şi frecvenţa absolută observată este de minim 5

Dacă aceste condiţii nu sunt icircndeplinite se aplică testul exact al lui Fisher (Fisherrsquos Exact Test)

Indică dacă cele două variabile sunt sau nu independente DAR NU cuantifică puterea asocierii

dintre ele

Problema S-a investigat icircntr-un studiu asocierea dintre obezitatea (ca factor de risc) şi bolile

cardio-vasculare la persoanele icircn etate (gt 60 ani) Din totalul de 620 persoane investigate s-au

identificat 150 persoane cu obezitate şi boală cardio-vasculară 230 persoane fără obezitate şi

fără boală cardio-vasculară şi 60 persoane fără obezitate dar cu boală cardio-vasculară Există

o asociere icircntre obezitate şi boala cardio-vasculară (df=1 α=005 χ2critic = 384)

Testul χ2 exemplu

H025

Nu există asociere icircntre obezitate şi bolile cardio-vasculare

Obezitatea şi bolile cardio-vasculare sunt independente

H1

Există asociere icircntre obezitate şi bolile cardio-vasculare

Obezitatea şi bolile cardio-vasculare sunt asociate

a = 005 pragul de semnificaţie al testului

urmează o lege cu (r-1)(c-1) grade de libertate

χ2 = parametrul testului χ2

fio = frecvenţa observată

fit = frecvenţa teoretică

Regiunea critică este [χα2 yen)

Pentru α = 005 χα2 = 384

OBSERVAT BCV+ BCV- Total

Obezitate + AP = 150 FP = 180 330

Obezitate - FN = 60 AN = 230 290

Total 210 410 620

TEORETIC BCV+ BCV- Total

Obezitate + = 330times210620 = 330times410620 330

Obezitate - = 290times210620 = 290times410620 290

Total 210 410 620

TEORETIC BCV+ BCV- Total

Obezitate + = 330times210620 = 330times410620 330

26

Obezitate - = 290times210620 = 290times410620 290

Total 210 410 620

TEORETIC BCV+ BCV-

Obezitate + = 112 = 218

Obezitate - = 98 = 192

Deoarece 4177Icirc[384 yen) se respinge H0 cu un risc de eroare de 5

Există asociere icircntre obezitate şi bolile cardio-vasculare

Testul Fisher

Corecţie a testului χ2

Valoarea p asociată parametrului ne dă probabilitatea ca valoarea observată de independenţă să fie

atribuită doar şansei

O valoare p mică indică că există alte cauze decacirct şansa influenţează rezultatul şi astfel cele două

variabile investigate nu sunt independente

Testul Fisher = dispersia corectată a factorului x dispersia corectată a factorilor reziduali

Icircn acest context regula adunării dispersiilor se poate scrie unde

este variaţia lui y pe seama variaţiei variabilei x

este variaţia lui y pe seama influenţei factorilor reziduali (neicircnregistraţi)

este variaţia totală a caracteristicii y

Testul Fisher empiric se calculează după formula

27

se compară cu Ftab pentru nx şi nz grade de libertate la un anumit prag de semnificaţie stabilit

Dacă Fc gt Ftab rezultă că variaţia factorului de grupare x este semnificativă pentru variaţia caracteristicii y

Testul z pentru proporţii

1 Compararea unei frecvenţe observate cu o frecvenţă teoretică

2 Testarea egalităţii a două frecvenţe

Testul z Compararea unei frecvenţe observate cu o frecvenţă teoretică

Scop Investigarea semnificaţiei diferenţei icircntre o frecvenţă teoretică p (icircntr-o populaţie) şi o frecvenţă

observată f pe un eşantion reprezentativ (variabilă calitativă (binare))

Condiţii de aplicare Testul este corect aplicat dacă numărul n al observaţiilor eşantionului este

suficient de mare (n∙p n∙(1-p)gt10

Parametrul

n = volumul eşantionului

Suntem interesaţi de investigarea prevalenţei hepatitei B la personalul care lucrează icircn laboratoarele

clinicilor de boli infecţioase din Transilvania Se ştie din studii anterioare că prevalenţa hepatitei B icircn

populaţia generală din Transilvania este de 9 S-a luat icircn studiu un eşantion de 100 persoane şi s-a

obţinut o prevalenţă a hepatitei B de 6 Există diferenţă semnificativă icircntre frecvenţa hepatitei B la

personalul care lucrează icircn laboratoarele spitalelor de boli infecţioase din Transilvania faţă de

populaţia generală

f = 006 p = 009 n = 100

Ipoteza nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat

faţă de frecvenţa hepatitei B icircn populaţia generală

Ipoteza alternativă test bilateral Există diferenţă semnificativă icircntre frecvenţa hepatitei B la

nivelul eşantionului şi prevalenţa hepatitei B icircn populaţia generală

f = 006 p = 009 n = 100

Pragul de semnificaţie a = 005

Regiunea critică test bilateral (-yen -196 ]Egrave[196 yen)

28

Concluzia testului

Deoarece parametrul statistic calculat al testului nu aparţine regiunii critice se acceptă ipoteza

nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat faţă de

frecvenţa hepatitei B icircn populaţia generală

Testul McNemar

Evaluarea dependenţei variabilelor calitative perechi (dorim să determinăm dacă o anumită

caracteristică este sau nu asociată cu o anumită patologie)

Identificăm n pacienţi care prezintă patologia de interes (eg Cancer bronho-pulmonar) şi n

pacienţi cu aceleaşi caracteristici ca şi primul grup dar care nu o prezintă

Martor = da Martor = nu

Caz = da a b

Caz = nu c d

Testul McNemar - exemplu fumat vs cancer

Martor = da Martor = nu

Cancer = da a = 2 b = 5

Cancer = nu c = 0 d = 3

29

χ2critic(α=005) = 384

32 lt 384 rarr acceptăm ipoteza nulă

Fumatul nu este icircn relaţie cu apariţia cancerului bronho-pulmonar

Inferenţa statistică pe date cantitative

Variabile cantitative continue

Testul z şi Student (t) (o medie sau medii perechi)

Testul z şi Student (t) (testarea a două medii)

ANOVA (ge 3 medii)

Ranguri (variabile cantitative discrete sau cantitative care nu icircndeplinesc condiţia de

normalitate)

Testul sumei rangurilor Wilcoxon

Kruskal-Wallis (ge 3 eşantioane independente)

Friedman (ge 3 eşantioane dependente)

Teste de normalitate variabile cantitative continue

Shapiro-Wilk

Kolmogorov-Smirnov

Shapiro-Wilk

Chi-Square Goodness-of-Fit

Dacă datele urmează o distribuţie normală aplicăm un test parametric

Dacă datele nu urmează o distribuţie normală aplicăm un test de comparare al rangurilor

30

Testul Z de comparare a mediei unui eşantion cu media unei populaţii

Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ

extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie

s2 care se cunoaşte

Condiţii de aplicare

1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru

compararea mediei unui eşantion cu media unei populaţii)

2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal

distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă

3 Talia eşantionului este mare ( ge 30)

Ipoteze

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media

eşantionului şi media populaţiei

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

(-yen -196 ] Egrave [196 yen)

Parametrul testului

n = volumul eşantionului

= media eşantionului

s = deviaţia standard a populaţiei

Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)

Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard

cunoscută

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi

media standard

Condiţii de aplicare

Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se

realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această

condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea

31

Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai

puternic

Numărul de grade de libertate (df) df = n-1

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

Parametrul testului

n = volumul eşantionului

micro0 = media standard

= media eşantionului

s = deviaţia standard a eşantionului

Testul ANOVA compararea mediilor a mai multe eşantioane

H0 = toate mediile sunt egale

H1 = nu toate mediile sunt egale

Condiţii de aplicare

1 Datele sunt independente unele faţă de celelalte

2 Datele fiecărui grup sunt normal distribuite

3 Deviaţia standard este aceeaşi pentru toate grupurile

Id Medicament

A B C D E F

1 5 6 7 10 5 9

2 6 8 8 11 8 8

3 7 7 9 13 6 7

4 8 9 11 12 4 5

32

5 9 10 10 9 7 6

Suma 35 40 45 55 30 35

Media 7 8 9 11 6 7

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =

= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)

Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2

F = (suma pătratelor(icircntre))(suma pătratelor(icircn))

Suma pătratelor (icircntre) = 16times5 = 80

Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60

Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn

interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare

SP df Media pătratelor F = MPicircntreMPicircn

Icircntre 80 5 = 805 = 16 = 1625 = 64

Icircn 60 24 = 6024 = 25

Total 140 29 -

Testul sumei rangurilor Wilcoxon

Aplicat pentru

Un set de observaţii provenite dintr-o valoare ipotetică comună

Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)

Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero

Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace

Suma rangurilor pentru diferenţele negative = 2+3+1 = 6

Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30

33

Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului

egal cu 8 = 0109

Icircnainte După Diferenţa Rang

64 66 -2 2

66 58 8 5

67 68 -1 3

71 65 6 4

72 75 -3 1

76 67 9 6

78 59 19 8

89 74 15 7

Testul Kruskal-Wallis (ge 3 eşantioane independente)

Test de ranguri aplicate pe mai mult de 3 eşantioane

H = parametrul testului

n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)

Tk = suma rangurilor

Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie

pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni

34

df = k-1 (k = numărul de eşantioane)

df = 3-1 = 2

Hcritic(α=005) = 599

H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie

pozitivă şi respectiv biopsie negativă

Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie

a tipului de studiu pe eşantioane perechi)

1 Definirea numărului de tratamente k

2 Obţinerea rangurilor pentru fiecare tratament

3 Sumarea rangurilor fiecărui tratament

4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)

5 Dacă Fr gt Frcritic rarr respingem H0

Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost

măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi

n = 9 k = 3 T12 = 225 T2

2 = 38025 T32 = 38025

Frcritic = 599

Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de

prostată

35

De reţinut

Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei

Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-

of-Fit

Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z

Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t

Compararea mediilor a 3 sau mai multe eşantioane ANOVA

Compararea mediilor a două populaţii (σ) testul Z

Compararea mediilor a două eşantioane (s) testul t

Compararea mediilor a două eşantioane perechi (s) testul t

ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi

cu cel pentru compararea a două eşantioane perechi

Ranguri

Distribuţia datelor nu are importanţă

Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)

Trei sau mai multe eşantioane Kruskal-Wallis

Trei sau mai multe eşantioane perechi Friedman

Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia

Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a

datelor)

Variabile nominale

Un singur eşantion sau eşantioane perechi

Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte

Eşantioane perechi testul Mc Nemar

Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2

Icircn analiza proporţiilor există teste diferite pentru

Compararea unei frecvenţe cu o frecvenţă cunoscută

Compararea a două frecvenţe

Semnificaţia statistică

Valoarea p (p value)

Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor

două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E

posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării

aleatorii

36

Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală

urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii

Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este

probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un

experiment de dimensiunea acestuia

Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că

diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii

diferite

Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca

fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă

ar fi fost adevărată

Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă

1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe

baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De

fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001

2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie

3 Se aplică testul statistic aferent pentru a calcula valoarea p

4 Se compară valoarea p cu valoarea ndash prag

5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe

semnificativă dpdv statisticrdquo

6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e

semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să

conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă

Teste de semnificaţie

Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului

populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)

Testarea ipotezelor implică posibile erori

Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile

sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui

grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul

icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005

ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există

37

nici o diferenţă

Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ

statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de

ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost

ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau

dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă

cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă

semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe

ipotetice variate icircn cazul icircn care ele există

Măsuri ale frecvenţei

Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)

Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate

Generic formula pe care se bazează toate cele trei este

unde x şi y sunt cantităţile de comparat

Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea

unei frecvenţe pe grupe de sex vacircrstă etc

Proporţia implică icircn mod necesar ca x să fie inclus icircn y

Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară

frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp

Pentru calcularea unei rate trebuie ţinut cont de trei aspecte

bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin

bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp

bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo

Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un

tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei

populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei

aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)

38

Indicatori

Rata de incidenţă

Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă

icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii

Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o

perioadă de timp

Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de

timp x

Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei

susceptibili de a dezvolta icircmbolnăvirea studiată

Numitorul poate fi

bull Numărul mediu al populaţiei icircn perioada de timp studiată

bull Mărimea populaţiei icircn mijlocul perioadei de studiu

bull Mărimea populaţiei la icircnceputul studiului

Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă

Este obligatorie menţionarea perioadei de timp

Prevalenţa

Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la

un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă

schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa

momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)

39

Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include

numai cazuri noi respectiv include cazuri noi şi vechi

Rata de atac

Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este

folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp

raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori

Rata persoană-timp

Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din

momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte

migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost

observate

Riscul relativ (RR)

Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment

legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele

prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două

grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la

bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la

bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai

mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo

Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2

Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn

cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă

(Tabelul 1)

Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR

Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la

neexpuşi

40

Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de

culegere a datelor

Odds ratio (OR)

Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin

raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general

studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)

Tabelul 2 Tabelul 2 x 2 pentru calcularea OR

Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală

Rate de mortalitate

Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp

specificată Există mai multe tipuri de rate de mortalitate

o Mortalitate specifică pe sex

o Mortalitate specifică pe rasă

o Mortalitate specifică pe boală

o Mortalitate neonatală

o Mortalitate postneonatală

o Mortalitate infantilă

o Mortalitate maternă

Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP

41

Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de

viaţă şi vacircrsta la care survine decesul dacă este prematur

Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu

Ani de viaţă pierduţi datorat dizabilităţii

Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt

utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru

cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite

grupuri

Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de

risc şi o boală se folosesc riscul relativ şi odds ratio

35 Analiza şi interpretarea datelor

După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date

trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul

Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor

colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului

studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu

plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde

prezenţa biostatisticianului este necesară

Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu

elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat

iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului

iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate

depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori

testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere

clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza

Interpretarea rezultatelor statistice

Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne

motive (număr mic de date) acceptarea ei să fie falsă

Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine

gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia

ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument

de decizie Intervalul de confidenţă

42

Interpretarea statistica ne interpretarea clinică

Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă

Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice

obţinute pe eşantionul studiat

Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare

Ce interpretăm Rezultatele

personale obţinute icircn urma studiului

care au fost prezentate icircn secţiunea bdquoRezultaterdquo

Explicăm rezultatele obţinute

Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale

Interpretarea trebuie să se realizeze icircn

lumina limitelor studiului

contextul cultural social şi educaţional al locului unde s-a realizat cercetarea

contextul a ceea ce se cunoaşte din literatura de specialitate

Interpretăm doar rezultatele personale obţinute icircn urma studiului

Interpretarea statistică nu este tot una cu interpretarea clinică

Interpretarea statistică este importantă

Interpretarea clinică este foarte importantă

Intervalul de confidenţă

Media calculată pe baza unui eşantion nu va echivala media populaţiei

Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului

Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a

populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a

populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)

pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru

orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare

dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de

confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de

date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de

5

Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel

Dacă valoarea p este mică

Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare

aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o

medie diferită Diferenţa este semnificativă dpdv statistic

43

Icircn continuare

Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa

reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică

pentru a fi interesante din punct de vedere ştiinţific

Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC

oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care

este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a

obţine o concluzie clară

Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o

diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că

datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din

punct de vedere ştiinţific

Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul

detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat

Erorile studiilor medicale

Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura

anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară

caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea

asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri

legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias

Erorile potenţiale icircn studiile epidemiologice

1 Erori icircntacircmplătoare

2 Erori sistematice

3 Confuzia

4 Validitatea

1 Erori icircntacircmplătoare

Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a

parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel

de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot

fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii

(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor

de măsură (eroarea de măsurare)

44

2 Erori sistematice

Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate

care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu

acurateţe mare Acurateţea nu este afectată de mărimea eşantionului

Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de

experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea

dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus

şi greu de cuantificat (consum de alcool personalitate etc)

Principalele tipuri de erori din această categorie sunt

bull Biasul de selecţie

bull Biasul de informaţie

Biasul de selecţie

Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul

trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion

inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale

persoanelor incluse

Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se

ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia

Biasul de informaţie

Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de

instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze

expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere

nesemnificativă sau chiar să nu şi-o amintească de loc

3 Confuzia

Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune

prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este

cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă

de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte

important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor

protector

4 Validitatea

Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă

Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte

estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional

Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă

45

conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se

demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)

Validitatea externă se poate realiza numai dacă studiul este valid intern

Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii

studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de

studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt

laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi

validă din punct de vedere intern)

3 6 Prezentarea rezultatelor

După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite

Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor

icircntr-o formă bdquodigerabilărdquo este necesară

Scopul prezentării datelor

1 Transmiterea concluziilor studiului

a Datele corecte şi importante merită comunicate

b Datele trebuie să confirme sau să infirme ipoteza studiului

c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală

2 Acordarea posibilităţii altor cercetători să aprecieze studiul

a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti

b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor

prezentate

Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru

fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie

statistică

Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de

valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras

(Tabel 3)

Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)

46

Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct

numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor

precum şi prezentarea acestora sub formă inteligibilă

Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care

convin cercetătorului

Prezentarea datelor se poate face

1 Figuri şi tabele icircn articole scrise

2 Figuri şi tabele icircn prezentări orale

3 Figuri şi tabele icircn postere

4 Text scris sau incluse icircn text

5 Site-uri de WEB

Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor

Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie

Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele

exprimacircnd exact ceea ce acestea exprimă

Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate

anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel

să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se

acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca

mai sus sugestive sunt formatele simple şi puţin icircncărcate

Dacă nu există reguli impuse se respectă

1 Mesaj simplu fără falsificarea datelor

2 De obicei este necesar atacirct tabelul cacirct şi graficul

3 Să fie simplu şi clar

Tabele

Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile

coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică

elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de

1 Se folosesc doar linii orizontale

2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn

evidenţi prin linie de separare (Tabelul 4)

Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland

Noua Zeelandă)

(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)

47

3 Numerele sunt aliniate icircn funcţie de virgulă

4 Indicii statistici sunt explicaţi sub tabel

5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană

6 Abrevierile pot fi folosite

7 Numărul de zecimale trebuie limitat la maxim două

8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel

9 Plasarea legendei este obligatorie sub tabel

10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)

Icircn cazul prezentărilor orale sau a posterelor este indicat ca

1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării

2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte

3 Folosirea de simboluri este permisă

Clasificarea tabelelor

Tabelele se clasifică după

i) conţinut

bull cu distribuţii de frecvenţe

bull de clase de frecvenţe

bull de contingenţă

ii) structura

bull cu doua coloane

bull cu subclasificări

bull ldquomasterrdquo

Tabele ce conţin distribuţii de frecvenţe

O modalitate comodă de a prezenta o mulţime de date brute este

1 Se ordonează datele in ordine crescătoare

2 Se determine frecvenţa fiecărei valori

3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane

(Tabelul 5)

Tabelul 5 Distribuţii de frecvenţă absolută

48

Tabelul claselor de frecvenţe

1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă

2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)

Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)

Tabele de contingenţă

1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a

tabelelor de contingenţă

2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a

combinaţiilor de perechi ordonate de valori

3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre

a factor de risc si

b starea sănătăţii

4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)

5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)

Tabelul 7 Tabel de contingenţă 2 x 2

49

Grafice

Există două categorii de moduri grafice sub care se pot prezenta datele

1 Ilustraţii şi fotografii

2 Grafice

1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă

pentru lucrare

2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit

Putem vorbi despre mai multe tipuri de grafice

bull Grafice pentru reprezentarea datelor cantitative

1048707 Grafic cartezian (X Y)

1048707 Histograma

1048707 Poligonul de frecvenţe

1048707 Diagrama bdquoscatterrdquo

bull Grafice pentru reprezentarea datelor calitative

1048707 Grafic cu bare

1048707 Diagrama tip bdquoboxplotrdquo

1048707 Diagrama bdquopierdquo

1048707 Cartograma

Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi

dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)

Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)

Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie

Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)

Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)

50

Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir

de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele

două variabile studiate (Figura 6)

Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2

(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2

rămacircne aproximativ constantă)

Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea

comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea

comparativă a mai multor variabile

Figura 7 Grafic calitativ cu bare

51

Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo

Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două

posibilităţi reprezentate grafic este mai frecventă (Figura 8)

Figura 8 Reprezentare tip bdquopierdquo

Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli

sau a oricărui element comparativ Se foloseşte de epidemiologi

Rezultate

Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare

Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o

manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu

explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția

bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la

ilustraţii tabele grafice

Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi

nici rezultatele care invalidează eventual ipoteza

Discuţii

Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd

cultura ştiinţifică şi inteligenţa autorilor

Acest capitol răspunde la trei obiective

Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia

calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de

selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează

rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv

52

este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn

care a fost abordată problema fără a face o revistă a literaturii

Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea

rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul

Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor

afirmaţii nesusţinute de conţinutul lucrării

Concluzii

Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate

să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie

Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de

concluzii va scădea valoarea lucrării

Bibliografia (lista referinţelor citarea icircn text)

Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn

lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente

Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli

- să conţină cele mai importante şi recente lucrări

- să includă numai lucrări publicate

- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate

Bibliografie

Elisabeta Jaba ndash Statistică Ed Economică 1998

Mihai Ţarcă ndash Statistică volI Ed UAIC 1979

Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale

Ed University Press 2009

Sorana Daniela Bolboacă ndash Metodologia cercetării curs

53

Page 6: cercetarea medicala - metodologie

2 Tipul de studiu Cititorul trebuie să recunoască planul de studiul pentru a verifica dacă tipul de studiu este

adaptat icircntrebării puse Va merge progresiv cu urmărirea de la raportul de caz-seria de cazuri la studiul

transversal studiul caz-control studiul de cohortă şi trialul controlat

3 Factorii studiaţi (variabila independentă) pot fi factori de expunere sau de intervenţie Cititorul trebuie să

poată recunoaşte factorul să aprecieze cum a fost măsurat dacă s-a folosit aceeaşi metodă de măsurare pentru

loturile icircn studiu ce metodă de comparaţie s-a folosit dacă sunt erori (factor de confuzie)

4 Criteriul de raţionament este evenimentul sau situaţia presupusă a fi rezultatul factorului studiat boala

decesul supravieţuirea complicaţiile etc Definirea precisă şi metoda de măsurare a rezultatului expunerii va

permite cititorului să aprecieze validitatea informaţiilor

5 Populaţia studiată (eşantionul) Se va urmări dacă este definită populaţia de referinţă şi populaţia de

studiat analizacircndu-se corectitudinea selecţiei randomizarea proporţia de subiecţi la sfacircrşitul studiului

validitatea externă a rezultatelor

6 Analiza datelor Cititorul trebuie să aprecieze dacă s-au examinat toate erorile inclusiv factorul de confuzie

dacă nu validitatea studiului ar putea fi compromisă

7 Rezultatele Principalele aspecte pe care cititorul le va urmări la acest capitol sunt dacă ele se datoresc

numai şansei dacă s-a făcut calculul statistic dacă s-a apreciat relaţia expunere-efect (RR OR RA) dacă a

fost apreciată semnificaţia clinică sau biologică care nu este identică cu semnificaţia statistică

8 Sinteza lecturii critice analizează concluziile autorilor dacă ele răspund icircntrebărilor formulate la icircnceputul

studiului dacă rezultatele sunt aplicabile la populaţia studiată dacă rezultatele sunt acceptabile pentru practica

proprie a cititorului dacă rezultatele justifică vreo schimbare icircn practica clinică respectiv vor ameliora starea

pacienţilor Această abordare cere cititorului cunoaşterea noţiunilor de bază icircn metodologia cercetării

ştiinţifice fiind vorba icircn acelaşi timp şi de un demers clinic

c) A treia etapă icircn cercetarea bibliografică constă icircn combinarea datelor din mai multe studii referitoare la

acelaşi subiect şi care se realizează prin meta-analiză Tehnica meta-analizei permite să se sporească

eficacitatea testării ipotezelor să crească forţa statistică a rezultatelor şi să se obţină informaţii care nu pot fi

convenabil extrase din fiecare cercetare

Definirea fenomenului

Definirea fenomenului se bazează pe

bull Cunoaşterea prealabilă a problemei prin documentare riguroasă documentare care poate justifica pertinenţa

temei propuse (revista literaturii de specialitate)

Icircn prima etapă se cercetează bibliografia propriu-zisă adică se identifică publicaţiile care se referă la subiectul

icircn discuţie apoi se vor selecta publicaţiile necesare studiului apreciind validitatea lor (problemele de

documentare bibliografică vor constitui un capitol separat)

bull Formularea unei ipoteze ştiinţifice sub-etapă care reprezintă fondul problemei

6

Ipoteza este o afirmaţie (nu o icircntrebare) despre o posibilă relaţie icircntre factorii studiaţi şi criteriile de

raţionament Ipoteza poate fi ipoteză ldquonulărdquo - nu există această relaţie şi ldquoalternativărdquo - există relaţia Ipoteza

va trebui apoi dovedită sau respinsă testul statistic calculează probabilitatea conform căreia asociaţia observată

este reală sau ea survine din icircntacircmplare

bull Motivarea organizării studiului Trebuie făcută o motivare corectă legată de inexistenţa unor studii

referitoare la problema pe care o va dezbate studiul

Formularea temei de studiu

Pentru formularea temei de studiu trebuiesc menţionate obiectivul sau obiectivele şi tipul de studiu ales pentru

cercetarea respectivă Există icircn general patru tipuri de obiective

bull obiective care se referă la evoluţia şi prognosticul unei icircmbolnăviri obiective prin care se icircncearcă

icircnţelegerea şi cunoaşterea unor evenimente ce pot să apară la un pacient pe parcursul bolii

bull obiective care se referă la etiologia bolii (cauze de natură bacteriană virală parazitară) sau la cauzalitate

(relaţia factor de risc-boală)

bull obiective legate de performanţa unor teste de diagnostic sau de screening de evaluare a strategiei de

diagnostic sau de interpretare a unui test

bull obiective care se referă la impactul unei intervenţii evaluarea unei intervenţii terapeutice de depistare a unor

boli de prevenţie de educare pentru sănătate

Obiectivele unui studiu se icircmpart icircn obiectivul major unul din cele patru enumerate şi obiective

secundare care pot aborda şi alte fenomene biologice decacirct cel major cu condiţia să nu altereze realizarea

acestuia Alegerea tipului de studiu este stracircns legată de obiectivul ales Dacă obiectivul este descrierea

distribuţiei caracteristicilor unei populaţii aprecierea frecvenţei unui fenomen de sănătate analiza acelui

fenomen icircn funcţie de timp loc persoană se va alege un studiu epidemiologic descriptiv studiu care nu are o

ipoteză fixată anterior O ipoteză se poate formula ca rezultat al studiului descriptiv dar nu se va face

verificarea ei icircn cadrul studiului Dacă intenţia studiului este de a emite o judecată asupra unei posibile relaţii

icircntre factorii studiaţi atunci problema de cercetat este fundamentată de o ipoteză care trebuie verificată

dovedită iar studiul care realizează acest lucru respectiv limitele studiilor utilizate

Aspectele manageriale

Aspectele manageriale includ

bull justificarea bugetului estimarea sumei necesară realizării studiului și apreciarea durate studiului

bull defalcarea bugetului pe necesități legate de achziționare de aparatură reactanți truse etc pentru personal

(munca depusă pregătire deplasări icircn teren participări la congrese sau conferințe documentare) materiale

consumabile etc

7

32 Elaborarea proiectului

Protocolul de cercetare este un document care emite obiectivul și ipoteza studiului definește condițiile de

desfășurare și realizare a viitorului studiu clinic Elaborarea protocolului este importantă pentru cercetătorii

participanţi la studiu comisiile de etică şi finanţatori

Protocolul include mai multe formulare care trebuie să cuprindă

a) Titlul proiectului

b) Sumarul proiectului

c) Descrierea proiectului

d) Normele deontologice de cercetare

e) Modalitățile de diseminarea și valorificarea rezultatelor

f) Perspective de continuare a cercetării

g) Anexe

Prezentarea proiectului va include următoarele fișiere

bull resursele umane (membrii echipei afilierea acestora)

bull relevanța temei pentru dezvoltarea cunoașterii icircn domeniu

bull stadiul actual al cunoașterii și bibliografia aferentă

bull justificarea studiului

bull enunțarea obiectivelor și ipoteza de lucru

bull metodologia propriu-zisă

Referitor la metodologia utilizată vor trebui menționate

bull factorulfactorii studiați care reprezintă variabila independentă respectiv dacă este cazul modalitățile de

măsurare

bull criteriile de raționament- variabila dependentă (situația sau evenimentul ce se presupune a fi rezultatul

factorului studiat cum ar fi boala handicapul complicații decesul)

bull tipul de studiu care se va aplica icircmpreună cu design-ul acestuia

bull eșantioanele de lucru și modalitățile de eșantionaj

bull metodele de culegere și de prelucrare a datelor

bull planificarea activităților

bull structura bugetului fiind eligibile următoarele categorii de cheltuieli de capital (echipamente software

upgrading) pentru personal (full sau part-time instruire asigurări de sănătate) de informare (documentare

abonamente) mobilități (vizite la alte unități de cercetare participări la

congrese) materiale consumabile (truse reactanți papetărie) valorificare a rezultatelor (lucrări științifice de

etapă sau lucrarea finală) cheltuieli indirecte (de regie)

bull modalităţile de valorificare a rezultatelor

bull legături de alte proiecte

8

Protocolul mai conține anexe curriculum vitae al investigatorului principal și al coinvestigatorilor

calendarul activităților avizul Comisiei de etică documente speciale și

consimțămacircntul informat icircn cazul studiilor pe subiecți umani

Icircnainte de implementare protocolul va fi verificat de experți pentru eligibilitate (dacă sunt icircndeplinite

condițiile de acceptare finanțare) calitate și pertinență icircn sensul că protocolul trebuie să fie clar exprimat

corect icircntocmit bine așezat și cu repercursiuni favorabile pentru viitor

33 Culegerea informaţiei

Pentru a realiza o cercetare medicală culegerea datelor este prima etapă şi realizează icircn funcţie de

obiectivele propuse tipul studiului timpul disponibil şi resurse umane şi financiare

Există două mari posibilităţi de culegere

bull Icircn funcţie de elementele studiate

o Culegerea exaustivă Toţi subiecţii populaţiei pe care dorim să o studiem Greu de realizat din cauza

costurilor foarte mari sau a alterării populaţiei de studiu

o Prin eşantionare Este metoda folosită icircn studii medicale

bull Icircn funcţie de durata culegerii

o Transversală Se studiază un grup la un moment dat

o Longitudinală Extinsă in timp

- Retrospectivă ndash icircnregistrări medicale

- Prospectivă ndash date culese la intervale prestabilite de timp

Populaţia ţintă

Este orice colectivitate icircntreagă de oameni animale plante sau obiecte de la care putem colecta date Populaţia

ţintă este icircntregul grup care ne interesează pe care dorim să-l descriem sau să tragem concluzii despre el

Pentru a putea realiza generalizări spre populaţia ţintă deseori suntem obligaţi să folosim un eşantion (selecţie)

care icircnsă trebuie să fie reprezentativ pentru populaţia pe care vrem să o studiem Pentru fiecare populaţie de

studiu sunt posibile mai multe eşantioane Pe baza acestor eşantioane se calculează un estimator Pe baza

acestui estimator calculat care poate fi medie aritmetică procent etc se pot trage concluzii despre icircntreaga

populaţie Este foarte important ca investigatorul să definească foarte atent şi complet populaţia icircnainte de a

realiza eşantionul inclusiv descrierea criteriilor de includere şi excludere icircn populaţia de studiu

Eşantionul

Un eşantion este practic un grup de elemente selectate dintr-un grup mai extins (populaţia ţintă) Studiind

eşantionul selectat se pot trage concluzii despre grupul de unde a fost ales (populaţia ţintă)

Este icircn general ales pentru studiu pentru că

bull Populaţia ţintă este prea mare şi nu poate fi studiată ca icircntreg

bull Nu avem acces din diverse motive decacirct la parte din populaţia de studiu

9

bull Un studiu pe icircntreaga populaţie poate distruge populaţia

bull Eşantioanele pot fi studiate mai rapid

bull Costul şi resursele necesare studiului sunt mai reduse

Numărul elementelor dintr-un eşantion se numeşte talia sau volumul selecţiei

Acesta fiind icircn general mai mic decacirct icircntreaga populaţie poate fi observat icircn detaliu iar dacă este reprezentativ

se pot afla prin intermediul său proprietăţile populaţiei ţintă

Eşantionul trebuie să fie reprezentativ pentru populaţia generală De aceea dintre metodele de eşantionare se

folosesc tehnicile de randomizare Trebuie să satisfacă două condiţii principale

bull condiţie de ordin cantitativ talia să fie suficient de mare

bull condiţie de ordin calitativ trebuie extras aleator din populaţia ţintă

Metode de eşantionare

Putem vorbi icircn linii mari de două posibilităţi de eşantionare prin metode probabilistice şi prin metode

nonprobabilistice

Eşantionarea probabilistică este metoda cea mai folosită icircn studiile medicale fiind şi cea indicată pentru a

realiza reprezentativitatea calitativă

Icircn medicină se folosesc patru tipuri de eşantionări

1 Simplu randomizat

2 Sistematic

3 Stratificat

4 Cluster (icircn cuiburi)

1 Eşantionul simplu randomizat Fiecare element din populaţia ţintă are o şansă egală non zero de a fi

inclus icircn eşantion Se ia la icircntacircmplare un număr de elemente egal cu talia eşantionului Dezavantajul acestui tip

de eşantionare este că presupune cunoaşterea icircntregii populaţii ţintă

2 Eşantionul sistematic După aflarea taliei eşantionului şi a populaţiei ţintă se calculează factorul de

eşantionare k icircmpărţind talia populaţiei ţintă la volumul eşantionului Apoi fiecare al k-lea element este

selectat spre includere

Acelaşi mare dezavantaj apare şi icircn acest caz fiind obligatorie cunoaşterea icircntregii populaţii de studiu

3 Eşantionul stratificat Există icircn cele mai multe cazuri probleme medicale care studiindu-se pe eşantion

prezintă variabilităţi icircn funcţie de caracteristicile populaţiei (sex vacircrstă nivel de pregătire etc) Icircn acest caz

este obligatorie realizarea similitudinii demografice a eşantionului cu populaţia de studiu Din date provenite

de la Centrul de Statistică putem dezvolta ca procente o structură a populaţiei Această structură trebuie să se

regăsească (procentual) şi icircntre membrii eşantionului O importantă şansă ca reprezentativitatea calitativă să fie

corectă este conferită de respectarea

acestei similitudini demografice

10

4 Eşantionul bdquoclusterrdquo sau icircn cuiburi Icircn cazul unui studiu amplu cu scop de a investiga populaţia unei

icircntregi ţări sau regiuni putem ajunge icircn imposibilitatea de a alege şi mai ales investiga indivizi răspacircndiţi prin

icircntreaga zonă Din acest motiv se desemnează la icircntacircmplare un număr calculabil de

grupuri populaţionale extinse icircn toată zona de studiu Aceste grupuri poartă numele de bdquocuiburirdquo La nivelul

fiecărui bdquocuibrdquo se aplică o tehnică precedentă de selecţie a cazurilor Se poate sau de cele mai multe ori se face

la nivel de bdquocuibrdquo stratificarea iar apoi selecţia propriu-zisă se realizează sistematic sau simplu randomizat

Este metoda de eşantionare cel mai frecvent utilizată icircn cercetarea medicală de amploare Pentru ca eventualele

erori să nu se poată strecura s-a definit şi un indice DEF (design effect) cu care trebuie multiplicată talia

selecţiei care pentru eşantionarea icircn bdquocuiburirdquo este egal cu 2 astfel putem obţine şi o reprezentativitate

calitativă dar şi una cantitativă

Eşantionarea nonprobabilistică este o metodă neindicată icircn studiile medicale datorită lipsei de forţă icircn ceea ce

priveşte posibilitatea de aplicare a concluziilor asupra populaţiei de studiu

Se definesc şi icircn acest caz patru metode

1 Eşantion de convenienţă Membrii unui astfel de eşantion sunt aleşi numai pentru că sunt la icircndemacircnă

disponibili de a răspunde le un eventual chestionar

2 Eşantion pe cote Similar cu tipul de eşantion stratificat se referă la faptul că selecţia se face formacircnd

eşantionul din primele 30 de persoane care respectă un criteriu impus

3 Eşantion cu un scop Elementele incluse icircn eşantion sunt alese după un criteriu care exclude din start marea

majoritate a populaţiei

4 Eşantion raţional Selecţia se face prin prisma unui raţionament al celui care conduce studiul

Parametru şi estimator

Parametrul este o valoare de obicei necunoscută (şi care trebuie să fie estimată prin studiu) folosită pentru a

reprezenta o anumită caracteristică a populaţiei de studiu De exemplu media populaţiei (icircnălţime) este un

parametru populaţional Raportat la o populaţie parametrul este o valoare fixă şi exactă care nu variază

Fiecare eşantion extras din populaţie va indica o valoare a mediei care nu poate decacirct să estimeze parametrul

Icircn general parametrii sunt notaţi cu litere greceşti (ex Media = μ)

Estimatorul este o valoare calculată dintr-un eşantion studiat Este folosit pentru a putea aprecia parametrul

populaţional pe care icircn căutăm Este de asemenea posibil ca dintr-o populaţie să formăm mai multe eşantioane

mediile lor de cele mai multe ori nefiind identice icircntre ele şi nici identice cu media populaţiei Estimatorii

sunt notaţi cu litere latine (ex Media = μ)

Dacă valoarea mediei calculată pe eşantion este de exemplu 168 cm atunci putem estima ca valoarea mediei

icircn populaţie este 168 cm

11

Tipuri de culegere a datelor

1 Culegere de tip eşantion reprezentativ Grupul de indivizi incluşi icircn studiu sunt reprezentativi (calitativ şi

cantitativ) pentru populaţia generală Poate fi utilizat pentru studii descriptive (cel mai frecvent) dar uneori şi

pentru studii analitice

Este necesar pentru acest tip de culegere a datelor ca iniţial să fie cunoscută talia eşantionului (calculabilă icircn

funcţie de prevalenţă şi precizie) Pentru evaluarea datelor culese se utilizează tabelul de contingenţă 2 x 2

astfel (Figura 1)

Figura 1 - Tabelul de contingenţă 2 x 2

Unde

a ndash persoane expuse unui factor de risc care au boala studiată

b ndash persoane expuse unui factor de risc care nu au boala studiată

c - persoane neexpuse unui factor de risc care au boala studiată

d - persoane neexpuse unui factor de risc care nu au boala studiată

După aranjarea datelor icircn tabelul de contingenţă (2 x 2) se poate icircncepe analiza statistică a datelor atacirct ca

procente calculabile cacirct şi din punct de vedere a aplicării de teste statistice pentru elucidarea semnificaţiei

statistice

Este posibilă din acest tip de culegere de date calcularea

1 Prevalenţei unei boli

2 Frecvenţei expunerii

3 Gradul de asociere icircntre factorul eventual de risc şi boala

2 Culegerea de tip expus ndash neexpus Icircmparte subiecţii icircn două categorii expuşi sau neexpuşi factorului de risc

studiat Ca evoluţie următoare a studiului după o astfel de culegere a datelor se poate evalua icircn timp apariţia

icircmbolnăvirii despre care se efectuează studiul Icircn timp longitudinal prospectiv se poate calcula dacă factorul

studiat reprezintă un risc de icircmbolnăvire este indiferent sau chiar este cu efect protectiv Numărul subiecţilor

din cele două grupuri poate fi egal sau poate fi diferit Numărul acestora poate fi calculat icircn vederea obţinerii

unei bune reprezentativităţi cu ajutorul formulelor de selecţie Avacircnd icircn vedere calitatea longitudinală a

12

studiului este important ca numărul ales să fie mai mare pentru a putea suplinii eventualele pierderi din

urmărire Practic rezultatele sunt introduse icircn tabelul 2 x 2 de unde se pot calcula indicatorii doriţi (Figura 2)

Avacircnd icircn vedere modul de culegere a datelor este permisă calcularea de indicatori numai pe orizontală

orice comparare icircntre coloana dreaptă şi stacircngă fiind incorectă Avantajul acestui tip de culegere a datelor ar fi

eventualul număr mai redus de subiecţi dar dezavantajul major este cel al costurilor de urmărire icircn timp dar

trebuie luată icircn calcul şi pierderea de subiecţi din evidenţe Factorul controlat este deci prezenţa expunerii iar

factorul aleator este prezenţa bolii

Figura 2 Tabelul de contingenţă pentru tipul de culegere expus ndash neexpus

4 Culegerea de tip caz ndash martor Icircn acest caz ceea ce ghidează colectarea datelor este prezenţa sau absenţa

bolii icircn momentul prezent Se vor culege date de la două loturi constituite după criteriul de bolnav B+ şi de fără

boală B+ Datele culese sunt icircn trecut deci caracterul datelor va fi retrospectiv Icircn acest caz factorul controlat

este boala factorul aleator fiind expunerea (Figura 3)

Calculul de indicatori icircn acest caz se va putea efectua numai icircntre coloane orice calcul icircntre valorile de pe linii

fiind greşit Rezultate semnificative se pot obţine icircn acest caz utilizacircnd loturi mai mici de studiu prin

comparaţie cu tipul eşantion reprezentativ permiţacircnd icircn acelaşi timp studiul bolilor rare (cu prevalenţă mică)

Figura 3 Tabelul de contingenţă pentru tipul de culegere caz ndash martor

Metode de culegere a datelor

Metoda aleasă pentru culegerea datelor trebuie să fie aleasă după un atent studiu bibliografic icircn vederea

stabilirii celui mai eficient mod de a răspunde temei de studiu

Metodele de culegere trebuie să fie bine aplicabile şi consistente ca aport informaţional necesar

13

1 Fiziologice Sunt colectate date despre anumite caracteristici fiziologice ale pacienţilor (TA glicemie

colesterol etc) Această metodă aduce rezultate obiective cacirct timp instrumentul de evaluare este bine calibrat

şi prezintă variaţii mici

2 Metode observaţionale Instrumentul de culegere a datelor trebuie să fie sincronizat cu protocolul conceput

de cercetător Datele culese trebuie să fie de asemenea consistente adică să fie colectate de aceeaşi manieră

conducătorul studiului trebuind să instruiască investigatorii (colectorii de date) Icircnregistrarea datelor trebuie să

fie de asemenea sistematică şi bine standardizată Observaţii de control trebuie icircn mod obligatoriu făcute

pentru a putea aprecia icircn mod corect orice deviere datorată unor factorii externi Este obligatorie luarea icircn

consideraţie a aspectelor etice

3 Interviul Poate fi structurat cu un set specific de icircntrebări sau nestructurat cu o temă generală cu care se

icircncepe interviul Interviurile pot fi icircnregistrate sau intervievatorul poate nota pur şi simplu răspunsurile Există

două tipuri generice de interviu interviul de profunzime care se referă la o discuţie icircn general structurată cu

un număr de icircntrebări prestabilite icircn icircncăperea de studiu fiind doară intervievatorul şi persoana chestionată şi

interviul de grup unde prin conversaţii pornind de la temă generală expusă şi condusă de intervievator se

obţin date despre subiecţii participanţi la studiu Ambele metode de interviu au indicaţiile lor precise Un

interviu pe teme intime nu va putea fi corect icircn ceea ce priveşte datele colectate dacă se aplică un interviu de

grup

4 Chestionarul Document scris adresat unor persoane pentru a răspunde la una sau mai multe icircntrebări

Trebuie să aducă răspunsurile la icircntrebările care motivează studiul constituind ansamblul icircntrebărilor destinate

culegerii de informaţii (date) Redactarea chestionarului trebuie să ţină cont de structura acestuia introducere

conţinut exprimarea icircntrebărilor grafica chestionarului

5 Icircnregistrări preexistente

Icircn cercetarea medicală sunt cel mai frecvent utilizate Informaţiile dorite sunt deja existente ceea ce icirci revine

cercetătorului este ca să structureze datele icircn funcţie de scopul studiului pe care icircn conduce Aceste surse sunt

bull Foi de observaţie

bull Registre de consultaţie

bull Buletine de analize

bull Registre de operaţii

Icircn cazul icircn care nici o metodă de culegere a datelor nu este pe placul celui ce conduce studiul există

posibilitatea de a construi un instrument nou de culegere a datelor

Acest proces trebuie să urmărească nişte paşi obligatorii fiind mare consumator de timp

bull Definirea structurii cu care se va face măsurarea

bull Formularea itemilor de măsură

bull Analiza validităţii instrumentului de măsură ndash măsoară acesta fenomenul corect

bull Elaborarea de instrucţiuni de utilizare pentru investigatori

14

bull Pretestarea instrumentului

bull Aprecierea validităţii interne şi externe a datelor culese

Instrumente de cercetare

Formularea clară a temei de cercetare necesită o foarte bună definire a factorilor studiaţi şi a criteriilor de

judecată Acestea din urmă sunt ultimele care vor trebui definite icircn cadrul protocolului de studiu

Alegerea unui instrument de măsură

Nu există un instrument de măsură perfect sau universal corect Alegerea sa dintre cele existente şi cele deja

utilizate depind de trei factori

bull Obiectivul studiului

bull Boala studiată

bull Populaţia icircn studiu

De aceste trei elemente trebuie ţinut cont icircn fiecare etapă a dezvoltării instrumentului

Definirea obiectivului

Studiu transversal Dacă se doreşte studierea unui simptom sau a unei caracteristici ale populaţiei se poate

icircmpărţi populaţia de studiu icircn mai multe grupuri Este practic vorba de a determina diferenţele dintre subiecţi

icircn cea ce priveşte o variabilă necesară studiată printr-un studiu transversal (utilizarea dozării de Ac HBS

pentru a evalua progresele bolnavilor de hepatită tip B)

Studiu longitudinal Icircn acest caz nu se poate icircmpărţii populaţia de studiu icircn mai multe grupuri datele obţinute

fiind de la acelaşi subiect colectate după un interval de timp

Icircn funcţie de boală şi populaţie se aleg şi instrumentele de măsură cele mai adecvate

Instrumentele cercetării reprezintă un mecanism specific sau o strategie pe care cercetătorul o utilizează pentru

colectarea prelucrarea şi inferenţa datelor Aceste instrumente sunt

1 Studiul icircn bibliotecă

2 Computerul

3 Determinările experimentale

4 Statistica

5 Mintea umană

6 Facilităţi de limbaj şi comunicare

Determinările experimentale

Măsurarea constă icircn aprecierea şi cuantificarea fenomenelor calitativ sau cantitativ Interpretarea

datelor se referă la transformarea lor icircn unităţi de descoperire a unor fenomene mai puţin cercetate

Standardele acceptate se referă la norme medii distribuţii etc Tot icircn cadrul interpretării datelor datele

obţinute sunt caracterizate pe scale de valori nominal ordinal de interval sau de raport

Validarea şi reproductibilitatea măsurătorilor sunt aspecte importante şi foarte necesare pentru o

cercetare corect fundamentată care doreşte obţinerea unor concluzii pertinente

15

Statistica Este implicată icircn condensarea şi procesarea unui volum mai mare de date astfel icircncacirct să se poată

interpreta corect valorile obţinute şi să se permită comparările Utilizarea unor teste statistice specifice permite

determinarea semnificaţiei (diferenţei) statistice astfel icircncacirct estimatorii să poată fi aplicaţi la populaţia

generală Furnizează informaţii şi privind corelarea sau relaţionarea icircntre date

Mintea umană este cea care reuşeşte să integreze şi să icircnţeleagă rezultatele obţinute Semnificaţia ştiinţifică

este stabilită icircn funcţie de rezultatele statisticii de mintea umană conform afirmaţiei bdquosemnificaţia ştiinţifică

nu este egală cu semnificaţia statisticărdquo Metodele aplicate pentru a putea ajunge la o concluzie pertinentă sunt

logica deductivă raţionamentul inductiv şi gacircndirea critică

Limbaj şi comunicare Exprimarea orală sau icircn scris permite nuanţarea unor aspecte seci cifrice ale unor

studii Icircn acest mod devine mai evidentă semnificaţia ştiinţifică a unor rezultate statistice

34 Prelucrarea datelor

Instrumentele de prelucrare

Statistica este o ştiinţă ramură a matematicii care studiază evoluţia fenomenelor şi proceselor

colective pe baza observării lor ştiinţifice a culegerii şi prelucrării detaliate a informaţiilor statistice cu scopul

de a formula şi explica legile legităţile şi regularităţile ce le guvernează

Statistica permite deci aprecierea unor parametrii populaţionali prin studiul unui număr redus de

elemente ale populaţiei icircn studiu (ţintă) O populaţie poate fi definită printr-un şir de valori care pot fi grupate

icircn funcţie de parametrul studiat (glicemie colesterol TAD TAS etc) Pentru fiecare astfel de şir se defineşte

o variabilă (care va purta nume propriu glicemie colesterol etc) Practic variabila este considerată o funcţie

ia valori posibil diferite de la un element la altul icircn funcţie de caracteristicile proprii acestora Sunt clasificate

icircn două grupe variabile cantitative (caracteristică măsurabilă) şi calitative (caracteristică ce nu poate fi

măsurată)

La racircndul lor variabilele calitative pot fi

bull Nominale ndash grupuri de elemente ce nu pot fi ordonate (culoarea părului)

bull Nominale ordonate ndash concluziile pot fi grupate (eficienţa unui tratament slabă bună foarte bună)

bull Binare ndash apar numai două posibilităţi (bolnav sănătos)

Variabilele cantitative pot fi

bull Continue ndash o variabilă măsurabilă care poate lua o infinitate de valori

bull Discrete ndash variabile care nu pot lua decacirct valori icircntregi

Statistica descriptivă

Există două ramuri ale statisticii statistica descriptivă şi statistica inferenţială

Statistica descriptivă (după cum rezultă din denumire) se ocupă cu descrierea unor valori obţinute ale unei

variabile studiate

16

Valorile pe care variabila le ia se constituie icircntr-o serie statistică Indicatorii care definesc o variabilă (serie)

sunt

1 Ale tendinţei centrale

Media aritmetică - notată de regulă cu

Mediana - este acea valoare din şirul de date care icircmparte icircn două părţi egale şirul ordonat de valori (atenţie

şirul este ordonat crescător) situacircndu-se la mijlocul seriei statistice

Dacă numărul de valori n este un număr impar atunci mediana este valoarea unde

Dacă n este par deci avem un număr par de valori mediana este definitatilde ca fiind

unde k = n2

Modul - constituie valoarea care apare cel mai des deci valoarea cu numărul cel mai mare de apariţii

2 De dispersie

Amplitudinea - este diferenţa dintre valoarea maximă şi cea minimă

A = Amax - Amin

Amplitudinea relativă - notată A este raportul dintre amplitudinea absolută şi media aritmetică a seriei de

date

Varianţa notată este un indicator de icircmprăştiere a datelor Formula de calcul este

Abaterea standard (S) sau deviaţia standard reprezintă rădăcina pătrată din varianţă (dispersie)

Coeficientul de variaţie se calculează ca un raport procentual icircntre abaterea standard şi valoarea medie a şirului

de valori

Eroarea standard intervine icircn estimarea intervalelor de confidenţă Se calculează astfel

17

3 De asimetrie (skewness) indică distribuţia datelor dacă sunt sau nu distribuite normal

4 De boltire (kurtosis) estimează boltirea sau aplatizarea curbei de distribuţie

Prezentarea descriptivă a datelor se face prin icircnregistrarea datelor culese icircn tabele care să reprezinte icircn mod

sintetic valorile măsurate

Icircn concluzie statistica descriptivă permite

bull Stabilirea comparabilităţii icircntre grupurile de studiu şi aprecierea prezenţei erorilor sau confuziei

bull Reprezentarea datelor icircn tabele permite evaluarea fiecărui pacient şi dacă a existat pierderi din studiu

Statistica inferenţială

Statistica inferenţială (inductivă) este partea de analiză a datelor care permite extrapolarea unei

concluzii trase pe baza unui eşantion spre populaţia ţintă pentru care a fost efectuat studiul

Scopul analizei statistice este de a evidenţia efectul unui tratament sau al unui factor de risc prin date obţinute

din eşantionul studiat spre populaţia ţintă Aceasta implică testarea ipotezelor statistice sau altfel spus testarea

semnificaţiei statistice Este una dintre cele mai importante momente ale studiului Cum rezultatele sunt

obţinute prin studiul unui eşantion există posibilitatea ca acestea să fie datorate icircntacircmplării Testele

statistice ne ajută să apreciem icircn ce măsură rezultatele sunt icircntacircmplătoare şi mai ales icircn ce măsură şi dacă se

pot aplica populaţiei generale Icircn acest scop se impune o valoare limită alfa 005 care reprezintă limita

superioară a probabilităţii ca rezultatul obţinut să fie greşit (datorat icircntacircmplării) Astfel icircn funcţie de tipul

variabilelor şi indicatorii descriptivi aplicaţi şi evaluaţi se aplică teste de semnificaţie statistică (Tabelul 1)

Tabelul 1 Alegerea testelor de semnificaţie statistică

Tipul datelor

18

Diferenţierea variabilelor din punctul de vedere a distribuţiei se face folosind testul de normalitate

Kolmogorov ndash Smirnov

Testul statistic reprezintă metoda de comparaţie a două sau mai multe populaţii prin intermediul unor

variabile observate ale lor

Scopul unui test statistic este de a defini realitatea

Definirea icircntrebării de cercetare (ipoteza clinică)

Tratamentul cu Nebivolol este la fel de eficient ca şi cel cu Valsartan icircn tratamentul

hipertensiunii arteriale

Transpunerea icircntrebării de cercetare icircn termeni statistici (ipoteza statistică)

Media tensiunii arteriale a pacienţilor trataţi cu Valsartan nu diferă semnificativ de media

tensiunii arteriale a pacienţilor trataţi cu Nebivolol

Etapele unui test statistic

1 Formularea problemei icircn termenii ipotezelor statistice

2 Alegerea şi calcularea parametrului statistic al testului

3 Regiunea critică

4 Concluzia testului

1 Formularea problemei icircn termenii ipotezelor statistice

Ipoteza nulă ipoteza care trebuie testată testul efectuacircndu-se sub prezumţia că ipoteza nulă ar

fi adevărată

Ipoteza alternativă acea ipoteză care icircntr-un sens sau altul contrazice ipoteza nulă Această

ipoteză se mai numeşte şi ipoteza de lucru

Ipoteza nulă tipuri

O coadă (ldquoone-tailedrdquo sau ldquoone-siderdquo)

Media este mai mare

Media este mai mică

Două cozi (ldquoone-tailedrdquo sau ldquoone-siderdquo)

Media este egală

2 Alegerea şi calcularea parametrului statistic al testului

Parametrul statistic al testului exprimă icircntr-o anumită formă diferenţa dintre elementele comparate

Ţinacircnd seama de faptul că eşantionul sau eşantioanele utilizate sunt aleator extrase din populaţiile care

fac obiectul testului parametrul statistic este o variabilă aleatoare de selecţie care urmează o anumită

lege de probabilitate

Un parametru statistic al testului bun trebuie să icircndeplinească două condiţii

19

Trebuie să se comporte diferit atunci cacircnd ipoteza nulă H0 este adevărată faţă de situaţia icircn

care ipoteza alternativă H1 este adevărată

Distribuţia de probabilitate a parametrului statistic al testului sub prezumţia că H0 este

adevărată este cunoscută

3 Regiunea critică

- Trebuie să fim capabili să decidem icircn funcţie de valoarea parametrului statistic calculat care dintre

ipoteze cea nulă sau cea alternativă este adevărată

- Dacă valoarea parametrului statistic aparţine regiunii critice ipoteza nulă H0 va fi respinsă şi va fi

acceptată ipoteza alternativă H1

- Dacă valoarea parametrului statistic nu aparţine regiunii critice ipoteza nulă H0 va fi acceptată

- Decidem mărimea regiunii critice

Pentru aceasta trebuie să specificăm mărimea riscului de eroare pe care icircl acceptăm

Pe scurt definim nivelul de semnificaţie notat cu a sau mărimea riscului pe care

suntem dispuşi să ni-l asumăm icircn respingerea ipotezei nule H0 icircn cazul icircn care aceasta

este adevărată De obicei se alege un nivel de semnificaţie icircntre 1 şi 5

Probabilitatea unei erori de tipul I

probabilitatea de respingere a ipotezei nule H0 icircn favoarea ipotezei alternative H1 icircn

condiţiile icircn care H0 este adevărată

probabilitatea unei erori de tipul I se notează cu a şi se mai numeşte nivel de

semnificaţie al testului

Probabilitatea unei erori de tipul II

probabilitatea acceptării ipotezei nule icircn condiţiile icircn care ipoteza alternativă H1 este

adevărată

această probabilitate se notează cu b

- Unilaterală la dreapta ndash valoarea parametrului statistic al testului este mai mare sau egală cu

valoarea din dreapta a intervalului critic

- Unilaterală la stacircnga ndash valoarea parametrului statistic al testului este mai mică sau egală cu

valoarea din stacircnga a intervalului critic

- Bilaterală ndash valoarea parametrului statistic al testului este mai mică sau egală cu valoarea extremă

din stacircnga regiunii critice sau mai mare sau egală cu valoarea extremă din dreapta regiunii critice

valorile extreme ale regiunii critice avacircnd nivele egale de semnificaţie

4 Concluzia testului

- Ipoteza nulă H0 este respinsă dacă valoarea parametrului statistic aparţine regiunii critice

20

- Regiunea critică trebuie astfel aleasă icircncacirct dacă ipoteza alternativă H1 este adevărată

probabilitatea de respingere a ipotezei nule H0 este mai mare decacirct icircn cazul icircn care ipoteza nulă H0

ar fi adevărată

- Acceptarea ipotezei nule H0 atunci cacircnd ipoteza alternativă H1 este adevărată este cunoscută ca şi

eroarea de tipul II

a probabilitatea ei se notează cu b

b măsoară bdquonivelul de eroarerdquo

- Icircn testarea oricărei ipoteze statistice există patru situaţii care determină dacă decizia noastră este

corectă sau nu

Cazuri

H0 este adevărată H0 este falsă

Concluzie H0 se acceptă decizie corectă eroare de tipul

II

H0 se

respinge

eroare de tipul I decizie corectă

Luarea deciziei pe baza valorii probabilităţii p de semnificaţie a testului

Icircn momentul icircn care prelucrăm statistic o serie de date dorim să ştim dacă rezultatele obţinute sunt sau

nu semnificative statistic

Răspunsul la această icircntrebare este dat de valoarea lui p calculată de orice program statistic la

prelucrarea unor date

Icircn cazul testelor statistice ipoteza nulă este respinsă dacă nivelul de semnificaţie este mai mic decacirct

005 iar programele de prelucrare statistică a datelor vor afişa o steluţă () icircn tabelul rezultatelor

21

Dacă p le 005 respingem ipoteza nulă şi acceptăm ipoteza alternativă (am obţinut semnificaţia

statistică)

Dacă p gt 005 acceptăm ipoteza nulă (nu am obţinut semnificaţia statistică)

p = 013

NU respingem ipoteza nulă

Risc de eroare de tip II

α = 005

p = 002

Respingem ipoteza nulă

Risc de eroare de tip I

Semnificaţia lui p

Criteriu de luare a deciziei cu privire la o ipoteză statistică nulă

Cuantifică şansa ca o decizie de respingere a ipotezei nule să fie greşită

Măsură a semnificaţiei statistice şi NU CLINICĂ

22

Semnificaţia lui p (reguli empirice)

001 le p lt 005 rezultatul e semnificativ statistic

0001 le p lt 001 rezultatul e icircnalt semnificativ statistic

p lt 0001 rezultatul e foarte icircnalt semnificativ statistic

p ge 005 rezultatul e considerat nesemnificativ statistic

Limite ale valorii p

Valoarea p NU ne dă informaţii despre

Şansa de beneficiu a unui pacient individual

Procentul de pacienţi care vor avea un beneficiu icircn urma instituirii procedurii medicale

Gradul de beneficiu expectat pentru un anumit pacient

Puterea unui test statistic

Este capacitatea de a detecta o diferenţă acolo unde există

Creşterea volumului eşantionului determină creşterea puterii testului statistic aplicat

Valoarea este icircn relaţie directă cu eroarea de tip II

Puterea = 1 ndash β

Cea mai utilizată modalitate de creştere a puterii unui test statistic este de a creşte volumul

eşantionului

Tipul scalei de măsură ndash testul statistic

Denumire test Interval Nominal Observaţii

Corelaţie Pearson 2 0 Există o relaţie liniară

χ2 0 2

Student 1 1 Doar 2 grupuri

ANOVA 1 1 2 sau mai multe grupuri

Student perechi 1 1 Eşantioane perechi

Măsurători repetate (ANOVA) 1 1 Mai mult de 2 grupuri date

perechi

Inferenţa statistică pe date calitativ e

Tabela de contingenţă 2times2

Riscuri şi raţii

Testul χ2 (testarea asocierii icircn tabela de contingenţă)

Testul Fisher

23

Testul z pentru proporţii

Testul McNemar

Tabela de contingenţă 2times2

Scale de tip nominal (dicotomiale tabela de contingenţă de 2times2) sau ordinal (tabela de contingenţă de

rtimesc)

Frecvenţa absolută (numărul de evenimente per categorie)

Tabela de contingenţă de 2times2 4 categorii

AP = adevărat pozitiv

FP = fals pozitiv

FN = fals negativ

AN = adevărat negativ

Ulcer deschis Ulcer vindecat Total

Recurenţă + AP = 1 FP = 5 = 1+5 = 6

Recurenţă - FN = 7 AN = 16 = 7+16 = 23

Total =1+7=8 =5+16=21 29

Riscuri şi raţii Mărimi ale asocierii

Denumire Formula Definiţie

Rata falşilor pozitivi =FP(FP+AN) Probabilitatea unui test fals + (α)

Rata falşilor negativi =FN(FN+AP) Probabilitatea unui test fals ndash (β)

Sensibilitate =AP(AP+FN) Probabilitatea unui test real + (1- β)

Specificitate =AN(AN+FP) Probabilitatea unui test real ndash (1- α)

Acurateţe =(AP+AN)n Probabilitatea generală a unei decizii corecte

Valoarea predictivă pozitivă =AP(AP+FP) Probabilitatea ca un test pozitiv să fie corect

Valoarea predictivă negativă =AN(AN+FN) Probabilitatea ca un test negativ să fie corect

Riscul relativ =AP(FP+AN)FN(AP+FP)

Rata şansei =(AP∙AN)(FN∙FP)

Riscul atribuabil =AP(AP+FP)-FN(FN+AN)

24

Denumire Formula

Rata falşilor pozitivi = 5(5+1) = 08334

Rata falşilor negativi = 7(7+16) = 03043

Sensibilitate = 1(1+7) = 01250

Specificitate = 16(16+5) = 07619

Acurateţe = (1+16)29 = 05862

Valoarea predictivă pozitivă = 1(1+5) = 01667

Valoarea predictivă negativă = 16(16+7) = 06957

Riscul relativ = 1(5+16)7(1+5) = 2142 = 050

Rata şansei = (1∙16)(7∙5) = 04571

Riscul atribuabil = 1(1+5)-7(7+16) = 01667-03043=-01376

Testarea asocierii icircn tabela de contingenţă

Testul χ2

Nu trebuie utilizat pentru eşantioane de volum mic

Testul este valid doar dacă valoarea expectată (aşteptată) pentru fiecare celulă este cel puţin

egală cu 1 şi frecvenţa absolută observată este de minim 5

Dacă aceste condiţii nu sunt icircndeplinite se aplică testul exact al lui Fisher (Fisherrsquos Exact Test)

Indică dacă cele două variabile sunt sau nu independente DAR NU cuantifică puterea asocierii

dintre ele

Problema S-a investigat icircntr-un studiu asocierea dintre obezitatea (ca factor de risc) şi bolile

cardio-vasculare la persoanele icircn etate (gt 60 ani) Din totalul de 620 persoane investigate s-au

identificat 150 persoane cu obezitate şi boală cardio-vasculară 230 persoane fără obezitate şi

fără boală cardio-vasculară şi 60 persoane fără obezitate dar cu boală cardio-vasculară Există

o asociere icircntre obezitate şi boala cardio-vasculară (df=1 α=005 χ2critic = 384)

Testul χ2 exemplu

H025

Nu există asociere icircntre obezitate şi bolile cardio-vasculare

Obezitatea şi bolile cardio-vasculare sunt independente

H1

Există asociere icircntre obezitate şi bolile cardio-vasculare

Obezitatea şi bolile cardio-vasculare sunt asociate

a = 005 pragul de semnificaţie al testului

urmează o lege cu (r-1)(c-1) grade de libertate

χ2 = parametrul testului χ2

fio = frecvenţa observată

fit = frecvenţa teoretică

Regiunea critică este [χα2 yen)

Pentru α = 005 χα2 = 384

OBSERVAT BCV+ BCV- Total

Obezitate + AP = 150 FP = 180 330

Obezitate - FN = 60 AN = 230 290

Total 210 410 620

TEORETIC BCV+ BCV- Total

Obezitate + = 330times210620 = 330times410620 330

Obezitate - = 290times210620 = 290times410620 290

Total 210 410 620

TEORETIC BCV+ BCV- Total

Obezitate + = 330times210620 = 330times410620 330

26

Obezitate - = 290times210620 = 290times410620 290

Total 210 410 620

TEORETIC BCV+ BCV-

Obezitate + = 112 = 218

Obezitate - = 98 = 192

Deoarece 4177Icirc[384 yen) se respinge H0 cu un risc de eroare de 5

Există asociere icircntre obezitate şi bolile cardio-vasculare

Testul Fisher

Corecţie a testului χ2

Valoarea p asociată parametrului ne dă probabilitatea ca valoarea observată de independenţă să fie

atribuită doar şansei

O valoare p mică indică că există alte cauze decacirct şansa influenţează rezultatul şi astfel cele două

variabile investigate nu sunt independente

Testul Fisher = dispersia corectată a factorului x dispersia corectată a factorilor reziduali

Icircn acest context regula adunării dispersiilor se poate scrie unde

este variaţia lui y pe seama variaţiei variabilei x

este variaţia lui y pe seama influenţei factorilor reziduali (neicircnregistraţi)

este variaţia totală a caracteristicii y

Testul Fisher empiric se calculează după formula

27

se compară cu Ftab pentru nx şi nz grade de libertate la un anumit prag de semnificaţie stabilit

Dacă Fc gt Ftab rezultă că variaţia factorului de grupare x este semnificativă pentru variaţia caracteristicii y

Testul z pentru proporţii

1 Compararea unei frecvenţe observate cu o frecvenţă teoretică

2 Testarea egalităţii a două frecvenţe

Testul z Compararea unei frecvenţe observate cu o frecvenţă teoretică

Scop Investigarea semnificaţiei diferenţei icircntre o frecvenţă teoretică p (icircntr-o populaţie) şi o frecvenţă

observată f pe un eşantion reprezentativ (variabilă calitativă (binare))

Condiţii de aplicare Testul este corect aplicat dacă numărul n al observaţiilor eşantionului este

suficient de mare (n∙p n∙(1-p)gt10

Parametrul

n = volumul eşantionului

Suntem interesaţi de investigarea prevalenţei hepatitei B la personalul care lucrează icircn laboratoarele

clinicilor de boli infecţioase din Transilvania Se ştie din studii anterioare că prevalenţa hepatitei B icircn

populaţia generală din Transilvania este de 9 S-a luat icircn studiu un eşantion de 100 persoane şi s-a

obţinut o prevalenţă a hepatitei B de 6 Există diferenţă semnificativă icircntre frecvenţa hepatitei B la

personalul care lucrează icircn laboratoarele spitalelor de boli infecţioase din Transilvania faţă de

populaţia generală

f = 006 p = 009 n = 100

Ipoteza nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat

faţă de frecvenţa hepatitei B icircn populaţia generală

Ipoteza alternativă test bilateral Există diferenţă semnificativă icircntre frecvenţa hepatitei B la

nivelul eşantionului şi prevalenţa hepatitei B icircn populaţia generală

f = 006 p = 009 n = 100

Pragul de semnificaţie a = 005

Regiunea critică test bilateral (-yen -196 ]Egrave[196 yen)

28

Concluzia testului

Deoarece parametrul statistic calculat al testului nu aparţine regiunii critice se acceptă ipoteza

nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat faţă de

frecvenţa hepatitei B icircn populaţia generală

Testul McNemar

Evaluarea dependenţei variabilelor calitative perechi (dorim să determinăm dacă o anumită

caracteristică este sau nu asociată cu o anumită patologie)

Identificăm n pacienţi care prezintă patologia de interes (eg Cancer bronho-pulmonar) şi n

pacienţi cu aceleaşi caracteristici ca şi primul grup dar care nu o prezintă

Martor = da Martor = nu

Caz = da a b

Caz = nu c d

Testul McNemar - exemplu fumat vs cancer

Martor = da Martor = nu

Cancer = da a = 2 b = 5

Cancer = nu c = 0 d = 3

29

χ2critic(α=005) = 384

32 lt 384 rarr acceptăm ipoteza nulă

Fumatul nu este icircn relaţie cu apariţia cancerului bronho-pulmonar

Inferenţa statistică pe date cantitative

Variabile cantitative continue

Testul z şi Student (t) (o medie sau medii perechi)

Testul z şi Student (t) (testarea a două medii)

ANOVA (ge 3 medii)

Ranguri (variabile cantitative discrete sau cantitative care nu icircndeplinesc condiţia de

normalitate)

Testul sumei rangurilor Wilcoxon

Kruskal-Wallis (ge 3 eşantioane independente)

Friedman (ge 3 eşantioane dependente)

Teste de normalitate variabile cantitative continue

Shapiro-Wilk

Kolmogorov-Smirnov

Shapiro-Wilk

Chi-Square Goodness-of-Fit

Dacă datele urmează o distribuţie normală aplicăm un test parametric

Dacă datele nu urmează o distribuţie normală aplicăm un test de comparare al rangurilor

30

Testul Z de comparare a mediei unui eşantion cu media unei populaţii

Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ

extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie

s2 care se cunoaşte

Condiţii de aplicare

1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru

compararea mediei unui eşantion cu media unei populaţii)

2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal

distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă

3 Talia eşantionului este mare ( ge 30)

Ipoteze

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media

eşantionului şi media populaţiei

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

(-yen -196 ] Egrave [196 yen)

Parametrul testului

n = volumul eşantionului

= media eşantionului

s = deviaţia standard a populaţiei

Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)

Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard

cunoscută

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi

media standard

Condiţii de aplicare

Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se

realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această

condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea

31

Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai

puternic

Numărul de grade de libertate (df) df = n-1

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

Parametrul testului

n = volumul eşantionului

micro0 = media standard

= media eşantionului

s = deviaţia standard a eşantionului

Testul ANOVA compararea mediilor a mai multe eşantioane

H0 = toate mediile sunt egale

H1 = nu toate mediile sunt egale

Condiţii de aplicare

1 Datele sunt independente unele faţă de celelalte

2 Datele fiecărui grup sunt normal distribuite

3 Deviaţia standard este aceeaşi pentru toate grupurile

Id Medicament

A B C D E F

1 5 6 7 10 5 9

2 6 8 8 11 8 8

3 7 7 9 13 6 7

4 8 9 11 12 4 5

32

5 9 10 10 9 7 6

Suma 35 40 45 55 30 35

Media 7 8 9 11 6 7

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =

= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)

Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2

F = (suma pătratelor(icircntre))(suma pătratelor(icircn))

Suma pătratelor (icircntre) = 16times5 = 80

Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60

Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn

interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare

SP df Media pătratelor F = MPicircntreMPicircn

Icircntre 80 5 = 805 = 16 = 1625 = 64

Icircn 60 24 = 6024 = 25

Total 140 29 -

Testul sumei rangurilor Wilcoxon

Aplicat pentru

Un set de observaţii provenite dintr-o valoare ipotetică comună

Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)

Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero

Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace

Suma rangurilor pentru diferenţele negative = 2+3+1 = 6

Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30

33

Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului

egal cu 8 = 0109

Icircnainte După Diferenţa Rang

64 66 -2 2

66 58 8 5

67 68 -1 3

71 65 6 4

72 75 -3 1

76 67 9 6

78 59 19 8

89 74 15 7

Testul Kruskal-Wallis (ge 3 eşantioane independente)

Test de ranguri aplicate pe mai mult de 3 eşantioane

H = parametrul testului

n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)

Tk = suma rangurilor

Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie

pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni

34

df = k-1 (k = numărul de eşantioane)

df = 3-1 = 2

Hcritic(α=005) = 599

H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie

pozitivă şi respectiv biopsie negativă

Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie

a tipului de studiu pe eşantioane perechi)

1 Definirea numărului de tratamente k

2 Obţinerea rangurilor pentru fiecare tratament

3 Sumarea rangurilor fiecărui tratament

4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)

5 Dacă Fr gt Frcritic rarr respingem H0

Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost

măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi

n = 9 k = 3 T12 = 225 T2

2 = 38025 T32 = 38025

Frcritic = 599

Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de

prostată

35

De reţinut

Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei

Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-

of-Fit

Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z

Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t

Compararea mediilor a 3 sau mai multe eşantioane ANOVA

Compararea mediilor a două populaţii (σ) testul Z

Compararea mediilor a două eşantioane (s) testul t

Compararea mediilor a două eşantioane perechi (s) testul t

ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi

cu cel pentru compararea a două eşantioane perechi

Ranguri

Distribuţia datelor nu are importanţă

Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)

Trei sau mai multe eşantioane Kruskal-Wallis

Trei sau mai multe eşantioane perechi Friedman

Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia

Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a

datelor)

Variabile nominale

Un singur eşantion sau eşantioane perechi

Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte

Eşantioane perechi testul Mc Nemar

Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2

Icircn analiza proporţiilor există teste diferite pentru

Compararea unei frecvenţe cu o frecvenţă cunoscută

Compararea a două frecvenţe

Semnificaţia statistică

Valoarea p (p value)

Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor

două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E

posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării

aleatorii

36

Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală

urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii

Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este

probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un

experiment de dimensiunea acestuia

Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că

diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii

diferite

Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca

fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă

ar fi fost adevărată

Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă

1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe

baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De

fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001

2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie

3 Se aplică testul statistic aferent pentru a calcula valoarea p

4 Se compară valoarea p cu valoarea ndash prag

5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe

semnificativă dpdv statisticrdquo

6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e

semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să

conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă

Teste de semnificaţie

Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului

populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)

Testarea ipotezelor implică posibile erori

Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile

sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui

grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul

icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005

ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există

37

nici o diferenţă

Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ

statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de

ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost

ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau

dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă

cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă

semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe

ipotetice variate icircn cazul icircn care ele există

Măsuri ale frecvenţei

Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)

Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate

Generic formula pe care se bazează toate cele trei este

unde x şi y sunt cantităţile de comparat

Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea

unei frecvenţe pe grupe de sex vacircrstă etc

Proporţia implică icircn mod necesar ca x să fie inclus icircn y

Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară

frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp

Pentru calcularea unei rate trebuie ţinut cont de trei aspecte

bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin

bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp

bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo

Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un

tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei

populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei

aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)

38

Indicatori

Rata de incidenţă

Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă

icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii

Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o

perioadă de timp

Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de

timp x

Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei

susceptibili de a dezvolta icircmbolnăvirea studiată

Numitorul poate fi

bull Numărul mediu al populaţiei icircn perioada de timp studiată

bull Mărimea populaţiei icircn mijlocul perioadei de studiu

bull Mărimea populaţiei la icircnceputul studiului

Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă

Este obligatorie menţionarea perioadei de timp

Prevalenţa

Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la

un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă

schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa

momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)

39

Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include

numai cazuri noi respectiv include cazuri noi şi vechi

Rata de atac

Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este

folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp

raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori

Rata persoană-timp

Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din

momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte

migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost

observate

Riscul relativ (RR)

Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment

legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele

prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două

grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la

bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la

bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai

mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo

Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2

Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn

cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă

(Tabelul 1)

Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR

Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la

neexpuşi

40

Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de

culegere a datelor

Odds ratio (OR)

Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin

raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general

studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)

Tabelul 2 Tabelul 2 x 2 pentru calcularea OR

Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală

Rate de mortalitate

Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp

specificată Există mai multe tipuri de rate de mortalitate

o Mortalitate specifică pe sex

o Mortalitate specifică pe rasă

o Mortalitate specifică pe boală

o Mortalitate neonatală

o Mortalitate postneonatală

o Mortalitate infantilă

o Mortalitate maternă

Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP

41

Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de

viaţă şi vacircrsta la care survine decesul dacă este prematur

Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu

Ani de viaţă pierduţi datorat dizabilităţii

Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt

utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru

cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite

grupuri

Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de

risc şi o boală se folosesc riscul relativ şi odds ratio

35 Analiza şi interpretarea datelor

După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date

trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul

Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor

colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului

studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu

plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde

prezenţa biostatisticianului este necesară

Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu

elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat

iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului

iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate

depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori

testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere

clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza

Interpretarea rezultatelor statistice

Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne

motive (număr mic de date) acceptarea ei să fie falsă

Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine

gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia

ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument

de decizie Intervalul de confidenţă

42

Interpretarea statistica ne interpretarea clinică

Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă

Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice

obţinute pe eşantionul studiat

Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare

Ce interpretăm Rezultatele

personale obţinute icircn urma studiului

care au fost prezentate icircn secţiunea bdquoRezultaterdquo

Explicăm rezultatele obţinute

Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale

Interpretarea trebuie să se realizeze icircn

lumina limitelor studiului

contextul cultural social şi educaţional al locului unde s-a realizat cercetarea

contextul a ceea ce se cunoaşte din literatura de specialitate

Interpretăm doar rezultatele personale obţinute icircn urma studiului

Interpretarea statistică nu este tot una cu interpretarea clinică

Interpretarea statistică este importantă

Interpretarea clinică este foarte importantă

Intervalul de confidenţă

Media calculată pe baza unui eşantion nu va echivala media populaţiei

Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului

Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a

populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a

populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)

pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru

orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare

dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de

confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de

date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de

5

Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel

Dacă valoarea p este mică

Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare

aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o

medie diferită Diferenţa este semnificativă dpdv statistic

43

Icircn continuare

Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa

reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică

pentru a fi interesante din punct de vedere ştiinţific

Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC

oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care

este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a

obţine o concluzie clară

Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o

diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că

datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din

punct de vedere ştiinţific

Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul

detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat

Erorile studiilor medicale

Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura

anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară

caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea

asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri

legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias

Erorile potenţiale icircn studiile epidemiologice

1 Erori icircntacircmplătoare

2 Erori sistematice

3 Confuzia

4 Validitatea

1 Erori icircntacircmplătoare

Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a

parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel

de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot

fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii

(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor

de măsură (eroarea de măsurare)

44

2 Erori sistematice

Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate

care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu

acurateţe mare Acurateţea nu este afectată de mărimea eşantionului

Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de

experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea

dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus

şi greu de cuantificat (consum de alcool personalitate etc)

Principalele tipuri de erori din această categorie sunt

bull Biasul de selecţie

bull Biasul de informaţie

Biasul de selecţie

Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul

trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion

inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale

persoanelor incluse

Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se

ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia

Biasul de informaţie

Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de

instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze

expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere

nesemnificativă sau chiar să nu şi-o amintească de loc

3 Confuzia

Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune

prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este

cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă

de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte

important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor

protector

4 Validitatea

Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă

Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte

estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional

Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă

45

conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se

demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)

Validitatea externă se poate realiza numai dacă studiul este valid intern

Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii

studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de

studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt

laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi

validă din punct de vedere intern)

3 6 Prezentarea rezultatelor

După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite

Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor

icircntr-o formă bdquodigerabilărdquo este necesară

Scopul prezentării datelor

1 Transmiterea concluziilor studiului

a Datele corecte şi importante merită comunicate

b Datele trebuie să confirme sau să infirme ipoteza studiului

c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală

2 Acordarea posibilităţii altor cercetători să aprecieze studiul

a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti

b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor

prezentate

Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru

fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie

statistică

Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de

valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras

(Tabel 3)

Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)

46

Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct

numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor

precum şi prezentarea acestora sub formă inteligibilă

Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care

convin cercetătorului

Prezentarea datelor se poate face

1 Figuri şi tabele icircn articole scrise

2 Figuri şi tabele icircn prezentări orale

3 Figuri şi tabele icircn postere

4 Text scris sau incluse icircn text

5 Site-uri de WEB

Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor

Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie

Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele

exprimacircnd exact ceea ce acestea exprimă

Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate

anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel

să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se

acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca

mai sus sugestive sunt formatele simple şi puţin icircncărcate

Dacă nu există reguli impuse se respectă

1 Mesaj simplu fără falsificarea datelor

2 De obicei este necesar atacirct tabelul cacirct şi graficul

3 Să fie simplu şi clar

Tabele

Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile

coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică

elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de

1 Se folosesc doar linii orizontale

2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn

evidenţi prin linie de separare (Tabelul 4)

Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland

Noua Zeelandă)

(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)

47

3 Numerele sunt aliniate icircn funcţie de virgulă

4 Indicii statistici sunt explicaţi sub tabel

5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană

6 Abrevierile pot fi folosite

7 Numărul de zecimale trebuie limitat la maxim două

8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel

9 Plasarea legendei este obligatorie sub tabel

10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)

Icircn cazul prezentărilor orale sau a posterelor este indicat ca

1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării

2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte

3 Folosirea de simboluri este permisă

Clasificarea tabelelor

Tabelele se clasifică după

i) conţinut

bull cu distribuţii de frecvenţe

bull de clase de frecvenţe

bull de contingenţă

ii) structura

bull cu doua coloane

bull cu subclasificări

bull ldquomasterrdquo

Tabele ce conţin distribuţii de frecvenţe

O modalitate comodă de a prezenta o mulţime de date brute este

1 Se ordonează datele in ordine crescătoare

2 Se determine frecvenţa fiecărei valori

3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane

(Tabelul 5)

Tabelul 5 Distribuţii de frecvenţă absolută

48

Tabelul claselor de frecvenţe

1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă

2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)

Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)

Tabele de contingenţă

1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a

tabelelor de contingenţă

2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a

combinaţiilor de perechi ordonate de valori

3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre

a factor de risc si

b starea sănătăţii

4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)

5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)

Tabelul 7 Tabel de contingenţă 2 x 2

49

Grafice

Există două categorii de moduri grafice sub care se pot prezenta datele

1 Ilustraţii şi fotografii

2 Grafice

1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă

pentru lucrare

2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit

Putem vorbi despre mai multe tipuri de grafice

bull Grafice pentru reprezentarea datelor cantitative

1048707 Grafic cartezian (X Y)

1048707 Histograma

1048707 Poligonul de frecvenţe

1048707 Diagrama bdquoscatterrdquo

bull Grafice pentru reprezentarea datelor calitative

1048707 Grafic cu bare

1048707 Diagrama tip bdquoboxplotrdquo

1048707 Diagrama bdquopierdquo

1048707 Cartograma

Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi

dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)

Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)

Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie

Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)

Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)

50

Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir

de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele

două variabile studiate (Figura 6)

Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2

(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2

rămacircne aproximativ constantă)

Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea

comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea

comparativă a mai multor variabile

Figura 7 Grafic calitativ cu bare

51

Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo

Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două

posibilităţi reprezentate grafic este mai frecventă (Figura 8)

Figura 8 Reprezentare tip bdquopierdquo

Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli

sau a oricărui element comparativ Se foloseşte de epidemiologi

Rezultate

Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare

Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o

manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu

explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția

bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la

ilustraţii tabele grafice

Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi

nici rezultatele care invalidează eventual ipoteza

Discuţii

Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd

cultura ştiinţifică şi inteligenţa autorilor

Acest capitol răspunde la trei obiective

Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia

calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de

selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează

rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv

52

este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn

care a fost abordată problema fără a face o revistă a literaturii

Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea

rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul

Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor

afirmaţii nesusţinute de conţinutul lucrării

Concluzii

Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate

să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie

Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de

concluzii va scădea valoarea lucrării

Bibliografia (lista referinţelor citarea icircn text)

Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn

lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente

Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli

- să conţină cele mai importante şi recente lucrări

- să includă numai lucrări publicate

- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate

Bibliografie

Elisabeta Jaba ndash Statistică Ed Economică 1998

Mihai Ţarcă ndash Statistică volI Ed UAIC 1979

Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale

Ed University Press 2009

Sorana Daniela Bolboacă ndash Metodologia cercetării curs

53

Page 7: cercetarea medicala - metodologie

Ipoteza este o afirmaţie (nu o icircntrebare) despre o posibilă relaţie icircntre factorii studiaţi şi criteriile de

raţionament Ipoteza poate fi ipoteză ldquonulărdquo - nu există această relaţie şi ldquoalternativărdquo - există relaţia Ipoteza

va trebui apoi dovedită sau respinsă testul statistic calculează probabilitatea conform căreia asociaţia observată

este reală sau ea survine din icircntacircmplare

bull Motivarea organizării studiului Trebuie făcută o motivare corectă legată de inexistenţa unor studii

referitoare la problema pe care o va dezbate studiul

Formularea temei de studiu

Pentru formularea temei de studiu trebuiesc menţionate obiectivul sau obiectivele şi tipul de studiu ales pentru

cercetarea respectivă Există icircn general patru tipuri de obiective

bull obiective care se referă la evoluţia şi prognosticul unei icircmbolnăviri obiective prin care se icircncearcă

icircnţelegerea şi cunoaşterea unor evenimente ce pot să apară la un pacient pe parcursul bolii

bull obiective care se referă la etiologia bolii (cauze de natură bacteriană virală parazitară) sau la cauzalitate

(relaţia factor de risc-boală)

bull obiective legate de performanţa unor teste de diagnostic sau de screening de evaluare a strategiei de

diagnostic sau de interpretare a unui test

bull obiective care se referă la impactul unei intervenţii evaluarea unei intervenţii terapeutice de depistare a unor

boli de prevenţie de educare pentru sănătate

Obiectivele unui studiu se icircmpart icircn obiectivul major unul din cele patru enumerate şi obiective

secundare care pot aborda şi alte fenomene biologice decacirct cel major cu condiţia să nu altereze realizarea

acestuia Alegerea tipului de studiu este stracircns legată de obiectivul ales Dacă obiectivul este descrierea

distribuţiei caracteristicilor unei populaţii aprecierea frecvenţei unui fenomen de sănătate analiza acelui

fenomen icircn funcţie de timp loc persoană se va alege un studiu epidemiologic descriptiv studiu care nu are o

ipoteză fixată anterior O ipoteză se poate formula ca rezultat al studiului descriptiv dar nu se va face

verificarea ei icircn cadrul studiului Dacă intenţia studiului este de a emite o judecată asupra unei posibile relaţii

icircntre factorii studiaţi atunci problema de cercetat este fundamentată de o ipoteză care trebuie verificată

dovedită iar studiul care realizează acest lucru respectiv limitele studiilor utilizate

Aspectele manageriale

Aspectele manageriale includ

bull justificarea bugetului estimarea sumei necesară realizării studiului și apreciarea durate studiului

bull defalcarea bugetului pe necesități legate de achziționare de aparatură reactanți truse etc pentru personal

(munca depusă pregătire deplasări icircn teren participări la congrese sau conferințe documentare) materiale

consumabile etc

7

32 Elaborarea proiectului

Protocolul de cercetare este un document care emite obiectivul și ipoteza studiului definește condițiile de

desfășurare și realizare a viitorului studiu clinic Elaborarea protocolului este importantă pentru cercetătorii

participanţi la studiu comisiile de etică şi finanţatori

Protocolul include mai multe formulare care trebuie să cuprindă

a) Titlul proiectului

b) Sumarul proiectului

c) Descrierea proiectului

d) Normele deontologice de cercetare

e) Modalitățile de diseminarea și valorificarea rezultatelor

f) Perspective de continuare a cercetării

g) Anexe

Prezentarea proiectului va include următoarele fișiere

bull resursele umane (membrii echipei afilierea acestora)

bull relevanța temei pentru dezvoltarea cunoașterii icircn domeniu

bull stadiul actual al cunoașterii și bibliografia aferentă

bull justificarea studiului

bull enunțarea obiectivelor și ipoteza de lucru

bull metodologia propriu-zisă

Referitor la metodologia utilizată vor trebui menționate

bull factorulfactorii studiați care reprezintă variabila independentă respectiv dacă este cazul modalitățile de

măsurare

bull criteriile de raționament- variabila dependentă (situația sau evenimentul ce se presupune a fi rezultatul

factorului studiat cum ar fi boala handicapul complicații decesul)

bull tipul de studiu care se va aplica icircmpreună cu design-ul acestuia

bull eșantioanele de lucru și modalitățile de eșantionaj

bull metodele de culegere și de prelucrare a datelor

bull planificarea activităților

bull structura bugetului fiind eligibile următoarele categorii de cheltuieli de capital (echipamente software

upgrading) pentru personal (full sau part-time instruire asigurări de sănătate) de informare (documentare

abonamente) mobilități (vizite la alte unități de cercetare participări la

congrese) materiale consumabile (truse reactanți papetărie) valorificare a rezultatelor (lucrări științifice de

etapă sau lucrarea finală) cheltuieli indirecte (de regie)

bull modalităţile de valorificare a rezultatelor

bull legături de alte proiecte

8

Protocolul mai conține anexe curriculum vitae al investigatorului principal și al coinvestigatorilor

calendarul activităților avizul Comisiei de etică documente speciale și

consimțămacircntul informat icircn cazul studiilor pe subiecți umani

Icircnainte de implementare protocolul va fi verificat de experți pentru eligibilitate (dacă sunt icircndeplinite

condițiile de acceptare finanțare) calitate și pertinență icircn sensul că protocolul trebuie să fie clar exprimat

corect icircntocmit bine așezat și cu repercursiuni favorabile pentru viitor

33 Culegerea informaţiei

Pentru a realiza o cercetare medicală culegerea datelor este prima etapă şi realizează icircn funcţie de

obiectivele propuse tipul studiului timpul disponibil şi resurse umane şi financiare

Există două mari posibilităţi de culegere

bull Icircn funcţie de elementele studiate

o Culegerea exaustivă Toţi subiecţii populaţiei pe care dorim să o studiem Greu de realizat din cauza

costurilor foarte mari sau a alterării populaţiei de studiu

o Prin eşantionare Este metoda folosită icircn studii medicale

bull Icircn funcţie de durata culegerii

o Transversală Se studiază un grup la un moment dat

o Longitudinală Extinsă in timp

- Retrospectivă ndash icircnregistrări medicale

- Prospectivă ndash date culese la intervale prestabilite de timp

Populaţia ţintă

Este orice colectivitate icircntreagă de oameni animale plante sau obiecte de la care putem colecta date Populaţia

ţintă este icircntregul grup care ne interesează pe care dorim să-l descriem sau să tragem concluzii despre el

Pentru a putea realiza generalizări spre populaţia ţintă deseori suntem obligaţi să folosim un eşantion (selecţie)

care icircnsă trebuie să fie reprezentativ pentru populaţia pe care vrem să o studiem Pentru fiecare populaţie de

studiu sunt posibile mai multe eşantioane Pe baza acestor eşantioane se calculează un estimator Pe baza

acestui estimator calculat care poate fi medie aritmetică procent etc se pot trage concluzii despre icircntreaga

populaţie Este foarte important ca investigatorul să definească foarte atent şi complet populaţia icircnainte de a

realiza eşantionul inclusiv descrierea criteriilor de includere şi excludere icircn populaţia de studiu

Eşantionul

Un eşantion este practic un grup de elemente selectate dintr-un grup mai extins (populaţia ţintă) Studiind

eşantionul selectat se pot trage concluzii despre grupul de unde a fost ales (populaţia ţintă)

Este icircn general ales pentru studiu pentru că

bull Populaţia ţintă este prea mare şi nu poate fi studiată ca icircntreg

bull Nu avem acces din diverse motive decacirct la parte din populaţia de studiu

9

bull Un studiu pe icircntreaga populaţie poate distruge populaţia

bull Eşantioanele pot fi studiate mai rapid

bull Costul şi resursele necesare studiului sunt mai reduse

Numărul elementelor dintr-un eşantion se numeşte talia sau volumul selecţiei

Acesta fiind icircn general mai mic decacirct icircntreaga populaţie poate fi observat icircn detaliu iar dacă este reprezentativ

se pot afla prin intermediul său proprietăţile populaţiei ţintă

Eşantionul trebuie să fie reprezentativ pentru populaţia generală De aceea dintre metodele de eşantionare se

folosesc tehnicile de randomizare Trebuie să satisfacă două condiţii principale

bull condiţie de ordin cantitativ talia să fie suficient de mare

bull condiţie de ordin calitativ trebuie extras aleator din populaţia ţintă

Metode de eşantionare

Putem vorbi icircn linii mari de două posibilităţi de eşantionare prin metode probabilistice şi prin metode

nonprobabilistice

Eşantionarea probabilistică este metoda cea mai folosită icircn studiile medicale fiind şi cea indicată pentru a

realiza reprezentativitatea calitativă

Icircn medicină se folosesc patru tipuri de eşantionări

1 Simplu randomizat

2 Sistematic

3 Stratificat

4 Cluster (icircn cuiburi)

1 Eşantionul simplu randomizat Fiecare element din populaţia ţintă are o şansă egală non zero de a fi

inclus icircn eşantion Se ia la icircntacircmplare un număr de elemente egal cu talia eşantionului Dezavantajul acestui tip

de eşantionare este că presupune cunoaşterea icircntregii populaţii ţintă

2 Eşantionul sistematic După aflarea taliei eşantionului şi a populaţiei ţintă se calculează factorul de

eşantionare k icircmpărţind talia populaţiei ţintă la volumul eşantionului Apoi fiecare al k-lea element este

selectat spre includere

Acelaşi mare dezavantaj apare şi icircn acest caz fiind obligatorie cunoaşterea icircntregii populaţii de studiu

3 Eşantionul stratificat Există icircn cele mai multe cazuri probleme medicale care studiindu-se pe eşantion

prezintă variabilităţi icircn funcţie de caracteristicile populaţiei (sex vacircrstă nivel de pregătire etc) Icircn acest caz

este obligatorie realizarea similitudinii demografice a eşantionului cu populaţia de studiu Din date provenite

de la Centrul de Statistică putem dezvolta ca procente o structură a populaţiei Această structură trebuie să se

regăsească (procentual) şi icircntre membrii eşantionului O importantă şansă ca reprezentativitatea calitativă să fie

corectă este conferită de respectarea

acestei similitudini demografice

10

4 Eşantionul bdquoclusterrdquo sau icircn cuiburi Icircn cazul unui studiu amplu cu scop de a investiga populaţia unei

icircntregi ţări sau regiuni putem ajunge icircn imposibilitatea de a alege şi mai ales investiga indivizi răspacircndiţi prin

icircntreaga zonă Din acest motiv se desemnează la icircntacircmplare un număr calculabil de

grupuri populaţionale extinse icircn toată zona de studiu Aceste grupuri poartă numele de bdquocuiburirdquo La nivelul

fiecărui bdquocuibrdquo se aplică o tehnică precedentă de selecţie a cazurilor Se poate sau de cele mai multe ori se face

la nivel de bdquocuibrdquo stratificarea iar apoi selecţia propriu-zisă se realizează sistematic sau simplu randomizat

Este metoda de eşantionare cel mai frecvent utilizată icircn cercetarea medicală de amploare Pentru ca eventualele

erori să nu se poată strecura s-a definit şi un indice DEF (design effect) cu care trebuie multiplicată talia

selecţiei care pentru eşantionarea icircn bdquocuiburirdquo este egal cu 2 astfel putem obţine şi o reprezentativitate

calitativă dar şi una cantitativă

Eşantionarea nonprobabilistică este o metodă neindicată icircn studiile medicale datorită lipsei de forţă icircn ceea ce

priveşte posibilitatea de aplicare a concluziilor asupra populaţiei de studiu

Se definesc şi icircn acest caz patru metode

1 Eşantion de convenienţă Membrii unui astfel de eşantion sunt aleşi numai pentru că sunt la icircndemacircnă

disponibili de a răspunde le un eventual chestionar

2 Eşantion pe cote Similar cu tipul de eşantion stratificat se referă la faptul că selecţia se face formacircnd

eşantionul din primele 30 de persoane care respectă un criteriu impus

3 Eşantion cu un scop Elementele incluse icircn eşantion sunt alese după un criteriu care exclude din start marea

majoritate a populaţiei

4 Eşantion raţional Selecţia se face prin prisma unui raţionament al celui care conduce studiul

Parametru şi estimator

Parametrul este o valoare de obicei necunoscută (şi care trebuie să fie estimată prin studiu) folosită pentru a

reprezenta o anumită caracteristică a populaţiei de studiu De exemplu media populaţiei (icircnălţime) este un

parametru populaţional Raportat la o populaţie parametrul este o valoare fixă şi exactă care nu variază

Fiecare eşantion extras din populaţie va indica o valoare a mediei care nu poate decacirct să estimeze parametrul

Icircn general parametrii sunt notaţi cu litere greceşti (ex Media = μ)

Estimatorul este o valoare calculată dintr-un eşantion studiat Este folosit pentru a putea aprecia parametrul

populaţional pe care icircn căutăm Este de asemenea posibil ca dintr-o populaţie să formăm mai multe eşantioane

mediile lor de cele mai multe ori nefiind identice icircntre ele şi nici identice cu media populaţiei Estimatorii

sunt notaţi cu litere latine (ex Media = μ)

Dacă valoarea mediei calculată pe eşantion este de exemplu 168 cm atunci putem estima ca valoarea mediei

icircn populaţie este 168 cm

11

Tipuri de culegere a datelor

1 Culegere de tip eşantion reprezentativ Grupul de indivizi incluşi icircn studiu sunt reprezentativi (calitativ şi

cantitativ) pentru populaţia generală Poate fi utilizat pentru studii descriptive (cel mai frecvent) dar uneori şi

pentru studii analitice

Este necesar pentru acest tip de culegere a datelor ca iniţial să fie cunoscută talia eşantionului (calculabilă icircn

funcţie de prevalenţă şi precizie) Pentru evaluarea datelor culese se utilizează tabelul de contingenţă 2 x 2

astfel (Figura 1)

Figura 1 - Tabelul de contingenţă 2 x 2

Unde

a ndash persoane expuse unui factor de risc care au boala studiată

b ndash persoane expuse unui factor de risc care nu au boala studiată

c - persoane neexpuse unui factor de risc care au boala studiată

d - persoane neexpuse unui factor de risc care nu au boala studiată

După aranjarea datelor icircn tabelul de contingenţă (2 x 2) se poate icircncepe analiza statistică a datelor atacirct ca

procente calculabile cacirct şi din punct de vedere a aplicării de teste statistice pentru elucidarea semnificaţiei

statistice

Este posibilă din acest tip de culegere de date calcularea

1 Prevalenţei unei boli

2 Frecvenţei expunerii

3 Gradul de asociere icircntre factorul eventual de risc şi boala

2 Culegerea de tip expus ndash neexpus Icircmparte subiecţii icircn două categorii expuşi sau neexpuşi factorului de risc

studiat Ca evoluţie următoare a studiului după o astfel de culegere a datelor se poate evalua icircn timp apariţia

icircmbolnăvirii despre care se efectuează studiul Icircn timp longitudinal prospectiv se poate calcula dacă factorul

studiat reprezintă un risc de icircmbolnăvire este indiferent sau chiar este cu efect protectiv Numărul subiecţilor

din cele două grupuri poate fi egal sau poate fi diferit Numărul acestora poate fi calculat icircn vederea obţinerii

unei bune reprezentativităţi cu ajutorul formulelor de selecţie Avacircnd icircn vedere calitatea longitudinală a

12

studiului este important ca numărul ales să fie mai mare pentru a putea suplinii eventualele pierderi din

urmărire Practic rezultatele sunt introduse icircn tabelul 2 x 2 de unde se pot calcula indicatorii doriţi (Figura 2)

Avacircnd icircn vedere modul de culegere a datelor este permisă calcularea de indicatori numai pe orizontală

orice comparare icircntre coloana dreaptă şi stacircngă fiind incorectă Avantajul acestui tip de culegere a datelor ar fi

eventualul număr mai redus de subiecţi dar dezavantajul major este cel al costurilor de urmărire icircn timp dar

trebuie luată icircn calcul şi pierderea de subiecţi din evidenţe Factorul controlat este deci prezenţa expunerii iar

factorul aleator este prezenţa bolii

Figura 2 Tabelul de contingenţă pentru tipul de culegere expus ndash neexpus

4 Culegerea de tip caz ndash martor Icircn acest caz ceea ce ghidează colectarea datelor este prezenţa sau absenţa

bolii icircn momentul prezent Se vor culege date de la două loturi constituite după criteriul de bolnav B+ şi de fără

boală B+ Datele culese sunt icircn trecut deci caracterul datelor va fi retrospectiv Icircn acest caz factorul controlat

este boala factorul aleator fiind expunerea (Figura 3)

Calculul de indicatori icircn acest caz se va putea efectua numai icircntre coloane orice calcul icircntre valorile de pe linii

fiind greşit Rezultate semnificative se pot obţine icircn acest caz utilizacircnd loturi mai mici de studiu prin

comparaţie cu tipul eşantion reprezentativ permiţacircnd icircn acelaşi timp studiul bolilor rare (cu prevalenţă mică)

Figura 3 Tabelul de contingenţă pentru tipul de culegere caz ndash martor

Metode de culegere a datelor

Metoda aleasă pentru culegerea datelor trebuie să fie aleasă după un atent studiu bibliografic icircn vederea

stabilirii celui mai eficient mod de a răspunde temei de studiu

Metodele de culegere trebuie să fie bine aplicabile şi consistente ca aport informaţional necesar

13

1 Fiziologice Sunt colectate date despre anumite caracteristici fiziologice ale pacienţilor (TA glicemie

colesterol etc) Această metodă aduce rezultate obiective cacirct timp instrumentul de evaluare este bine calibrat

şi prezintă variaţii mici

2 Metode observaţionale Instrumentul de culegere a datelor trebuie să fie sincronizat cu protocolul conceput

de cercetător Datele culese trebuie să fie de asemenea consistente adică să fie colectate de aceeaşi manieră

conducătorul studiului trebuind să instruiască investigatorii (colectorii de date) Icircnregistrarea datelor trebuie să

fie de asemenea sistematică şi bine standardizată Observaţii de control trebuie icircn mod obligatoriu făcute

pentru a putea aprecia icircn mod corect orice deviere datorată unor factorii externi Este obligatorie luarea icircn

consideraţie a aspectelor etice

3 Interviul Poate fi structurat cu un set specific de icircntrebări sau nestructurat cu o temă generală cu care se

icircncepe interviul Interviurile pot fi icircnregistrate sau intervievatorul poate nota pur şi simplu răspunsurile Există

două tipuri generice de interviu interviul de profunzime care se referă la o discuţie icircn general structurată cu

un număr de icircntrebări prestabilite icircn icircncăperea de studiu fiind doară intervievatorul şi persoana chestionată şi

interviul de grup unde prin conversaţii pornind de la temă generală expusă şi condusă de intervievator se

obţin date despre subiecţii participanţi la studiu Ambele metode de interviu au indicaţiile lor precise Un

interviu pe teme intime nu va putea fi corect icircn ceea ce priveşte datele colectate dacă se aplică un interviu de

grup

4 Chestionarul Document scris adresat unor persoane pentru a răspunde la una sau mai multe icircntrebări

Trebuie să aducă răspunsurile la icircntrebările care motivează studiul constituind ansamblul icircntrebărilor destinate

culegerii de informaţii (date) Redactarea chestionarului trebuie să ţină cont de structura acestuia introducere

conţinut exprimarea icircntrebărilor grafica chestionarului

5 Icircnregistrări preexistente

Icircn cercetarea medicală sunt cel mai frecvent utilizate Informaţiile dorite sunt deja existente ceea ce icirci revine

cercetătorului este ca să structureze datele icircn funcţie de scopul studiului pe care icircn conduce Aceste surse sunt

bull Foi de observaţie

bull Registre de consultaţie

bull Buletine de analize

bull Registre de operaţii

Icircn cazul icircn care nici o metodă de culegere a datelor nu este pe placul celui ce conduce studiul există

posibilitatea de a construi un instrument nou de culegere a datelor

Acest proces trebuie să urmărească nişte paşi obligatorii fiind mare consumator de timp

bull Definirea structurii cu care se va face măsurarea

bull Formularea itemilor de măsură

bull Analiza validităţii instrumentului de măsură ndash măsoară acesta fenomenul corect

bull Elaborarea de instrucţiuni de utilizare pentru investigatori

14

bull Pretestarea instrumentului

bull Aprecierea validităţii interne şi externe a datelor culese

Instrumente de cercetare

Formularea clară a temei de cercetare necesită o foarte bună definire a factorilor studiaţi şi a criteriilor de

judecată Acestea din urmă sunt ultimele care vor trebui definite icircn cadrul protocolului de studiu

Alegerea unui instrument de măsură

Nu există un instrument de măsură perfect sau universal corect Alegerea sa dintre cele existente şi cele deja

utilizate depind de trei factori

bull Obiectivul studiului

bull Boala studiată

bull Populaţia icircn studiu

De aceste trei elemente trebuie ţinut cont icircn fiecare etapă a dezvoltării instrumentului

Definirea obiectivului

Studiu transversal Dacă se doreşte studierea unui simptom sau a unei caracteristici ale populaţiei se poate

icircmpărţi populaţia de studiu icircn mai multe grupuri Este practic vorba de a determina diferenţele dintre subiecţi

icircn cea ce priveşte o variabilă necesară studiată printr-un studiu transversal (utilizarea dozării de Ac HBS

pentru a evalua progresele bolnavilor de hepatită tip B)

Studiu longitudinal Icircn acest caz nu se poate icircmpărţii populaţia de studiu icircn mai multe grupuri datele obţinute

fiind de la acelaşi subiect colectate după un interval de timp

Icircn funcţie de boală şi populaţie se aleg şi instrumentele de măsură cele mai adecvate

Instrumentele cercetării reprezintă un mecanism specific sau o strategie pe care cercetătorul o utilizează pentru

colectarea prelucrarea şi inferenţa datelor Aceste instrumente sunt

1 Studiul icircn bibliotecă

2 Computerul

3 Determinările experimentale

4 Statistica

5 Mintea umană

6 Facilităţi de limbaj şi comunicare

Determinările experimentale

Măsurarea constă icircn aprecierea şi cuantificarea fenomenelor calitativ sau cantitativ Interpretarea

datelor se referă la transformarea lor icircn unităţi de descoperire a unor fenomene mai puţin cercetate

Standardele acceptate se referă la norme medii distribuţii etc Tot icircn cadrul interpretării datelor datele

obţinute sunt caracterizate pe scale de valori nominal ordinal de interval sau de raport

Validarea şi reproductibilitatea măsurătorilor sunt aspecte importante şi foarte necesare pentru o

cercetare corect fundamentată care doreşte obţinerea unor concluzii pertinente

15

Statistica Este implicată icircn condensarea şi procesarea unui volum mai mare de date astfel icircncacirct să se poată

interpreta corect valorile obţinute şi să se permită comparările Utilizarea unor teste statistice specifice permite

determinarea semnificaţiei (diferenţei) statistice astfel icircncacirct estimatorii să poată fi aplicaţi la populaţia

generală Furnizează informaţii şi privind corelarea sau relaţionarea icircntre date

Mintea umană este cea care reuşeşte să integreze şi să icircnţeleagă rezultatele obţinute Semnificaţia ştiinţifică

este stabilită icircn funcţie de rezultatele statisticii de mintea umană conform afirmaţiei bdquosemnificaţia ştiinţifică

nu este egală cu semnificaţia statisticărdquo Metodele aplicate pentru a putea ajunge la o concluzie pertinentă sunt

logica deductivă raţionamentul inductiv şi gacircndirea critică

Limbaj şi comunicare Exprimarea orală sau icircn scris permite nuanţarea unor aspecte seci cifrice ale unor

studii Icircn acest mod devine mai evidentă semnificaţia ştiinţifică a unor rezultate statistice

34 Prelucrarea datelor

Instrumentele de prelucrare

Statistica este o ştiinţă ramură a matematicii care studiază evoluţia fenomenelor şi proceselor

colective pe baza observării lor ştiinţifice a culegerii şi prelucrării detaliate a informaţiilor statistice cu scopul

de a formula şi explica legile legităţile şi regularităţile ce le guvernează

Statistica permite deci aprecierea unor parametrii populaţionali prin studiul unui număr redus de

elemente ale populaţiei icircn studiu (ţintă) O populaţie poate fi definită printr-un şir de valori care pot fi grupate

icircn funcţie de parametrul studiat (glicemie colesterol TAD TAS etc) Pentru fiecare astfel de şir se defineşte

o variabilă (care va purta nume propriu glicemie colesterol etc) Practic variabila este considerată o funcţie

ia valori posibil diferite de la un element la altul icircn funcţie de caracteristicile proprii acestora Sunt clasificate

icircn două grupe variabile cantitative (caracteristică măsurabilă) şi calitative (caracteristică ce nu poate fi

măsurată)

La racircndul lor variabilele calitative pot fi

bull Nominale ndash grupuri de elemente ce nu pot fi ordonate (culoarea părului)

bull Nominale ordonate ndash concluziile pot fi grupate (eficienţa unui tratament slabă bună foarte bună)

bull Binare ndash apar numai două posibilităţi (bolnav sănătos)

Variabilele cantitative pot fi

bull Continue ndash o variabilă măsurabilă care poate lua o infinitate de valori

bull Discrete ndash variabile care nu pot lua decacirct valori icircntregi

Statistica descriptivă

Există două ramuri ale statisticii statistica descriptivă şi statistica inferenţială

Statistica descriptivă (după cum rezultă din denumire) se ocupă cu descrierea unor valori obţinute ale unei

variabile studiate

16

Valorile pe care variabila le ia se constituie icircntr-o serie statistică Indicatorii care definesc o variabilă (serie)

sunt

1 Ale tendinţei centrale

Media aritmetică - notată de regulă cu

Mediana - este acea valoare din şirul de date care icircmparte icircn două părţi egale şirul ordonat de valori (atenţie

şirul este ordonat crescător) situacircndu-se la mijlocul seriei statistice

Dacă numărul de valori n este un număr impar atunci mediana este valoarea unde

Dacă n este par deci avem un număr par de valori mediana este definitatilde ca fiind

unde k = n2

Modul - constituie valoarea care apare cel mai des deci valoarea cu numărul cel mai mare de apariţii

2 De dispersie

Amplitudinea - este diferenţa dintre valoarea maximă şi cea minimă

A = Amax - Amin

Amplitudinea relativă - notată A este raportul dintre amplitudinea absolută şi media aritmetică a seriei de

date

Varianţa notată este un indicator de icircmprăştiere a datelor Formula de calcul este

Abaterea standard (S) sau deviaţia standard reprezintă rădăcina pătrată din varianţă (dispersie)

Coeficientul de variaţie se calculează ca un raport procentual icircntre abaterea standard şi valoarea medie a şirului

de valori

Eroarea standard intervine icircn estimarea intervalelor de confidenţă Se calculează astfel

17

3 De asimetrie (skewness) indică distribuţia datelor dacă sunt sau nu distribuite normal

4 De boltire (kurtosis) estimează boltirea sau aplatizarea curbei de distribuţie

Prezentarea descriptivă a datelor se face prin icircnregistrarea datelor culese icircn tabele care să reprezinte icircn mod

sintetic valorile măsurate

Icircn concluzie statistica descriptivă permite

bull Stabilirea comparabilităţii icircntre grupurile de studiu şi aprecierea prezenţei erorilor sau confuziei

bull Reprezentarea datelor icircn tabele permite evaluarea fiecărui pacient şi dacă a existat pierderi din studiu

Statistica inferenţială

Statistica inferenţială (inductivă) este partea de analiză a datelor care permite extrapolarea unei

concluzii trase pe baza unui eşantion spre populaţia ţintă pentru care a fost efectuat studiul

Scopul analizei statistice este de a evidenţia efectul unui tratament sau al unui factor de risc prin date obţinute

din eşantionul studiat spre populaţia ţintă Aceasta implică testarea ipotezelor statistice sau altfel spus testarea

semnificaţiei statistice Este una dintre cele mai importante momente ale studiului Cum rezultatele sunt

obţinute prin studiul unui eşantion există posibilitatea ca acestea să fie datorate icircntacircmplării Testele

statistice ne ajută să apreciem icircn ce măsură rezultatele sunt icircntacircmplătoare şi mai ales icircn ce măsură şi dacă se

pot aplica populaţiei generale Icircn acest scop se impune o valoare limită alfa 005 care reprezintă limita

superioară a probabilităţii ca rezultatul obţinut să fie greşit (datorat icircntacircmplării) Astfel icircn funcţie de tipul

variabilelor şi indicatorii descriptivi aplicaţi şi evaluaţi se aplică teste de semnificaţie statistică (Tabelul 1)

Tabelul 1 Alegerea testelor de semnificaţie statistică

Tipul datelor

18

Diferenţierea variabilelor din punctul de vedere a distribuţiei se face folosind testul de normalitate

Kolmogorov ndash Smirnov

Testul statistic reprezintă metoda de comparaţie a două sau mai multe populaţii prin intermediul unor

variabile observate ale lor

Scopul unui test statistic este de a defini realitatea

Definirea icircntrebării de cercetare (ipoteza clinică)

Tratamentul cu Nebivolol este la fel de eficient ca şi cel cu Valsartan icircn tratamentul

hipertensiunii arteriale

Transpunerea icircntrebării de cercetare icircn termeni statistici (ipoteza statistică)

Media tensiunii arteriale a pacienţilor trataţi cu Valsartan nu diferă semnificativ de media

tensiunii arteriale a pacienţilor trataţi cu Nebivolol

Etapele unui test statistic

1 Formularea problemei icircn termenii ipotezelor statistice

2 Alegerea şi calcularea parametrului statistic al testului

3 Regiunea critică

4 Concluzia testului

1 Formularea problemei icircn termenii ipotezelor statistice

Ipoteza nulă ipoteza care trebuie testată testul efectuacircndu-se sub prezumţia că ipoteza nulă ar

fi adevărată

Ipoteza alternativă acea ipoteză care icircntr-un sens sau altul contrazice ipoteza nulă Această

ipoteză se mai numeşte şi ipoteza de lucru

Ipoteza nulă tipuri

O coadă (ldquoone-tailedrdquo sau ldquoone-siderdquo)

Media este mai mare

Media este mai mică

Două cozi (ldquoone-tailedrdquo sau ldquoone-siderdquo)

Media este egală

2 Alegerea şi calcularea parametrului statistic al testului

Parametrul statistic al testului exprimă icircntr-o anumită formă diferenţa dintre elementele comparate

Ţinacircnd seama de faptul că eşantionul sau eşantioanele utilizate sunt aleator extrase din populaţiile care

fac obiectul testului parametrul statistic este o variabilă aleatoare de selecţie care urmează o anumită

lege de probabilitate

Un parametru statistic al testului bun trebuie să icircndeplinească două condiţii

19

Trebuie să se comporte diferit atunci cacircnd ipoteza nulă H0 este adevărată faţă de situaţia icircn

care ipoteza alternativă H1 este adevărată

Distribuţia de probabilitate a parametrului statistic al testului sub prezumţia că H0 este

adevărată este cunoscută

3 Regiunea critică

- Trebuie să fim capabili să decidem icircn funcţie de valoarea parametrului statistic calculat care dintre

ipoteze cea nulă sau cea alternativă este adevărată

- Dacă valoarea parametrului statistic aparţine regiunii critice ipoteza nulă H0 va fi respinsă şi va fi

acceptată ipoteza alternativă H1

- Dacă valoarea parametrului statistic nu aparţine regiunii critice ipoteza nulă H0 va fi acceptată

- Decidem mărimea regiunii critice

Pentru aceasta trebuie să specificăm mărimea riscului de eroare pe care icircl acceptăm

Pe scurt definim nivelul de semnificaţie notat cu a sau mărimea riscului pe care

suntem dispuşi să ni-l asumăm icircn respingerea ipotezei nule H0 icircn cazul icircn care aceasta

este adevărată De obicei se alege un nivel de semnificaţie icircntre 1 şi 5

Probabilitatea unei erori de tipul I

probabilitatea de respingere a ipotezei nule H0 icircn favoarea ipotezei alternative H1 icircn

condiţiile icircn care H0 este adevărată

probabilitatea unei erori de tipul I se notează cu a şi se mai numeşte nivel de

semnificaţie al testului

Probabilitatea unei erori de tipul II

probabilitatea acceptării ipotezei nule icircn condiţiile icircn care ipoteza alternativă H1 este

adevărată

această probabilitate se notează cu b

- Unilaterală la dreapta ndash valoarea parametrului statistic al testului este mai mare sau egală cu

valoarea din dreapta a intervalului critic

- Unilaterală la stacircnga ndash valoarea parametrului statistic al testului este mai mică sau egală cu

valoarea din stacircnga a intervalului critic

- Bilaterală ndash valoarea parametrului statistic al testului este mai mică sau egală cu valoarea extremă

din stacircnga regiunii critice sau mai mare sau egală cu valoarea extremă din dreapta regiunii critice

valorile extreme ale regiunii critice avacircnd nivele egale de semnificaţie

4 Concluzia testului

- Ipoteza nulă H0 este respinsă dacă valoarea parametrului statistic aparţine regiunii critice

20

- Regiunea critică trebuie astfel aleasă icircncacirct dacă ipoteza alternativă H1 este adevărată

probabilitatea de respingere a ipotezei nule H0 este mai mare decacirct icircn cazul icircn care ipoteza nulă H0

ar fi adevărată

- Acceptarea ipotezei nule H0 atunci cacircnd ipoteza alternativă H1 este adevărată este cunoscută ca şi

eroarea de tipul II

a probabilitatea ei se notează cu b

b măsoară bdquonivelul de eroarerdquo

- Icircn testarea oricărei ipoteze statistice există patru situaţii care determină dacă decizia noastră este

corectă sau nu

Cazuri

H0 este adevărată H0 este falsă

Concluzie H0 se acceptă decizie corectă eroare de tipul

II

H0 se

respinge

eroare de tipul I decizie corectă

Luarea deciziei pe baza valorii probabilităţii p de semnificaţie a testului

Icircn momentul icircn care prelucrăm statistic o serie de date dorim să ştim dacă rezultatele obţinute sunt sau

nu semnificative statistic

Răspunsul la această icircntrebare este dat de valoarea lui p calculată de orice program statistic la

prelucrarea unor date

Icircn cazul testelor statistice ipoteza nulă este respinsă dacă nivelul de semnificaţie este mai mic decacirct

005 iar programele de prelucrare statistică a datelor vor afişa o steluţă () icircn tabelul rezultatelor

21

Dacă p le 005 respingem ipoteza nulă şi acceptăm ipoteza alternativă (am obţinut semnificaţia

statistică)

Dacă p gt 005 acceptăm ipoteza nulă (nu am obţinut semnificaţia statistică)

p = 013

NU respingem ipoteza nulă

Risc de eroare de tip II

α = 005

p = 002

Respingem ipoteza nulă

Risc de eroare de tip I

Semnificaţia lui p

Criteriu de luare a deciziei cu privire la o ipoteză statistică nulă

Cuantifică şansa ca o decizie de respingere a ipotezei nule să fie greşită

Măsură a semnificaţiei statistice şi NU CLINICĂ

22

Semnificaţia lui p (reguli empirice)

001 le p lt 005 rezultatul e semnificativ statistic

0001 le p lt 001 rezultatul e icircnalt semnificativ statistic

p lt 0001 rezultatul e foarte icircnalt semnificativ statistic

p ge 005 rezultatul e considerat nesemnificativ statistic

Limite ale valorii p

Valoarea p NU ne dă informaţii despre

Şansa de beneficiu a unui pacient individual

Procentul de pacienţi care vor avea un beneficiu icircn urma instituirii procedurii medicale

Gradul de beneficiu expectat pentru un anumit pacient

Puterea unui test statistic

Este capacitatea de a detecta o diferenţă acolo unde există

Creşterea volumului eşantionului determină creşterea puterii testului statistic aplicat

Valoarea este icircn relaţie directă cu eroarea de tip II

Puterea = 1 ndash β

Cea mai utilizată modalitate de creştere a puterii unui test statistic este de a creşte volumul

eşantionului

Tipul scalei de măsură ndash testul statistic

Denumire test Interval Nominal Observaţii

Corelaţie Pearson 2 0 Există o relaţie liniară

χ2 0 2

Student 1 1 Doar 2 grupuri

ANOVA 1 1 2 sau mai multe grupuri

Student perechi 1 1 Eşantioane perechi

Măsurători repetate (ANOVA) 1 1 Mai mult de 2 grupuri date

perechi

Inferenţa statistică pe date calitativ e

Tabela de contingenţă 2times2

Riscuri şi raţii

Testul χ2 (testarea asocierii icircn tabela de contingenţă)

Testul Fisher

23

Testul z pentru proporţii

Testul McNemar

Tabela de contingenţă 2times2

Scale de tip nominal (dicotomiale tabela de contingenţă de 2times2) sau ordinal (tabela de contingenţă de

rtimesc)

Frecvenţa absolută (numărul de evenimente per categorie)

Tabela de contingenţă de 2times2 4 categorii

AP = adevărat pozitiv

FP = fals pozitiv

FN = fals negativ

AN = adevărat negativ

Ulcer deschis Ulcer vindecat Total

Recurenţă + AP = 1 FP = 5 = 1+5 = 6

Recurenţă - FN = 7 AN = 16 = 7+16 = 23

Total =1+7=8 =5+16=21 29

Riscuri şi raţii Mărimi ale asocierii

Denumire Formula Definiţie

Rata falşilor pozitivi =FP(FP+AN) Probabilitatea unui test fals + (α)

Rata falşilor negativi =FN(FN+AP) Probabilitatea unui test fals ndash (β)

Sensibilitate =AP(AP+FN) Probabilitatea unui test real + (1- β)

Specificitate =AN(AN+FP) Probabilitatea unui test real ndash (1- α)

Acurateţe =(AP+AN)n Probabilitatea generală a unei decizii corecte

Valoarea predictivă pozitivă =AP(AP+FP) Probabilitatea ca un test pozitiv să fie corect

Valoarea predictivă negativă =AN(AN+FN) Probabilitatea ca un test negativ să fie corect

Riscul relativ =AP(FP+AN)FN(AP+FP)

Rata şansei =(AP∙AN)(FN∙FP)

Riscul atribuabil =AP(AP+FP)-FN(FN+AN)

24

Denumire Formula

Rata falşilor pozitivi = 5(5+1) = 08334

Rata falşilor negativi = 7(7+16) = 03043

Sensibilitate = 1(1+7) = 01250

Specificitate = 16(16+5) = 07619

Acurateţe = (1+16)29 = 05862

Valoarea predictivă pozitivă = 1(1+5) = 01667

Valoarea predictivă negativă = 16(16+7) = 06957

Riscul relativ = 1(5+16)7(1+5) = 2142 = 050

Rata şansei = (1∙16)(7∙5) = 04571

Riscul atribuabil = 1(1+5)-7(7+16) = 01667-03043=-01376

Testarea asocierii icircn tabela de contingenţă

Testul χ2

Nu trebuie utilizat pentru eşantioane de volum mic

Testul este valid doar dacă valoarea expectată (aşteptată) pentru fiecare celulă este cel puţin

egală cu 1 şi frecvenţa absolută observată este de minim 5

Dacă aceste condiţii nu sunt icircndeplinite se aplică testul exact al lui Fisher (Fisherrsquos Exact Test)

Indică dacă cele două variabile sunt sau nu independente DAR NU cuantifică puterea asocierii

dintre ele

Problema S-a investigat icircntr-un studiu asocierea dintre obezitatea (ca factor de risc) şi bolile

cardio-vasculare la persoanele icircn etate (gt 60 ani) Din totalul de 620 persoane investigate s-au

identificat 150 persoane cu obezitate şi boală cardio-vasculară 230 persoane fără obezitate şi

fără boală cardio-vasculară şi 60 persoane fără obezitate dar cu boală cardio-vasculară Există

o asociere icircntre obezitate şi boala cardio-vasculară (df=1 α=005 χ2critic = 384)

Testul χ2 exemplu

H025

Nu există asociere icircntre obezitate şi bolile cardio-vasculare

Obezitatea şi bolile cardio-vasculare sunt independente

H1

Există asociere icircntre obezitate şi bolile cardio-vasculare

Obezitatea şi bolile cardio-vasculare sunt asociate

a = 005 pragul de semnificaţie al testului

urmează o lege cu (r-1)(c-1) grade de libertate

χ2 = parametrul testului χ2

fio = frecvenţa observată

fit = frecvenţa teoretică

Regiunea critică este [χα2 yen)

Pentru α = 005 χα2 = 384

OBSERVAT BCV+ BCV- Total

Obezitate + AP = 150 FP = 180 330

Obezitate - FN = 60 AN = 230 290

Total 210 410 620

TEORETIC BCV+ BCV- Total

Obezitate + = 330times210620 = 330times410620 330

Obezitate - = 290times210620 = 290times410620 290

Total 210 410 620

TEORETIC BCV+ BCV- Total

Obezitate + = 330times210620 = 330times410620 330

26

Obezitate - = 290times210620 = 290times410620 290

Total 210 410 620

TEORETIC BCV+ BCV-

Obezitate + = 112 = 218

Obezitate - = 98 = 192

Deoarece 4177Icirc[384 yen) se respinge H0 cu un risc de eroare de 5

Există asociere icircntre obezitate şi bolile cardio-vasculare

Testul Fisher

Corecţie a testului χ2

Valoarea p asociată parametrului ne dă probabilitatea ca valoarea observată de independenţă să fie

atribuită doar şansei

O valoare p mică indică că există alte cauze decacirct şansa influenţează rezultatul şi astfel cele două

variabile investigate nu sunt independente

Testul Fisher = dispersia corectată a factorului x dispersia corectată a factorilor reziduali

Icircn acest context regula adunării dispersiilor se poate scrie unde

este variaţia lui y pe seama variaţiei variabilei x

este variaţia lui y pe seama influenţei factorilor reziduali (neicircnregistraţi)

este variaţia totală a caracteristicii y

Testul Fisher empiric se calculează după formula

27

se compară cu Ftab pentru nx şi nz grade de libertate la un anumit prag de semnificaţie stabilit

Dacă Fc gt Ftab rezultă că variaţia factorului de grupare x este semnificativă pentru variaţia caracteristicii y

Testul z pentru proporţii

1 Compararea unei frecvenţe observate cu o frecvenţă teoretică

2 Testarea egalităţii a două frecvenţe

Testul z Compararea unei frecvenţe observate cu o frecvenţă teoretică

Scop Investigarea semnificaţiei diferenţei icircntre o frecvenţă teoretică p (icircntr-o populaţie) şi o frecvenţă

observată f pe un eşantion reprezentativ (variabilă calitativă (binare))

Condiţii de aplicare Testul este corect aplicat dacă numărul n al observaţiilor eşantionului este

suficient de mare (n∙p n∙(1-p)gt10

Parametrul

n = volumul eşantionului

Suntem interesaţi de investigarea prevalenţei hepatitei B la personalul care lucrează icircn laboratoarele

clinicilor de boli infecţioase din Transilvania Se ştie din studii anterioare că prevalenţa hepatitei B icircn

populaţia generală din Transilvania este de 9 S-a luat icircn studiu un eşantion de 100 persoane şi s-a

obţinut o prevalenţă a hepatitei B de 6 Există diferenţă semnificativă icircntre frecvenţa hepatitei B la

personalul care lucrează icircn laboratoarele spitalelor de boli infecţioase din Transilvania faţă de

populaţia generală

f = 006 p = 009 n = 100

Ipoteza nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat

faţă de frecvenţa hepatitei B icircn populaţia generală

Ipoteza alternativă test bilateral Există diferenţă semnificativă icircntre frecvenţa hepatitei B la

nivelul eşantionului şi prevalenţa hepatitei B icircn populaţia generală

f = 006 p = 009 n = 100

Pragul de semnificaţie a = 005

Regiunea critică test bilateral (-yen -196 ]Egrave[196 yen)

28

Concluzia testului

Deoarece parametrul statistic calculat al testului nu aparţine regiunii critice se acceptă ipoteza

nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat faţă de

frecvenţa hepatitei B icircn populaţia generală

Testul McNemar

Evaluarea dependenţei variabilelor calitative perechi (dorim să determinăm dacă o anumită

caracteristică este sau nu asociată cu o anumită patologie)

Identificăm n pacienţi care prezintă patologia de interes (eg Cancer bronho-pulmonar) şi n

pacienţi cu aceleaşi caracteristici ca şi primul grup dar care nu o prezintă

Martor = da Martor = nu

Caz = da a b

Caz = nu c d

Testul McNemar - exemplu fumat vs cancer

Martor = da Martor = nu

Cancer = da a = 2 b = 5

Cancer = nu c = 0 d = 3

29

χ2critic(α=005) = 384

32 lt 384 rarr acceptăm ipoteza nulă

Fumatul nu este icircn relaţie cu apariţia cancerului bronho-pulmonar

Inferenţa statistică pe date cantitative

Variabile cantitative continue

Testul z şi Student (t) (o medie sau medii perechi)

Testul z şi Student (t) (testarea a două medii)

ANOVA (ge 3 medii)

Ranguri (variabile cantitative discrete sau cantitative care nu icircndeplinesc condiţia de

normalitate)

Testul sumei rangurilor Wilcoxon

Kruskal-Wallis (ge 3 eşantioane independente)

Friedman (ge 3 eşantioane dependente)

Teste de normalitate variabile cantitative continue

Shapiro-Wilk

Kolmogorov-Smirnov

Shapiro-Wilk

Chi-Square Goodness-of-Fit

Dacă datele urmează o distribuţie normală aplicăm un test parametric

Dacă datele nu urmează o distribuţie normală aplicăm un test de comparare al rangurilor

30

Testul Z de comparare a mediei unui eşantion cu media unei populaţii

Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ

extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie

s2 care se cunoaşte

Condiţii de aplicare

1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru

compararea mediei unui eşantion cu media unei populaţii)

2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal

distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă

3 Talia eşantionului este mare ( ge 30)

Ipoteze

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media

eşantionului şi media populaţiei

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

(-yen -196 ] Egrave [196 yen)

Parametrul testului

n = volumul eşantionului

= media eşantionului

s = deviaţia standard a populaţiei

Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)

Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard

cunoscută

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi

media standard

Condiţii de aplicare

Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se

realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această

condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea

31

Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai

puternic

Numărul de grade de libertate (df) df = n-1

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

Parametrul testului

n = volumul eşantionului

micro0 = media standard

= media eşantionului

s = deviaţia standard a eşantionului

Testul ANOVA compararea mediilor a mai multe eşantioane

H0 = toate mediile sunt egale

H1 = nu toate mediile sunt egale

Condiţii de aplicare

1 Datele sunt independente unele faţă de celelalte

2 Datele fiecărui grup sunt normal distribuite

3 Deviaţia standard este aceeaşi pentru toate grupurile

Id Medicament

A B C D E F

1 5 6 7 10 5 9

2 6 8 8 11 8 8

3 7 7 9 13 6 7

4 8 9 11 12 4 5

32

5 9 10 10 9 7 6

Suma 35 40 45 55 30 35

Media 7 8 9 11 6 7

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =

= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)

Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2

F = (suma pătratelor(icircntre))(suma pătratelor(icircn))

Suma pătratelor (icircntre) = 16times5 = 80

Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60

Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn

interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare

SP df Media pătratelor F = MPicircntreMPicircn

Icircntre 80 5 = 805 = 16 = 1625 = 64

Icircn 60 24 = 6024 = 25

Total 140 29 -

Testul sumei rangurilor Wilcoxon

Aplicat pentru

Un set de observaţii provenite dintr-o valoare ipotetică comună

Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)

Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero

Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace

Suma rangurilor pentru diferenţele negative = 2+3+1 = 6

Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30

33

Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului

egal cu 8 = 0109

Icircnainte După Diferenţa Rang

64 66 -2 2

66 58 8 5

67 68 -1 3

71 65 6 4

72 75 -3 1

76 67 9 6

78 59 19 8

89 74 15 7

Testul Kruskal-Wallis (ge 3 eşantioane independente)

Test de ranguri aplicate pe mai mult de 3 eşantioane

H = parametrul testului

n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)

Tk = suma rangurilor

Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie

pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni

34

df = k-1 (k = numărul de eşantioane)

df = 3-1 = 2

Hcritic(α=005) = 599

H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie

pozitivă şi respectiv biopsie negativă

Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie

a tipului de studiu pe eşantioane perechi)

1 Definirea numărului de tratamente k

2 Obţinerea rangurilor pentru fiecare tratament

3 Sumarea rangurilor fiecărui tratament

4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)

5 Dacă Fr gt Frcritic rarr respingem H0

Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost

măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi

n = 9 k = 3 T12 = 225 T2

2 = 38025 T32 = 38025

Frcritic = 599

Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de

prostată

35

De reţinut

Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei

Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-

of-Fit

Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z

Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t

Compararea mediilor a 3 sau mai multe eşantioane ANOVA

Compararea mediilor a două populaţii (σ) testul Z

Compararea mediilor a două eşantioane (s) testul t

Compararea mediilor a două eşantioane perechi (s) testul t

ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi

cu cel pentru compararea a două eşantioane perechi

Ranguri

Distribuţia datelor nu are importanţă

Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)

Trei sau mai multe eşantioane Kruskal-Wallis

Trei sau mai multe eşantioane perechi Friedman

Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia

Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a

datelor)

Variabile nominale

Un singur eşantion sau eşantioane perechi

Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte

Eşantioane perechi testul Mc Nemar

Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2

Icircn analiza proporţiilor există teste diferite pentru

Compararea unei frecvenţe cu o frecvenţă cunoscută

Compararea a două frecvenţe

Semnificaţia statistică

Valoarea p (p value)

Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor

două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E

posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării

aleatorii

36

Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală

urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii

Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este

probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un

experiment de dimensiunea acestuia

Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că

diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii

diferite

Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca

fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă

ar fi fost adevărată

Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă

1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe

baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De

fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001

2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie

3 Se aplică testul statistic aferent pentru a calcula valoarea p

4 Se compară valoarea p cu valoarea ndash prag

5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe

semnificativă dpdv statisticrdquo

6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e

semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să

conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă

Teste de semnificaţie

Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului

populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)

Testarea ipotezelor implică posibile erori

Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile

sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui

grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul

icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005

ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există

37

nici o diferenţă

Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ

statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de

ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost

ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau

dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă

cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă

semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe

ipotetice variate icircn cazul icircn care ele există

Măsuri ale frecvenţei

Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)

Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate

Generic formula pe care se bazează toate cele trei este

unde x şi y sunt cantităţile de comparat

Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea

unei frecvenţe pe grupe de sex vacircrstă etc

Proporţia implică icircn mod necesar ca x să fie inclus icircn y

Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară

frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp

Pentru calcularea unei rate trebuie ţinut cont de trei aspecte

bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin

bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp

bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo

Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un

tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei

populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei

aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)

38

Indicatori

Rata de incidenţă

Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă

icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii

Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o

perioadă de timp

Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de

timp x

Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei

susceptibili de a dezvolta icircmbolnăvirea studiată

Numitorul poate fi

bull Numărul mediu al populaţiei icircn perioada de timp studiată

bull Mărimea populaţiei icircn mijlocul perioadei de studiu

bull Mărimea populaţiei la icircnceputul studiului

Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă

Este obligatorie menţionarea perioadei de timp

Prevalenţa

Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la

un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă

schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa

momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)

39

Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include

numai cazuri noi respectiv include cazuri noi şi vechi

Rata de atac

Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este

folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp

raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori

Rata persoană-timp

Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din

momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte

migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost

observate

Riscul relativ (RR)

Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment

legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele

prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două

grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la

bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la

bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai

mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo

Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2

Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn

cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă

(Tabelul 1)

Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR

Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la

neexpuşi

40

Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de

culegere a datelor

Odds ratio (OR)

Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin

raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general

studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)

Tabelul 2 Tabelul 2 x 2 pentru calcularea OR

Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală

Rate de mortalitate

Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp

specificată Există mai multe tipuri de rate de mortalitate

o Mortalitate specifică pe sex

o Mortalitate specifică pe rasă

o Mortalitate specifică pe boală

o Mortalitate neonatală

o Mortalitate postneonatală

o Mortalitate infantilă

o Mortalitate maternă

Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP

41

Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de

viaţă şi vacircrsta la care survine decesul dacă este prematur

Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu

Ani de viaţă pierduţi datorat dizabilităţii

Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt

utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru

cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite

grupuri

Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de

risc şi o boală se folosesc riscul relativ şi odds ratio

35 Analiza şi interpretarea datelor

După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date

trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul

Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor

colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului

studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu

plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde

prezenţa biostatisticianului este necesară

Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu

elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat

iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului

iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate

depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori

testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere

clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza

Interpretarea rezultatelor statistice

Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne

motive (număr mic de date) acceptarea ei să fie falsă

Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine

gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia

ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument

de decizie Intervalul de confidenţă

42

Interpretarea statistica ne interpretarea clinică

Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă

Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice

obţinute pe eşantionul studiat

Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare

Ce interpretăm Rezultatele

personale obţinute icircn urma studiului

care au fost prezentate icircn secţiunea bdquoRezultaterdquo

Explicăm rezultatele obţinute

Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale

Interpretarea trebuie să se realizeze icircn

lumina limitelor studiului

contextul cultural social şi educaţional al locului unde s-a realizat cercetarea

contextul a ceea ce se cunoaşte din literatura de specialitate

Interpretăm doar rezultatele personale obţinute icircn urma studiului

Interpretarea statistică nu este tot una cu interpretarea clinică

Interpretarea statistică este importantă

Interpretarea clinică este foarte importantă

Intervalul de confidenţă

Media calculată pe baza unui eşantion nu va echivala media populaţiei

Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului

Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a

populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a

populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)

pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru

orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare

dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de

confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de

date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de

5

Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel

Dacă valoarea p este mică

Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare

aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o

medie diferită Diferenţa este semnificativă dpdv statistic

43

Icircn continuare

Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa

reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică

pentru a fi interesante din punct de vedere ştiinţific

Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC

oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care

este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a

obţine o concluzie clară

Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o

diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că

datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din

punct de vedere ştiinţific

Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul

detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat

Erorile studiilor medicale

Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura

anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară

caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea

asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri

legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias

Erorile potenţiale icircn studiile epidemiologice

1 Erori icircntacircmplătoare

2 Erori sistematice

3 Confuzia

4 Validitatea

1 Erori icircntacircmplătoare

Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a

parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel

de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot

fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii

(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor

de măsură (eroarea de măsurare)

44

2 Erori sistematice

Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate

care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu

acurateţe mare Acurateţea nu este afectată de mărimea eşantionului

Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de

experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea

dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus

şi greu de cuantificat (consum de alcool personalitate etc)

Principalele tipuri de erori din această categorie sunt

bull Biasul de selecţie

bull Biasul de informaţie

Biasul de selecţie

Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul

trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion

inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale

persoanelor incluse

Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se

ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia

Biasul de informaţie

Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de

instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze

expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere

nesemnificativă sau chiar să nu şi-o amintească de loc

3 Confuzia

Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune

prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este

cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă

de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte

important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor

protector

4 Validitatea

Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă

Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte

estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional

Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă

45

conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se

demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)

Validitatea externă se poate realiza numai dacă studiul este valid intern

Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii

studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de

studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt

laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi

validă din punct de vedere intern)

3 6 Prezentarea rezultatelor

După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite

Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor

icircntr-o formă bdquodigerabilărdquo este necesară

Scopul prezentării datelor

1 Transmiterea concluziilor studiului

a Datele corecte şi importante merită comunicate

b Datele trebuie să confirme sau să infirme ipoteza studiului

c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală

2 Acordarea posibilităţii altor cercetători să aprecieze studiul

a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti

b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor

prezentate

Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru

fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie

statistică

Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de

valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras

(Tabel 3)

Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)

46

Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct

numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor

precum şi prezentarea acestora sub formă inteligibilă

Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care

convin cercetătorului

Prezentarea datelor se poate face

1 Figuri şi tabele icircn articole scrise

2 Figuri şi tabele icircn prezentări orale

3 Figuri şi tabele icircn postere

4 Text scris sau incluse icircn text

5 Site-uri de WEB

Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor

Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie

Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele

exprimacircnd exact ceea ce acestea exprimă

Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate

anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel

să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se

acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca

mai sus sugestive sunt formatele simple şi puţin icircncărcate

Dacă nu există reguli impuse se respectă

1 Mesaj simplu fără falsificarea datelor

2 De obicei este necesar atacirct tabelul cacirct şi graficul

3 Să fie simplu şi clar

Tabele

Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile

coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică

elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de

1 Se folosesc doar linii orizontale

2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn

evidenţi prin linie de separare (Tabelul 4)

Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland

Noua Zeelandă)

(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)

47

3 Numerele sunt aliniate icircn funcţie de virgulă

4 Indicii statistici sunt explicaţi sub tabel

5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană

6 Abrevierile pot fi folosite

7 Numărul de zecimale trebuie limitat la maxim două

8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel

9 Plasarea legendei este obligatorie sub tabel

10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)

Icircn cazul prezentărilor orale sau a posterelor este indicat ca

1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării

2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte

3 Folosirea de simboluri este permisă

Clasificarea tabelelor

Tabelele se clasifică după

i) conţinut

bull cu distribuţii de frecvenţe

bull de clase de frecvenţe

bull de contingenţă

ii) structura

bull cu doua coloane

bull cu subclasificări

bull ldquomasterrdquo

Tabele ce conţin distribuţii de frecvenţe

O modalitate comodă de a prezenta o mulţime de date brute este

1 Se ordonează datele in ordine crescătoare

2 Se determine frecvenţa fiecărei valori

3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane

(Tabelul 5)

Tabelul 5 Distribuţii de frecvenţă absolută

48

Tabelul claselor de frecvenţe

1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă

2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)

Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)

Tabele de contingenţă

1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a

tabelelor de contingenţă

2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a

combinaţiilor de perechi ordonate de valori

3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre

a factor de risc si

b starea sănătăţii

4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)

5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)

Tabelul 7 Tabel de contingenţă 2 x 2

49

Grafice

Există două categorii de moduri grafice sub care se pot prezenta datele

1 Ilustraţii şi fotografii

2 Grafice

1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă

pentru lucrare

2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit

Putem vorbi despre mai multe tipuri de grafice

bull Grafice pentru reprezentarea datelor cantitative

1048707 Grafic cartezian (X Y)

1048707 Histograma

1048707 Poligonul de frecvenţe

1048707 Diagrama bdquoscatterrdquo

bull Grafice pentru reprezentarea datelor calitative

1048707 Grafic cu bare

1048707 Diagrama tip bdquoboxplotrdquo

1048707 Diagrama bdquopierdquo

1048707 Cartograma

Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi

dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)

Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)

Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie

Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)

Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)

50

Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir

de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele

două variabile studiate (Figura 6)

Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2

(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2

rămacircne aproximativ constantă)

Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea

comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea

comparativă a mai multor variabile

Figura 7 Grafic calitativ cu bare

51

Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo

Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două

posibilităţi reprezentate grafic este mai frecventă (Figura 8)

Figura 8 Reprezentare tip bdquopierdquo

Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli

sau a oricărui element comparativ Se foloseşte de epidemiologi

Rezultate

Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare

Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o

manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu

explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția

bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la

ilustraţii tabele grafice

Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi

nici rezultatele care invalidează eventual ipoteza

Discuţii

Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd

cultura ştiinţifică şi inteligenţa autorilor

Acest capitol răspunde la trei obiective

Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia

calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de

selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează

rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv

52

este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn

care a fost abordată problema fără a face o revistă a literaturii

Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea

rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul

Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor

afirmaţii nesusţinute de conţinutul lucrării

Concluzii

Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate

să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie

Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de

concluzii va scădea valoarea lucrării

Bibliografia (lista referinţelor citarea icircn text)

Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn

lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente

Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli

- să conţină cele mai importante şi recente lucrări

- să includă numai lucrări publicate

- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate

Bibliografie

Elisabeta Jaba ndash Statistică Ed Economică 1998

Mihai Ţarcă ndash Statistică volI Ed UAIC 1979

Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale

Ed University Press 2009

Sorana Daniela Bolboacă ndash Metodologia cercetării curs

53

Page 8: cercetarea medicala - metodologie

32 Elaborarea proiectului

Protocolul de cercetare este un document care emite obiectivul și ipoteza studiului definește condițiile de

desfășurare și realizare a viitorului studiu clinic Elaborarea protocolului este importantă pentru cercetătorii

participanţi la studiu comisiile de etică şi finanţatori

Protocolul include mai multe formulare care trebuie să cuprindă

a) Titlul proiectului

b) Sumarul proiectului

c) Descrierea proiectului

d) Normele deontologice de cercetare

e) Modalitățile de diseminarea și valorificarea rezultatelor

f) Perspective de continuare a cercetării

g) Anexe

Prezentarea proiectului va include următoarele fișiere

bull resursele umane (membrii echipei afilierea acestora)

bull relevanța temei pentru dezvoltarea cunoașterii icircn domeniu

bull stadiul actual al cunoașterii și bibliografia aferentă

bull justificarea studiului

bull enunțarea obiectivelor și ipoteza de lucru

bull metodologia propriu-zisă

Referitor la metodologia utilizată vor trebui menționate

bull factorulfactorii studiați care reprezintă variabila independentă respectiv dacă este cazul modalitățile de

măsurare

bull criteriile de raționament- variabila dependentă (situația sau evenimentul ce se presupune a fi rezultatul

factorului studiat cum ar fi boala handicapul complicații decesul)

bull tipul de studiu care se va aplica icircmpreună cu design-ul acestuia

bull eșantioanele de lucru și modalitățile de eșantionaj

bull metodele de culegere și de prelucrare a datelor

bull planificarea activităților

bull structura bugetului fiind eligibile următoarele categorii de cheltuieli de capital (echipamente software

upgrading) pentru personal (full sau part-time instruire asigurări de sănătate) de informare (documentare

abonamente) mobilități (vizite la alte unități de cercetare participări la

congrese) materiale consumabile (truse reactanți papetărie) valorificare a rezultatelor (lucrări științifice de

etapă sau lucrarea finală) cheltuieli indirecte (de regie)

bull modalităţile de valorificare a rezultatelor

bull legături de alte proiecte

8

Protocolul mai conține anexe curriculum vitae al investigatorului principal și al coinvestigatorilor

calendarul activităților avizul Comisiei de etică documente speciale și

consimțămacircntul informat icircn cazul studiilor pe subiecți umani

Icircnainte de implementare protocolul va fi verificat de experți pentru eligibilitate (dacă sunt icircndeplinite

condițiile de acceptare finanțare) calitate și pertinență icircn sensul că protocolul trebuie să fie clar exprimat

corect icircntocmit bine așezat și cu repercursiuni favorabile pentru viitor

33 Culegerea informaţiei

Pentru a realiza o cercetare medicală culegerea datelor este prima etapă şi realizează icircn funcţie de

obiectivele propuse tipul studiului timpul disponibil şi resurse umane şi financiare

Există două mari posibilităţi de culegere

bull Icircn funcţie de elementele studiate

o Culegerea exaustivă Toţi subiecţii populaţiei pe care dorim să o studiem Greu de realizat din cauza

costurilor foarte mari sau a alterării populaţiei de studiu

o Prin eşantionare Este metoda folosită icircn studii medicale

bull Icircn funcţie de durata culegerii

o Transversală Se studiază un grup la un moment dat

o Longitudinală Extinsă in timp

- Retrospectivă ndash icircnregistrări medicale

- Prospectivă ndash date culese la intervale prestabilite de timp

Populaţia ţintă

Este orice colectivitate icircntreagă de oameni animale plante sau obiecte de la care putem colecta date Populaţia

ţintă este icircntregul grup care ne interesează pe care dorim să-l descriem sau să tragem concluzii despre el

Pentru a putea realiza generalizări spre populaţia ţintă deseori suntem obligaţi să folosim un eşantion (selecţie)

care icircnsă trebuie să fie reprezentativ pentru populaţia pe care vrem să o studiem Pentru fiecare populaţie de

studiu sunt posibile mai multe eşantioane Pe baza acestor eşantioane se calculează un estimator Pe baza

acestui estimator calculat care poate fi medie aritmetică procent etc se pot trage concluzii despre icircntreaga

populaţie Este foarte important ca investigatorul să definească foarte atent şi complet populaţia icircnainte de a

realiza eşantionul inclusiv descrierea criteriilor de includere şi excludere icircn populaţia de studiu

Eşantionul

Un eşantion este practic un grup de elemente selectate dintr-un grup mai extins (populaţia ţintă) Studiind

eşantionul selectat se pot trage concluzii despre grupul de unde a fost ales (populaţia ţintă)

Este icircn general ales pentru studiu pentru că

bull Populaţia ţintă este prea mare şi nu poate fi studiată ca icircntreg

bull Nu avem acces din diverse motive decacirct la parte din populaţia de studiu

9

bull Un studiu pe icircntreaga populaţie poate distruge populaţia

bull Eşantioanele pot fi studiate mai rapid

bull Costul şi resursele necesare studiului sunt mai reduse

Numărul elementelor dintr-un eşantion se numeşte talia sau volumul selecţiei

Acesta fiind icircn general mai mic decacirct icircntreaga populaţie poate fi observat icircn detaliu iar dacă este reprezentativ

se pot afla prin intermediul său proprietăţile populaţiei ţintă

Eşantionul trebuie să fie reprezentativ pentru populaţia generală De aceea dintre metodele de eşantionare se

folosesc tehnicile de randomizare Trebuie să satisfacă două condiţii principale

bull condiţie de ordin cantitativ talia să fie suficient de mare

bull condiţie de ordin calitativ trebuie extras aleator din populaţia ţintă

Metode de eşantionare

Putem vorbi icircn linii mari de două posibilităţi de eşantionare prin metode probabilistice şi prin metode

nonprobabilistice

Eşantionarea probabilistică este metoda cea mai folosită icircn studiile medicale fiind şi cea indicată pentru a

realiza reprezentativitatea calitativă

Icircn medicină se folosesc patru tipuri de eşantionări

1 Simplu randomizat

2 Sistematic

3 Stratificat

4 Cluster (icircn cuiburi)

1 Eşantionul simplu randomizat Fiecare element din populaţia ţintă are o şansă egală non zero de a fi

inclus icircn eşantion Se ia la icircntacircmplare un număr de elemente egal cu talia eşantionului Dezavantajul acestui tip

de eşantionare este că presupune cunoaşterea icircntregii populaţii ţintă

2 Eşantionul sistematic După aflarea taliei eşantionului şi a populaţiei ţintă se calculează factorul de

eşantionare k icircmpărţind talia populaţiei ţintă la volumul eşantionului Apoi fiecare al k-lea element este

selectat spre includere

Acelaşi mare dezavantaj apare şi icircn acest caz fiind obligatorie cunoaşterea icircntregii populaţii de studiu

3 Eşantionul stratificat Există icircn cele mai multe cazuri probleme medicale care studiindu-se pe eşantion

prezintă variabilităţi icircn funcţie de caracteristicile populaţiei (sex vacircrstă nivel de pregătire etc) Icircn acest caz

este obligatorie realizarea similitudinii demografice a eşantionului cu populaţia de studiu Din date provenite

de la Centrul de Statistică putem dezvolta ca procente o structură a populaţiei Această structură trebuie să se

regăsească (procentual) şi icircntre membrii eşantionului O importantă şansă ca reprezentativitatea calitativă să fie

corectă este conferită de respectarea

acestei similitudini demografice

10

4 Eşantionul bdquoclusterrdquo sau icircn cuiburi Icircn cazul unui studiu amplu cu scop de a investiga populaţia unei

icircntregi ţări sau regiuni putem ajunge icircn imposibilitatea de a alege şi mai ales investiga indivizi răspacircndiţi prin

icircntreaga zonă Din acest motiv se desemnează la icircntacircmplare un număr calculabil de

grupuri populaţionale extinse icircn toată zona de studiu Aceste grupuri poartă numele de bdquocuiburirdquo La nivelul

fiecărui bdquocuibrdquo se aplică o tehnică precedentă de selecţie a cazurilor Se poate sau de cele mai multe ori se face

la nivel de bdquocuibrdquo stratificarea iar apoi selecţia propriu-zisă se realizează sistematic sau simplu randomizat

Este metoda de eşantionare cel mai frecvent utilizată icircn cercetarea medicală de amploare Pentru ca eventualele

erori să nu se poată strecura s-a definit şi un indice DEF (design effect) cu care trebuie multiplicată talia

selecţiei care pentru eşantionarea icircn bdquocuiburirdquo este egal cu 2 astfel putem obţine şi o reprezentativitate

calitativă dar şi una cantitativă

Eşantionarea nonprobabilistică este o metodă neindicată icircn studiile medicale datorită lipsei de forţă icircn ceea ce

priveşte posibilitatea de aplicare a concluziilor asupra populaţiei de studiu

Se definesc şi icircn acest caz patru metode

1 Eşantion de convenienţă Membrii unui astfel de eşantion sunt aleşi numai pentru că sunt la icircndemacircnă

disponibili de a răspunde le un eventual chestionar

2 Eşantion pe cote Similar cu tipul de eşantion stratificat se referă la faptul că selecţia se face formacircnd

eşantionul din primele 30 de persoane care respectă un criteriu impus

3 Eşantion cu un scop Elementele incluse icircn eşantion sunt alese după un criteriu care exclude din start marea

majoritate a populaţiei

4 Eşantion raţional Selecţia se face prin prisma unui raţionament al celui care conduce studiul

Parametru şi estimator

Parametrul este o valoare de obicei necunoscută (şi care trebuie să fie estimată prin studiu) folosită pentru a

reprezenta o anumită caracteristică a populaţiei de studiu De exemplu media populaţiei (icircnălţime) este un

parametru populaţional Raportat la o populaţie parametrul este o valoare fixă şi exactă care nu variază

Fiecare eşantion extras din populaţie va indica o valoare a mediei care nu poate decacirct să estimeze parametrul

Icircn general parametrii sunt notaţi cu litere greceşti (ex Media = μ)

Estimatorul este o valoare calculată dintr-un eşantion studiat Este folosit pentru a putea aprecia parametrul

populaţional pe care icircn căutăm Este de asemenea posibil ca dintr-o populaţie să formăm mai multe eşantioane

mediile lor de cele mai multe ori nefiind identice icircntre ele şi nici identice cu media populaţiei Estimatorii

sunt notaţi cu litere latine (ex Media = μ)

Dacă valoarea mediei calculată pe eşantion este de exemplu 168 cm atunci putem estima ca valoarea mediei

icircn populaţie este 168 cm

11

Tipuri de culegere a datelor

1 Culegere de tip eşantion reprezentativ Grupul de indivizi incluşi icircn studiu sunt reprezentativi (calitativ şi

cantitativ) pentru populaţia generală Poate fi utilizat pentru studii descriptive (cel mai frecvent) dar uneori şi

pentru studii analitice

Este necesar pentru acest tip de culegere a datelor ca iniţial să fie cunoscută talia eşantionului (calculabilă icircn

funcţie de prevalenţă şi precizie) Pentru evaluarea datelor culese se utilizează tabelul de contingenţă 2 x 2

astfel (Figura 1)

Figura 1 - Tabelul de contingenţă 2 x 2

Unde

a ndash persoane expuse unui factor de risc care au boala studiată

b ndash persoane expuse unui factor de risc care nu au boala studiată

c - persoane neexpuse unui factor de risc care au boala studiată

d - persoane neexpuse unui factor de risc care nu au boala studiată

După aranjarea datelor icircn tabelul de contingenţă (2 x 2) se poate icircncepe analiza statistică a datelor atacirct ca

procente calculabile cacirct şi din punct de vedere a aplicării de teste statistice pentru elucidarea semnificaţiei

statistice

Este posibilă din acest tip de culegere de date calcularea

1 Prevalenţei unei boli

2 Frecvenţei expunerii

3 Gradul de asociere icircntre factorul eventual de risc şi boala

2 Culegerea de tip expus ndash neexpus Icircmparte subiecţii icircn două categorii expuşi sau neexpuşi factorului de risc

studiat Ca evoluţie următoare a studiului după o astfel de culegere a datelor se poate evalua icircn timp apariţia

icircmbolnăvirii despre care se efectuează studiul Icircn timp longitudinal prospectiv se poate calcula dacă factorul

studiat reprezintă un risc de icircmbolnăvire este indiferent sau chiar este cu efect protectiv Numărul subiecţilor

din cele două grupuri poate fi egal sau poate fi diferit Numărul acestora poate fi calculat icircn vederea obţinerii

unei bune reprezentativităţi cu ajutorul formulelor de selecţie Avacircnd icircn vedere calitatea longitudinală a

12

studiului este important ca numărul ales să fie mai mare pentru a putea suplinii eventualele pierderi din

urmărire Practic rezultatele sunt introduse icircn tabelul 2 x 2 de unde se pot calcula indicatorii doriţi (Figura 2)

Avacircnd icircn vedere modul de culegere a datelor este permisă calcularea de indicatori numai pe orizontală

orice comparare icircntre coloana dreaptă şi stacircngă fiind incorectă Avantajul acestui tip de culegere a datelor ar fi

eventualul număr mai redus de subiecţi dar dezavantajul major este cel al costurilor de urmărire icircn timp dar

trebuie luată icircn calcul şi pierderea de subiecţi din evidenţe Factorul controlat este deci prezenţa expunerii iar

factorul aleator este prezenţa bolii

Figura 2 Tabelul de contingenţă pentru tipul de culegere expus ndash neexpus

4 Culegerea de tip caz ndash martor Icircn acest caz ceea ce ghidează colectarea datelor este prezenţa sau absenţa

bolii icircn momentul prezent Se vor culege date de la două loturi constituite după criteriul de bolnav B+ şi de fără

boală B+ Datele culese sunt icircn trecut deci caracterul datelor va fi retrospectiv Icircn acest caz factorul controlat

este boala factorul aleator fiind expunerea (Figura 3)

Calculul de indicatori icircn acest caz se va putea efectua numai icircntre coloane orice calcul icircntre valorile de pe linii

fiind greşit Rezultate semnificative se pot obţine icircn acest caz utilizacircnd loturi mai mici de studiu prin

comparaţie cu tipul eşantion reprezentativ permiţacircnd icircn acelaşi timp studiul bolilor rare (cu prevalenţă mică)

Figura 3 Tabelul de contingenţă pentru tipul de culegere caz ndash martor

Metode de culegere a datelor

Metoda aleasă pentru culegerea datelor trebuie să fie aleasă după un atent studiu bibliografic icircn vederea

stabilirii celui mai eficient mod de a răspunde temei de studiu

Metodele de culegere trebuie să fie bine aplicabile şi consistente ca aport informaţional necesar

13

1 Fiziologice Sunt colectate date despre anumite caracteristici fiziologice ale pacienţilor (TA glicemie

colesterol etc) Această metodă aduce rezultate obiective cacirct timp instrumentul de evaluare este bine calibrat

şi prezintă variaţii mici

2 Metode observaţionale Instrumentul de culegere a datelor trebuie să fie sincronizat cu protocolul conceput

de cercetător Datele culese trebuie să fie de asemenea consistente adică să fie colectate de aceeaşi manieră

conducătorul studiului trebuind să instruiască investigatorii (colectorii de date) Icircnregistrarea datelor trebuie să

fie de asemenea sistematică şi bine standardizată Observaţii de control trebuie icircn mod obligatoriu făcute

pentru a putea aprecia icircn mod corect orice deviere datorată unor factorii externi Este obligatorie luarea icircn

consideraţie a aspectelor etice

3 Interviul Poate fi structurat cu un set specific de icircntrebări sau nestructurat cu o temă generală cu care se

icircncepe interviul Interviurile pot fi icircnregistrate sau intervievatorul poate nota pur şi simplu răspunsurile Există

două tipuri generice de interviu interviul de profunzime care se referă la o discuţie icircn general structurată cu

un număr de icircntrebări prestabilite icircn icircncăperea de studiu fiind doară intervievatorul şi persoana chestionată şi

interviul de grup unde prin conversaţii pornind de la temă generală expusă şi condusă de intervievator se

obţin date despre subiecţii participanţi la studiu Ambele metode de interviu au indicaţiile lor precise Un

interviu pe teme intime nu va putea fi corect icircn ceea ce priveşte datele colectate dacă se aplică un interviu de

grup

4 Chestionarul Document scris adresat unor persoane pentru a răspunde la una sau mai multe icircntrebări

Trebuie să aducă răspunsurile la icircntrebările care motivează studiul constituind ansamblul icircntrebărilor destinate

culegerii de informaţii (date) Redactarea chestionarului trebuie să ţină cont de structura acestuia introducere

conţinut exprimarea icircntrebărilor grafica chestionarului

5 Icircnregistrări preexistente

Icircn cercetarea medicală sunt cel mai frecvent utilizate Informaţiile dorite sunt deja existente ceea ce icirci revine

cercetătorului este ca să structureze datele icircn funcţie de scopul studiului pe care icircn conduce Aceste surse sunt

bull Foi de observaţie

bull Registre de consultaţie

bull Buletine de analize

bull Registre de operaţii

Icircn cazul icircn care nici o metodă de culegere a datelor nu este pe placul celui ce conduce studiul există

posibilitatea de a construi un instrument nou de culegere a datelor

Acest proces trebuie să urmărească nişte paşi obligatorii fiind mare consumator de timp

bull Definirea structurii cu care se va face măsurarea

bull Formularea itemilor de măsură

bull Analiza validităţii instrumentului de măsură ndash măsoară acesta fenomenul corect

bull Elaborarea de instrucţiuni de utilizare pentru investigatori

14

bull Pretestarea instrumentului

bull Aprecierea validităţii interne şi externe a datelor culese

Instrumente de cercetare

Formularea clară a temei de cercetare necesită o foarte bună definire a factorilor studiaţi şi a criteriilor de

judecată Acestea din urmă sunt ultimele care vor trebui definite icircn cadrul protocolului de studiu

Alegerea unui instrument de măsură

Nu există un instrument de măsură perfect sau universal corect Alegerea sa dintre cele existente şi cele deja

utilizate depind de trei factori

bull Obiectivul studiului

bull Boala studiată

bull Populaţia icircn studiu

De aceste trei elemente trebuie ţinut cont icircn fiecare etapă a dezvoltării instrumentului

Definirea obiectivului

Studiu transversal Dacă se doreşte studierea unui simptom sau a unei caracteristici ale populaţiei se poate

icircmpărţi populaţia de studiu icircn mai multe grupuri Este practic vorba de a determina diferenţele dintre subiecţi

icircn cea ce priveşte o variabilă necesară studiată printr-un studiu transversal (utilizarea dozării de Ac HBS

pentru a evalua progresele bolnavilor de hepatită tip B)

Studiu longitudinal Icircn acest caz nu se poate icircmpărţii populaţia de studiu icircn mai multe grupuri datele obţinute

fiind de la acelaşi subiect colectate după un interval de timp

Icircn funcţie de boală şi populaţie se aleg şi instrumentele de măsură cele mai adecvate

Instrumentele cercetării reprezintă un mecanism specific sau o strategie pe care cercetătorul o utilizează pentru

colectarea prelucrarea şi inferenţa datelor Aceste instrumente sunt

1 Studiul icircn bibliotecă

2 Computerul

3 Determinările experimentale

4 Statistica

5 Mintea umană

6 Facilităţi de limbaj şi comunicare

Determinările experimentale

Măsurarea constă icircn aprecierea şi cuantificarea fenomenelor calitativ sau cantitativ Interpretarea

datelor se referă la transformarea lor icircn unităţi de descoperire a unor fenomene mai puţin cercetate

Standardele acceptate se referă la norme medii distribuţii etc Tot icircn cadrul interpretării datelor datele

obţinute sunt caracterizate pe scale de valori nominal ordinal de interval sau de raport

Validarea şi reproductibilitatea măsurătorilor sunt aspecte importante şi foarte necesare pentru o

cercetare corect fundamentată care doreşte obţinerea unor concluzii pertinente

15

Statistica Este implicată icircn condensarea şi procesarea unui volum mai mare de date astfel icircncacirct să se poată

interpreta corect valorile obţinute şi să se permită comparările Utilizarea unor teste statistice specifice permite

determinarea semnificaţiei (diferenţei) statistice astfel icircncacirct estimatorii să poată fi aplicaţi la populaţia

generală Furnizează informaţii şi privind corelarea sau relaţionarea icircntre date

Mintea umană este cea care reuşeşte să integreze şi să icircnţeleagă rezultatele obţinute Semnificaţia ştiinţifică

este stabilită icircn funcţie de rezultatele statisticii de mintea umană conform afirmaţiei bdquosemnificaţia ştiinţifică

nu este egală cu semnificaţia statisticărdquo Metodele aplicate pentru a putea ajunge la o concluzie pertinentă sunt

logica deductivă raţionamentul inductiv şi gacircndirea critică

Limbaj şi comunicare Exprimarea orală sau icircn scris permite nuanţarea unor aspecte seci cifrice ale unor

studii Icircn acest mod devine mai evidentă semnificaţia ştiinţifică a unor rezultate statistice

34 Prelucrarea datelor

Instrumentele de prelucrare

Statistica este o ştiinţă ramură a matematicii care studiază evoluţia fenomenelor şi proceselor

colective pe baza observării lor ştiinţifice a culegerii şi prelucrării detaliate a informaţiilor statistice cu scopul

de a formula şi explica legile legităţile şi regularităţile ce le guvernează

Statistica permite deci aprecierea unor parametrii populaţionali prin studiul unui număr redus de

elemente ale populaţiei icircn studiu (ţintă) O populaţie poate fi definită printr-un şir de valori care pot fi grupate

icircn funcţie de parametrul studiat (glicemie colesterol TAD TAS etc) Pentru fiecare astfel de şir se defineşte

o variabilă (care va purta nume propriu glicemie colesterol etc) Practic variabila este considerată o funcţie

ia valori posibil diferite de la un element la altul icircn funcţie de caracteristicile proprii acestora Sunt clasificate

icircn două grupe variabile cantitative (caracteristică măsurabilă) şi calitative (caracteristică ce nu poate fi

măsurată)

La racircndul lor variabilele calitative pot fi

bull Nominale ndash grupuri de elemente ce nu pot fi ordonate (culoarea părului)

bull Nominale ordonate ndash concluziile pot fi grupate (eficienţa unui tratament slabă bună foarte bună)

bull Binare ndash apar numai două posibilităţi (bolnav sănătos)

Variabilele cantitative pot fi

bull Continue ndash o variabilă măsurabilă care poate lua o infinitate de valori

bull Discrete ndash variabile care nu pot lua decacirct valori icircntregi

Statistica descriptivă

Există două ramuri ale statisticii statistica descriptivă şi statistica inferenţială

Statistica descriptivă (după cum rezultă din denumire) se ocupă cu descrierea unor valori obţinute ale unei

variabile studiate

16

Valorile pe care variabila le ia se constituie icircntr-o serie statistică Indicatorii care definesc o variabilă (serie)

sunt

1 Ale tendinţei centrale

Media aritmetică - notată de regulă cu

Mediana - este acea valoare din şirul de date care icircmparte icircn două părţi egale şirul ordonat de valori (atenţie

şirul este ordonat crescător) situacircndu-se la mijlocul seriei statistice

Dacă numărul de valori n este un număr impar atunci mediana este valoarea unde

Dacă n este par deci avem un număr par de valori mediana este definitatilde ca fiind

unde k = n2

Modul - constituie valoarea care apare cel mai des deci valoarea cu numărul cel mai mare de apariţii

2 De dispersie

Amplitudinea - este diferenţa dintre valoarea maximă şi cea minimă

A = Amax - Amin

Amplitudinea relativă - notată A este raportul dintre amplitudinea absolută şi media aritmetică a seriei de

date

Varianţa notată este un indicator de icircmprăştiere a datelor Formula de calcul este

Abaterea standard (S) sau deviaţia standard reprezintă rădăcina pătrată din varianţă (dispersie)

Coeficientul de variaţie se calculează ca un raport procentual icircntre abaterea standard şi valoarea medie a şirului

de valori

Eroarea standard intervine icircn estimarea intervalelor de confidenţă Se calculează astfel

17

3 De asimetrie (skewness) indică distribuţia datelor dacă sunt sau nu distribuite normal

4 De boltire (kurtosis) estimează boltirea sau aplatizarea curbei de distribuţie

Prezentarea descriptivă a datelor se face prin icircnregistrarea datelor culese icircn tabele care să reprezinte icircn mod

sintetic valorile măsurate

Icircn concluzie statistica descriptivă permite

bull Stabilirea comparabilităţii icircntre grupurile de studiu şi aprecierea prezenţei erorilor sau confuziei

bull Reprezentarea datelor icircn tabele permite evaluarea fiecărui pacient şi dacă a existat pierderi din studiu

Statistica inferenţială

Statistica inferenţială (inductivă) este partea de analiză a datelor care permite extrapolarea unei

concluzii trase pe baza unui eşantion spre populaţia ţintă pentru care a fost efectuat studiul

Scopul analizei statistice este de a evidenţia efectul unui tratament sau al unui factor de risc prin date obţinute

din eşantionul studiat spre populaţia ţintă Aceasta implică testarea ipotezelor statistice sau altfel spus testarea

semnificaţiei statistice Este una dintre cele mai importante momente ale studiului Cum rezultatele sunt

obţinute prin studiul unui eşantion există posibilitatea ca acestea să fie datorate icircntacircmplării Testele

statistice ne ajută să apreciem icircn ce măsură rezultatele sunt icircntacircmplătoare şi mai ales icircn ce măsură şi dacă se

pot aplica populaţiei generale Icircn acest scop se impune o valoare limită alfa 005 care reprezintă limita

superioară a probabilităţii ca rezultatul obţinut să fie greşit (datorat icircntacircmplării) Astfel icircn funcţie de tipul

variabilelor şi indicatorii descriptivi aplicaţi şi evaluaţi se aplică teste de semnificaţie statistică (Tabelul 1)

Tabelul 1 Alegerea testelor de semnificaţie statistică

Tipul datelor

18

Diferenţierea variabilelor din punctul de vedere a distribuţiei se face folosind testul de normalitate

Kolmogorov ndash Smirnov

Testul statistic reprezintă metoda de comparaţie a două sau mai multe populaţii prin intermediul unor

variabile observate ale lor

Scopul unui test statistic este de a defini realitatea

Definirea icircntrebării de cercetare (ipoteza clinică)

Tratamentul cu Nebivolol este la fel de eficient ca şi cel cu Valsartan icircn tratamentul

hipertensiunii arteriale

Transpunerea icircntrebării de cercetare icircn termeni statistici (ipoteza statistică)

Media tensiunii arteriale a pacienţilor trataţi cu Valsartan nu diferă semnificativ de media

tensiunii arteriale a pacienţilor trataţi cu Nebivolol

Etapele unui test statistic

1 Formularea problemei icircn termenii ipotezelor statistice

2 Alegerea şi calcularea parametrului statistic al testului

3 Regiunea critică

4 Concluzia testului

1 Formularea problemei icircn termenii ipotezelor statistice

Ipoteza nulă ipoteza care trebuie testată testul efectuacircndu-se sub prezumţia că ipoteza nulă ar

fi adevărată

Ipoteza alternativă acea ipoteză care icircntr-un sens sau altul contrazice ipoteza nulă Această

ipoteză se mai numeşte şi ipoteza de lucru

Ipoteza nulă tipuri

O coadă (ldquoone-tailedrdquo sau ldquoone-siderdquo)

Media este mai mare

Media este mai mică

Două cozi (ldquoone-tailedrdquo sau ldquoone-siderdquo)

Media este egală

2 Alegerea şi calcularea parametrului statistic al testului

Parametrul statistic al testului exprimă icircntr-o anumită formă diferenţa dintre elementele comparate

Ţinacircnd seama de faptul că eşantionul sau eşantioanele utilizate sunt aleator extrase din populaţiile care

fac obiectul testului parametrul statistic este o variabilă aleatoare de selecţie care urmează o anumită

lege de probabilitate

Un parametru statistic al testului bun trebuie să icircndeplinească două condiţii

19

Trebuie să se comporte diferit atunci cacircnd ipoteza nulă H0 este adevărată faţă de situaţia icircn

care ipoteza alternativă H1 este adevărată

Distribuţia de probabilitate a parametrului statistic al testului sub prezumţia că H0 este

adevărată este cunoscută

3 Regiunea critică

- Trebuie să fim capabili să decidem icircn funcţie de valoarea parametrului statistic calculat care dintre

ipoteze cea nulă sau cea alternativă este adevărată

- Dacă valoarea parametrului statistic aparţine regiunii critice ipoteza nulă H0 va fi respinsă şi va fi

acceptată ipoteza alternativă H1

- Dacă valoarea parametrului statistic nu aparţine regiunii critice ipoteza nulă H0 va fi acceptată

- Decidem mărimea regiunii critice

Pentru aceasta trebuie să specificăm mărimea riscului de eroare pe care icircl acceptăm

Pe scurt definim nivelul de semnificaţie notat cu a sau mărimea riscului pe care

suntem dispuşi să ni-l asumăm icircn respingerea ipotezei nule H0 icircn cazul icircn care aceasta

este adevărată De obicei se alege un nivel de semnificaţie icircntre 1 şi 5

Probabilitatea unei erori de tipul I

probabilitatea de respingere a ipotezei nule H0 icircn favoarea ipotezei alternative H1 icircn

condiţiile icircn care H0 este adevărată

probabilitatea unei erori de tipul I se notează cu a şi se mai numeşte nivel de

semnificaţie al testului

Probabilitatea unei erori de tipul II

probabilitatea acceptării ipotezei nule icircn condiţiile icircn care ipoteza alternativă H1 este

adevărată

această probabilitate se notează cu b

- Unilaterală la dreapta ndash valoarea parametrului statistic al testului este mai mare sau egală cu

valoarea din dreapta a intervalului critic

- Unilaterală la stacircnga ndash valoarea parametrului statistic al testului este mai mică sau egală cu

valoarea din stacircnga a intervalului critic

- Bilaterală ndash valoarea parametrului statistic al testului este mai mică sau egală cu valoarea extremă

din stacircnga regiunii critice sau mai mare sau egală cu valoarea extremă din dreapta regiunii critice

valorile extreme ale regiunii critice avacircnd nivele egale de semnificaţie

4 Concluzia testului

- Ipoteza nulă H0 este respinsă dacă valoarea parametrului statistic aparţine regiunii critice

20

- Regiunea critică trebuie astfel aleasă icircncacirct dacă ipoteza alternativă H1 este adevărată

probabilitatea de respingere a ipotezei nule H0 este mai mare decacirct icircn cazul icircn care ipoteza nulă H0

ar fi adevărată

- Acceptarea ipotezei nule H0 atunci cacircnd ipoteza alternativă H1 este adevărată este cunoscută ca şi

eroarea de tipul II

a probabilitatea ei se notează cu b

b măsoară bdquonivelul de eroarerdquo

- Icircn testarea oricărei ipoteze statistice există patru situaţii care determină dacă decizia noastră este

corectă sau nu

Cazuri

H0 este adevărată H0 este falsă

Concluzie H0 se acceptă decizie corectă eroare de tipul

II

H0 se

respinge

eroare de tipul I decizie corectă

Luarea deciziei pe baza valorii probabilităţii p de semnificaţie a testului

Icircn momentul icircn care prelucrăm statistic o serie de date dorim să ştim dacă rezultatele obţinute sunt sau

nu semnificative statistic

Răspunsul la această icircntrebare este dat de valoarea lui p calculată de orice program statistic la

prelucrarea unor date

Icircn cazul testelor statistice ipoteza nulă este respinsă dacă nivelul de semnificaţie este mai mic decacirct

005 iar programele de prelucrare statistică a datelor vor afişa o steluţă () icircn tabelul rezultatelor

21

Dacă p le 005 respingem ipoteza nulă şi acceptăm ipoteza alternativă (am obţinut semnificaţia

statistică)

Dacă p gt 005 acceptăm ipoteza nulă (nu am obţinut semnificaţia statistică)

p = 013

NU respingem ipoteza nulă

Risc de eroare de tip II

α = 005

p = 002

Respingem ipoteza nulă

Risc de eroare de tip I

Semnificaţia lui p

Criteriu de luare a deciziei cu privire la o ipoteză statistică nulă

Cuantifică şansa ca o decizie de respingere a ipotezei nule să fie greşită

Măsură a semnificaţiei statistice şi NU CLINICĂ

22

Semnificaţia lui p (reguli empirice)

001 le p lt 005 rezultatul e semnificativ statistic

0001 le p lt 001 rezultatul e icircnalt semnificativ statistic

p lt 0001 rezultatul e foarte icircnalt semnificativ statistic

p ge 005 rezultatul e considerat nesemnificativ statistic

Limite ale valorii p

Valoarea p NU ne dă informaţii despre

Şansa de beneficiu a unui pacient individual

Procentul de pacienţi care vor avea un beneficiu icircn urma instituirii procedurii medicale

Gradul de beneficiu expectat pentru un anumit pacient

Puterea unui test statistic

Este capacitatea de a detecta o diferenţă acolo unde există

Creşterea volumului eşantionului determină creşterea puterii testului statistic aplicat

Valoarea este icircn relaţie directă cu eroarea de tip II

Puterea = 1 ndash β

Cea mai utilizată modalitate de creştere a puterii unui test statistic este de a creşte volumul

eşantionului

Tipul scalei de măsură ndash testul statistic

Denumire test Interval Nominal Observaţii

Corelaţie Pearson 2 0 Există o relaţie liniară

χ2 0 2

Student 1 1 Doar 2 grupuri

ANOVA 1 1 2 sau mai multe grupuri

Student perechi 1 1 Eşantioane perechi

Măsurători repetate (ANOVA) 1 1 Mai mult de 2 grupuri date

perechi

Inferenţa statistică pe date calitativ e

Tabela de contingenţă 2times2

Riscuri şi raţii

Testul χ2 (testarea asocierii icircn tabela de contingenţă)

Testul Fisher

23

Testul z pentru proporţii

Testul McNemar

Tabela de contingenţă 2times2

Scale de tip nominal (dicotomiale tabela de contingenţă de 2times2) sau ordinal (tabela de contingenţă de

rtimesc)

Frecvenţa absolută (numărul de evenimente per categorie)

Tabela de contingenţă de 2times2 4 categorii

AP = adevărat pozitiv

FP = fals pozitiv

FN = fals negativ

AN = adevărat negativ

Ulcer deschis Ulcer vindecat Total

Recurenţă + AP = 1 FP = 5 = 1+5 = 6

Recurenţă - FN = 7 AN = 16 = 7+16 = 23

Total =1+7=8 =5+16=21 29

Riscuri şi raţii Mărimi ale asocierii

Denumire Formula Definiţie

Rata falşilor pozitivi =FP(FP+AN) Probabilitatea unui test fals + (α)

Rata falşilor negativi =FN(FN+AP) Probabilitatea unui test fals ndash (β)

Sensibilitate =AP(AP+FN) Probabilitatea unui test real + (1- β)

Specificitate =AN(AN+FP) Probabilitatea unui test real ndash (1- α)

Acurateţe =(AP+AN)n Probabilitatea generală a unei decizii corecte

Valoarea predictivă pozitivă =AP(AP+FP) Probabilitatea ca un test pozitiv să fie corect

Valoarea predictivă negativă =AN(AN+FN) Probabilitatea ca un test negativ să fie corect

Riscul relativ =AP(FP+AN)FN(AP+FP)

Rata şansei =(AP∙AN)(FN∙FP)

Riscul atribuabil =AP(AP+FP)-FN(FN+AN)

24

Denumire Formula

Rata falşilor pozitivi = 5(5+1) = 08334

Rata falşilor negativi = 7(7+16) = 03043

Sensibilitate = 1(1+7) = 01250

Specificitate = 16(16+5) = 07619

Acurateţe = (1+16)29 = 05862

Valoarea predictivă pozitivă = 1(1+5) = 01667

Valoarea predictivă negativă = 16(16+7) = 06957

Riscul relativ = 1(5+16)7(1+5) = 2142 = 050

Rata şansei = (1∙16)(7∙5) = 04571

Riscul atribuabil = 1(1+5)-7(7+16) = 01667-03043=-01376

Testarea asocierii icircn tabela de contingenţă

Testul χ2

Nu trebuie utilizat pentru eşantioane de volum mic

Testul este valid doar dacă valoarea expectată (aşteptată) pentru fiecare celulă este cel puţin

egală cu 1 şi frecvenţa absolută observată este de minim 5

Dacă aceste condiţii nu sunt icircndeplinite se aplică testul exact al lui Fisher (Fisherrsquos Exact Test)

Indică dacă cele două variabile sunt sau nu independente DAR NU cuantifică puterea asocierii

dintre ele

Problema S-a investigat icircntr-un studiu asocierea dintre obezitatea (ca factor de risc) şi bolile

cardio-vasculare la persoanele icircn etate (gt 60 ani) Din totalul de 620 persoane investigate s-au

identificat 150 persoane cu obezitate şi boală cardio-vasculară 230 persoane fără obezitate şi

fără boală cardio-vasculară şi 60 persoane fără obezitate dar cu boală cardio-vasculară Există

o asociere icircntre obezitate şi boala cardio-vasculară (df=1 α=005 χ2critic = 384)

Testul χ2 exemplu

H025

Nu există asociere icircntre obezitate şi bolile cardio-vasculare

Obezitatea şi bolile cardio-vasculare sunt independente

H1

Există asociere icircntre obezitate şi bolile cardio-vasculare

Obezitatea şi bolile cardio-vasculare sunt asociate

a = 005 pragul de semnificaţie al testului

urmează o lege cu (r-1)(c-1) grade de libertate

χ2 = parametrul testului χ2

fio = frecvenţa observată

fit = frecvenţa teoretică

Regiunea critică este [χα2 yen)

Pentru α = 005 χα2 = 384

OBSERVAT BCV+ BCV- Total

Obezitate + AP = 150 FP = 180 330

Obezitate - FN = 60 AN = 230 290

Total 210 410 620

TEORETIC BCV+ BCV- Total

Obezitate + = 330times210620 = 330times410620 330

Obezitate - = 290times210620 = 290times410620 290

Total 210 410 620

TEORETIC BCV+ BCV- Total

Obezitate + = 330times210620 = 330times410620 330

26

Obezitate - = 290times210620 = 290times410620 290

Total 210 410 620

TEORETIC BCV+ BCV-

Obezitate + = 112 = 218

Obezitate - = 98 = 192

Deoarece 4177Icirc[384 yen) se respinge H0 cu un risc de eroare de 5

Există asociere icircntre obezitate şi bolile cardio-vasculare

Testul Fisher

Corecţie a testului χ2

Valoarea p asociată parametrului ne dă probabilitatea ca valoarea observată de independenţă să fie

atribuită doar şansei

O valoare p mică indică că există alte cauze decacirct şansa influenţează rezultatul şi astfel cele două

variabile investigate nu sunt independente

Testul Fisher = dispersia corectată a factorului x dispersia corectată a factorilor reziduali

Icircn acest context regula adunării dispersiilor se poate scrie unde

este variaţia lui y pe seama variaţiei variabilei x

este variaţia lui y pe seama influenţei factorilor reziduali (neicircnregistraţi)

este variaţia totală a caracteristicii y

Testul Fisher empiric se calculează după formula

27

se compară cu Ftab pentru nx şi nz grade de libertate la un anumit prag de semnificaţie stabilit

Dacă Fc gt Ftab rezultă că variaţia factorului de grupare x este semnificativă pentru variaţia caracteristicii y

Testul z pentru proporţii

1 Compararea unei frecvenţe observate cu o frecvenţă teoretică

2 Testarea egalităţii a două frecvenţe

Testul z Compararea unei frecvenţe observate cu o frecvenţă teoretică

Scop Investigarea semnificaţiei diferenţei icircntre o frecvenţă teoretică p (icircntr-o populaţie) şi o frecvenţă

observată f pe un eşantion reprezentativ (variabilă calitativă (binare))

Condiţii de aplicare Testul este corect aplicat dacă numărul n al observaţiilor eşantionului este

suficient de mare (n∙p n∙(1-p)gt10

Parametrul

n = volumul eşantionului

Suntem interesaţi de investigarea prevalenţei hepatitei B la personalul care lucrează icircn laboratoarele

clinicilor de boli infecţioase din Transilvania Se ştie din studii anterioare că prevalenţa hepatitei B icircn

populaţia generală din Transilvania este de 9 S-a luat icircn studiu un eşantion de 100 persoane şi s-a

obţinut o prevalenţă a hepatitei B de 6 Există diferenţă semnificativă icircntre frecvenţa hepatitei B la

personalul care lucrează icircn laboratoarele spitalelor de boli infecţioase din Transilvania faţă de

populaţia generală

f = 006 p = 009 n = 100

Ipoteza nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat

faţă de frecvenţa hepatitei B icircn populaţia generală

Ipoteza alternativă test bilateral Există diferenţă semnificativă icircntre frecvenţa hepatitei B la

nivelul eşantionului şi prevalenţa hepatitei B icircn populaţia generală

f = 006 p = 009 n = 100

Pragul de semnificaţie a = 005

Regiunea critică test bilateral (-yen -196 ]Egrave[196 yen)

28

Concluzia testului

Deoarece parametrul statistic calculat al testului nu aparţine regiunii critice se acceptă ipoteza

nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat faţă de

frecvenţa hepatitei B icircn populaţia generală

Testul McNemar

Evaluarea dependenţei variabilelor calitative perechi (dorim să determinăm dacă o anumită

caracteristică este sau nu asociată cu o anumită patologie)

Identificăm n pacienţi care prezintă patologia de interes (eg Cancer bronho-pulmonar) şi n

pacienţi cu aceleaşi caracteristici ca şi primul grup dar care nu o prezintă

Martor = da Martor = nu

Caz = da a b

Caz = nu c d

Testul McNemar - exemplu fumat vs cancer

Martor = da Martor = nu

Cancer = da a = 2 b = 5

Cancer = nu c = 0 d = 3

29

χ2critic(α=005) = 384

32 lt 384 rarr acceptăm ipoteza nulă

Fumatul nu este icircn relaţie cu apariţia cancerului bronho-pulmonar

Inferenţa statistică pe date cantitative

Variabile cantitative continue

Testul z şi Student (t) (o medie sau medii perechi)

Testul z şi Student (t) (testarea a două medii)

ANOVA (ge 3 medii)

Ranguri (variabile cantitative discrete sau cantitative care nu icircndeplinesc condiţia de

normalitate)

Testul sumei rangurilor Wilcoxon

Kruskal-Wallis (ge 3 eşantioane independente)

Friedman (ge 3 eşantioane dependente)

Teste de normalitate variabile cantitative continue

Shapiro-Wilk

Kolmogorov-Smirnov

Shapiro-Wilk

Chi-Square Goodness-of-Fit

Dacă datele urmează o distribuţie normală aplicăm un test parametric

Dacă datele nu urmează o distribuţie normală aplicăm un test de comparare al rangurilor

30

Testul Z de comparare a mediei unui eşantion cu media unei populaţii

Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ

extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie

s2 care se cunoaşte

Condiţii de aplicare

1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru

compararea mediei unui eşantion cu media unei populaţii)

2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal

distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă

3 Talia eşantionului este mare ( ge 30)

Ipoteze

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media

eşantionului şi media populaţiei

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

(-yen -196 ] Egrave [196 yen)

Parametrul testului

n = volumul eşantionului

= media eşantionului

s = deviaţia standard a populaţiei

Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)

Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard

cunoscută

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi

media standard

Condiţii de aplicare

Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se

realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această

condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea

31

Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai

puternic

Numărul de grade de libertate (df) df = n-1

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

Parametrul testului

n = volumul eşantionului

micro0 = media standard

= media eşantionului

s = deviaţia standard a eşantionului

Testul ANOVA compararea mediilor a mai multe eşantioane

H0 = toate mediile sunt egale

H1 = nu toate mediile sunt egale

Condiţii de aplicare

1 Datele sunt independente unele faţă de celelalte

2 Datele fiecărui grup sunt normal distribuite

3 Deviaţia standard este aceeaşi pentru toate grupurile

Id Medicament

A B C D E F

1 5 6 7 10 5 9

2 6 8 8 11 8 8

3 7 7 9 13 6 7

4 8 9 11 12 4 5

32

5 9 10 10 9 7 6

Suma 35 40 45 55 30 35

Media 7 8 9 11 6 7

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =

= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)

Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2

F = (suma pătratelor(icircntre))(suma pătratelor(icircn))

Suma pătratelor (icircntre) = 16times5 = 80

Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60

Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn

interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare

SP df Media pătratelor F = MPicircntreMPicircn

Icircntre 80 5 = 805 = 16 = 1625 = 64

Icircn 60 24 = 6024 = 25

Total 140 29 -

Testul sumei rangurilor Wilcoxon

Aplicat pentru

Un set de observaţii provenite dintr-o valoare ipotetică comună

Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)

Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero

Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace

Suma rangurilor pentru diferenţele negative = 2+3+1 = 6

Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30

33

Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului

egal cu 8 = 0109

Icircnainte După Diferenţa Rang

64 66 -2 2

66 58 8 5

67 68 -1 3

71 65 6 4

72 75 -3 1

76 67 9 6

78 59 19 8

89 74 15 7

Testul Kruskal-Wallis (ge 3 eşantioane independente)

Test de ranguri aplicate pe mai mult de 3 eşantioane

H = parametrul testului

n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)

Tk = suma rangurilor

Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie

pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni

34

df = k-1 (k = numărul de eşantioane)

df = 3-1 = 2

Hcritic(α=005) = 599

H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie

pozitivă şi respectiv biopsie negativă

Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie

a tipului de studiu pe eşantioane perechi)

1 Definirea numărului de tratamente k

2 Obţinerea rangurilor pentru fiecare tratament

3 Sumarea rangurilor fiecărui tratament

4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)

5 Dacă Fr gt Frcritic rarr respingem H0

Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost

măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi

n = 9 k = 3 T12 = 225 T2

2 = 38025 T32 = 38025

Frcritic = 599

Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de

prostată

35

De reţinut

Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei

Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-

of-Fit

Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z

Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t

Compararea mediilor a 3 sau mai multe eşantioane ANOVA

Compararea mediilor a două populaţii (σ) testul Z

Compararea mediilor a două eşantioane (s) testul t

Compararea mediilor a două eşantioane perechi (s) testul t

ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi

cu cel pentru compararea a două eşantioane perechi

Ranguri

Distribuţia datelor nu are importanţă

Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)

Trei sau mai multe eşantioane Kruskal-Wallis

Trei sau mai multe eşantioane perechi Friedman

Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia

Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a

datelor)

Variabile nominale

Un singur eşantion sau eşantioane perechi

Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte

Eşantioane perechi testul Mc Nemar

Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2

Icircn analiza proporţiilor există teste diferite pentru

Compararea unei frecvenţe cu o frecvenţă cunoscută

Compararea a două frecvenţe

Semnificaţia statistică

Valoarea p (p value)

Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor

două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E

posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării

aleatorii

36

Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală

urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii

Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este

probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un

experiment de dimensiunea acestuia

Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că

diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii

diferite

Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca

fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă

ar fi fost adevărată

Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă

1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe

baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De

fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001

2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie

3 Se aplică testul statistic aferent pentru a calcula valoarea p

4 Se compară valoarea p cu valoarea ndash prag

5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe

semnificativă dpdv statisticrdquo

6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e

semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să

conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă

Teste de semnificaţie

Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului

populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)

Testarea ipotezelor implică posibile erori

Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile

sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui

grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul

icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005

ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există

37

nici o diferenţă

Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ

statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de

ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost

ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau

dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă

cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă

semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe

ipotetice variate icircn cazul icircn care ele există

Măsuri ale frecvenţei

Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)

Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate

Generic formula pe care se bazează toate cele trei este

unde x şi y sunt cantităţile de comparat

Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea

unei frecvenţe pe grupe de sex vacircrstă etc

Proporţia implică icircn mod necesar ca x să fie inclus icircn y

Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară

frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp

Pentru calcularea unei rate trebuie ţinut cont de trei aspecte

bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin

bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp

bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo

Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un

tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei

populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei

aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)

38

Indicatori

Rata de incidenţă

Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă

icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii

Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o

perioadă de timp

Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de

timp x

Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei

susceptibili de a dezvolta icircmbolnăvirea studiată

Numitorul poate fi

bull Numărul mediu al populaţiei icircn perioada de timp studiată

bull Mărimea populaţiei icircn mijlocul perioadei de studiu

bull Mărimea populaţiei la icircnceputul studiului

Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă

Este obligatorie menţionarea perioadei de timp

Prevalenţa

Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la

un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă

schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa

momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)

39

Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include

numai cazuri noi respectiv include cazuri noi şi vechi

Rata de atac

Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este

folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp

raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori

Rata persoană-timp

Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din

momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte

migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost

observate

Riscul relativ (RR)

Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment

legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele

prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două

grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la

bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la

bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai

mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo

Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2

Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn

cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă

(Tabelul 1)

Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR

Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la

neexpuşi

40

Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de

culegere a datelor

Odds ratio (OR)

Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin

raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general

studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)

Tabelul 2 Tabelul 2 x 2 pentru calcularea OR

Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală

Rate de mortalitate

Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp

specificată Există mai multe tipuri de rate de mortalitate

o Mortalitate specifică pe sex

o Mortalitate specifică pe rasă

o Mortalitate specifică pe boală

o Mortalitate neonatală

o Mortalitate postneonatală

o Mortalitate infantilă

o Mortalitate maternă

Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP

41

Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de

viaţă şi vacircrsta la care survine decesul dacă este prematur

Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu

Ani de viaţă pierduţi datorat dizabilităţii

Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt

utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru

cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite

grupuri

Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de

risc şi o boală se folosesc riscul relativ şi odds ratio

35 Analiza şi interpretarea datelor

După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date

trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul

Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor

colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului

studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu

plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde

prezenţa biostatisticianului este necesară

Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu

elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat

iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului

iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate

depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori

testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere

clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza

Interpretarea rezultatelor statistice

Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne

motive (număr mic de date) acceptarea ei să fie falsă

Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine

gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia

ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument

de decizie Intervalul de confidenţă

42

Interpretarea statistica ne interpretarea clinică

Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă

Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice

obţinute pe eşantionul studiat

Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare

Ce interpretăm Rezultatele

personale obţinute icircn urma studiului

care au fost prezentate icircn secţiunea bdquoRezultaterdquo

Explicăm rezultatele obţinute

Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale

Interpretarea trebuie să se realizeze icircn

lumina limitelor studiului

contextul cultural social şi educaţional al locului unde s-a realizat cercetarea

contextul a ceea ce se cunoaşte din literatura de specialitate

Interpretăm doar rezultatele personale obţinute icircn urma studiului

Interpretarea statistică nu este tot una cu interpretarea clinică

Interpretarea statistică este importantă

Interpretarea clinică este foarte importantă

Intervalul de confidenţă

Media calculată pe baza unui eşantion nu va echivala media populaţiei

Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului

Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a

populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a

populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)

pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru

orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare

dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de

confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de

date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de

5

Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel

Dacă valoarea p este mică

Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare

aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o

medie diferită Diferenţa este semnificativă dpdv statistic

43

Icircn continuare

Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa

reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică

pentru a fi interesante din punct de vedere ştiinţific

Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC

oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care

este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a

obţine o concluzie clară

Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o

diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că

datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din

punct de vedere ştiinţific

Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul

detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat

Erorile studiilor medicale

Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura

anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară

caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea

asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri

legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias

Erorile potenţiale icircn studiile epidemiologice

1 Erori icircntacircmplătoare

2 Erori sistematice

3 Confuzia

4 Validitatea

1 Erori icircntacircmplătoare

Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a

parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel

de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot

fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii

(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor

de măsură (eroarea de măsurare)

44

2 Erori sistematice

Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate

care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu

acurateţe mare Acurateţea nu este afectată de mărimea eşantionului

Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de

experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea

dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus

şi greu de cuantificat (consum de alcool personalitate etc)

Principalele tipuri de erori din această categorie sunt

bull Biasul de selecţie

bull Biasul de informaţie

Biasul de selecţie

Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul

trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion

inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale

persoanelor incluse

Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se

ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia

Biasul de informaţie

Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de

instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze

expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere

nesemnificativă sau chiar să nu şi-o amintească de loc

3 Confuzia

Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune

prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este

cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă

de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte

important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor

protector

4 Validitatea

Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă

Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte

estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional

Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă

45

conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se

demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)

Validitatea externă se poate realiza numai dacă studiul este valid intern

Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii

studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de

studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt

laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi

validă din punct de vedere intern)

3 6 Prezentarea rezultatelor

După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite

Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor

icircntr-o formă bdquodigerabilărdquo este necesară

Scopul prezentării datelor

1 Transmiterea concluziilor studiului

a Datele corecte şi importante merită comunicate

b Datele trebuie să confirme sau să infirme ipoteza studiului

c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală

2 Acordarea posibilităţii altor cercetători să aprecieze studiul

a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti

b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor

prezentate

Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru

fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie

statistică

Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de

valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras

(Tabel 3)

Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)

46

Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct

numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor

precum şi prezentarea acestora sub formă inteligibilă

Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care

convin cercetătorului

Prezentarea datelor se poate face

1 Figuri şi tabele icircn articole scrise

2 Figuri şi tabele icircn prezentări orale

3 Figuri şi tabele icircn postere

4 Text scris sau incluse icircn text

5 Site-uri de WEB

Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor

Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie

Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele

exprimacircnd exact ceea ce acestea exprimă

Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate

anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel

să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se

acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca

mai sus sugestive sunt formatele simple şi puţin icircncărcate

Dacă nu există reguli impuse se respectă

1 Mesaj simplu fără falsificarea datelor

2 De obicei este necesar atacirct tabelul cacirct şi graficul

3 Să fie simplu şi clar

Tabele

Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile

coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică

elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de

1 Se folosesc doar linii orizontale

2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn

evidenţi prin linie de separare (Tabelul 4)

Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland

Noua Zeelandă)

(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)

47

3 Numerele sunt aliniate icircn funcţie de virgulă

4 Indicii statistici sunt explicaţi sub tabel

5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană

6 Abrevierile pot fi folosite

7 Numărul de zecimale trebuie limitat la maxim două

8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel

9 Plasarea legendei este obligatorie sub tabel

10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)

Icircn cazul prezentărilor orale sau a posterelor este indicat ca

1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării

2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte

3 Folosirea de simboluri este permisă

Clasificarea tabelelor

Tabelele se clasifică după

i) conţinut

bull cu distribuţii de frecvenţe

bull de clase de frecvenţe

bull de contingenţă

ii) structura

bull cu doua coloane

bull cu subclasificări

bull ldquomasterrdquo

Tabele ce conţin distribuţii de frecvenţe

O modalitate comodă de a prezenta o mulţime de date brute este

1 Se ordonează datele in ordine crescătoare

2 Se determine frecvenţa fiecărei valori

3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane

(Tabelul 5)

Tabelul 5 Distribuţii de frecvenţă absolută

48

Tabelul claselor de frecvenţe

1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă

2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)

Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)

Tabele de contingenţă

1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a

tabelelor de contingenţă

2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a

combinaţiilor de perechi ordonate de valori

3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre

a factor de risc si

b starea sănătăţii

4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)

5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)

Tabelul 7 Tabel de contingenţă 2 x 2

49

Grafice

Există două categorii de moduri grafice sub care se pot prezenta datele

1 Ilustraţii şi fotografii

2 Grafice

1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă

pentru lucrare

2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit

Putem vorbi despre mai multe tipuri de grafice

bull Grafice pentru reprezentarea datelor cantitative

1048707 Grafic cartezian (X Y)

1048707 Histograma

1048707 Poligonul de frecvenţe

1048707 Diagrama bdquoscatterrdquo

bull Grafice pentru reprezentarea datelor calitative

1048707 Grafic cu bare

1048707 Diagrama tip bdquoboxplotrdquo

1048707 Diagrama bdquopierdquo

1048707 Cartograma

Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi

dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)

Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)

Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie

Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)

Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)

50

Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir

de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele

două variabile studiate (Figura 6)

Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2

(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2

rămacircne aproximativ constantă)

Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea

comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea

comparativă a mai multor variabile

Figura 7 Grafic calitativ cu bare

51

Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo

Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două

posibilităţi reprezentate grafic este mai frecventă (Figura 8)

Figura 8 Reprezentare tip bdquopierdquo

Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli

sau a oricărui element comparativ Se foloseşte de epidemiologi

Rezultate

Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare

Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o

manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu

explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția

bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la

ilustraţii tabele grafice

Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi

nici rezultatele care invalidează eventual ipoteza

Discuţii

Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd

cultura ştiinţifică şi inteligenţa autorilor

Acest capitol răspunde la trei obiective

Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia

calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de

selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează

rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv

52

este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn

care a fost abordată problema fără a face o revistă a literaturii

Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea

rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul

Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor

afirmaţii nesusţinute de conţinutul lucrării

Concluzii

Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate

să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie

Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de

concluzii va scădea valoarea lucrării

Bibliografia (lista referinţelor citarea icircn text)

Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn

lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente

Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli

- să conţină cele mai importante şi recente lucrări

- să includă numai lucrări publicate

- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate

Bibliografie

Elisabeta Jaba ndash Statistică Ed Economică 1998

Mihai Ţarcă ndash Statistică volI Ed UAIC 1979

Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale

Ed University Press 2009

Sorana Daniela Bolboacă ndash Metodologia cercetării curs

53

Page 9: cercetarea medicala - metodologie

Protocolul mai conține anexe curriculum vitae al investigatorului principal și al coinvestigatorilor

calendarul activităților avizul Comisiei de etică documente speciale și

consimțămacircntul informat icircn cazul studiilor pe subiecți umani

Icircnainte de implementare protocolul va fi verificat de experți pentru eligibilitate (dacă sunt icircndeplinite

condițiile de acceptare finanțare) calitate și pertinență icircn sensul că protocolul trebuie să fie clar exprimat

corect icircntocmit bine așezat și cu repercursiuni favorabile pentru viitor

33 Culegerea informaţiei

Pentru a realiza o cercetare medicală culegerea datelor este prima etapă şi realizează icircn funcţie de

obiectivele propuse tipul studiului timpul disponibil şi resurse umane şi financiare

Există două mari posibilităţi de culegere

bull Icircn funcţie de elementele studiate

o Culegerea exaustivă Toţi subiecţii populaţiei pe care dorim să o studiem Greu de realizat din cauza

costurilor foarte mari sau a alterării populaţiei de studiu

o Prin eşantionare Este metoda folosită icircn studii medicale

bull Icircn funcţie de durata culegerii

o Transversală Se studiază un grup la un moment dat

o Longitudinală Extinsă in timp

- Retrospectivă ndash icircnregistrări medicale

- Prospectivă ndash date culese la intervale prestabilite de timp

Populaţia ţintă

Este orice colectivitate icircntreagă de oameni animale plante sau obiecte de la care putem colecta date Populaţia

ţintă este icircntregul grup care ne interesează pe care dorim să-l descriem sau să tragem concluzii despre el

Pentru a putea realiza generalizări spre populaţia ţintă deseori suntem obligaţi să folosim un eşantion (selecţie)

care icircnsă trebuie să fie reprezentativ pentru populaţia pe care vrem să o studiem Pentru fiecare populaţie de

studiu sunt posibile mai multe eşantioane Pe baza acestor eşantioane se calculează un estimator Pe baza

acestui estimator calculat care poate fi medie aritmetică procent etc se pot trage concluzii despre icircntreaga

populaţie Este foarte important ca investigatorul să definească foarte atent şi complet populaţia icircnainte de a

realiza eşantionul inclusiv descrierea criteriilor de includere şi excludere icircn populaţia de studiu

Eşantionul

Un eşantion este practic un grup de elemente selectate dintr-un grup mai extins (populaţia ţintă) Studiind

eşantionul selectat se pot trage concluzii despre grupul de unde a fost ales (populaţia ţintă)

Este icircn general ales pentru studiu pentru că

bull Populaţia ţintă este prea mare şi nu poate fi studiată ca icircntreg

bull Nu avem acces din diverse motive decacirct la parte din populaţia de studiu

9

bull Un studiu pe icircntreaga populaţie poate distruge populaţia

bull Eşantioanele pot fi studiate mai rapid

bull Costul şi resursele necesare studiului sunt mai reduse

Numărul elementelor dintr-un eşantion se numeşte talia sau volumul selecţiei

Acesta fiind icircn general mai mic decacirct icircntreaga populaţie poate fi observat icircn detaliu iar dacă este reprezentativ

se pot afla prin intermediul său proprietăţile populaţiei ţintă

Eşantionul trebuie să fie reprezentativ pentru populaţia generală De aceea dintre metodele de eşantionare se

folosesc tehnicile de randomizare Trebuie să satisfacă două condiţii principale

bull condiţie de ordin cantitativ talia să fie suficient de mare

bull condiţie de ordin calitativ trebuie extras aleator din populaţia ţintă

Metode de eşantionare

Putem vorbi icircn linii mari de două posibilităţi de eşantionare prin metode probabilistice şi prin metode

nonprobabilistice

Eşantionarea probabilistică este metoda cea mai folosită icircn studiile medicale fiind şi cea indicată pentru a

realiza reprezentativitatea calitativă

Icircn medicină se folosesc patru tipuri de eşantionări

1 Simplu randomizat

2 Sistematic

3 Stratificat

4 Cluster (icircn cuiburi)

1 Eşantionul simplu randomizat Fiecare element din populaţia ţintă are o şansă egală non zero de a fi

inclus icircn eşantion Se ia la icircntacircmplare un număr de elemente egal cu talia eşantionului Dezavantajul acestui tip

de eşantionare este că presupune cunoaşterea icircntregii populaţii ţintă

2 Eşantionul sistematic După aflarea taliei eşantionului şi a populaţiei ţintă se calculează factorul de

eşantionare k icircmpărţind talia populaţiei ţintă la volumul eşantionului Apoi fiecare al k-lea element este

selectat spre includere

Acelaşi mare dezavantaj apare şi icircn acest caz fiind obligatorie cunoaşterea icircntregii populaţii de studiu

3 Eşantionul stratificat Există icircn cele mai multe cazuri probleme medicale care studiindu-se pe eşantion

prezintă variabilităţi icircn funcţie de caracteristicile populaţiei (sex vacircrstă nivel de pregătire etc) Icircn acest caz

este obligatorie realizarea similitudinii demografice a eşantionului cu populaţia de studiu Din date provenite

de la Centrul de Statistică putem dezvolta ca procente o structură a populaţiei Această structură trebuie să se

regăsească (procentual) şi icircntre membrii eşantionului O importantă şansă ca reprezentativitatea calitativă să fie

corectă este conferită de respectarea

acestei similitudini demografice

10

4 Eşantionul bdquoclusterrdquo sau icircn cuiburi Icircn cazul unui studiu amplu cu scop de a investiga populaţia unei

icircntregi ţări sau regiuni putem ajunge icircn imposibilitatea de a alege şi mai ales investiga indivizi răspacircndiţi prin

icircntreaga zonă Din acest motiv se desemnează la icircntacircmplare un număr calculabil de

grupuri populaţionale extinse icircn toată zona de studiu Aceste grupuri poartă numele de bdquocuiburirdquo La nivelul

fiecărui bdquocuibrdquo se aplică o tehnică precedentă de selecţie a cazurilor Se poate sau de cele mai multe ori se face

la nivel de bdquocuibrdquo stratificarea iar apoi selecţia propriu-zisă se realizează sistematic sau simplu randomizat

Este metoda de eşantionare cel mai frecvent utilizată icircn cercetarea medicală de amploare Pentru ca eventualele

erori să nu se poată strecura s-a definit şi un indice DEF (design effect) cu care trebuie multiplicată talia

selecţiei care pentru eşantionarea icircn bdquocuiburirdquo este egal cu 2 astfel putem obţine şi o reprezentativitate

calitativă dar şi una cantitativă

Eşantionarea nonprobabilistică este o metodă neindicată icircn studiile medicale datorită lipsei de forţă icircn ceea ce

priveşte posibilitatea de aplicare a concluziilor asupra populaţiei de studiu

Se definesc şi icircn acest caz patru metode

1 Eşantion de convenienţă Membrii unui astfel de eşantion sunt aleşi numai pentru că sunt la icircndemacircnă

disponibili de a răspunde le un eventual chestionar

2 Eşantion pe cote Similar cu tipul de eşantion stratificat se referă la faptul că selecţia se face formacircnd

eşantionul din primele 30 de persoane care respectă un criteriu impus

3 Eşantion cu un scop Elementele incluse icircn eşantion sunt alese după un criteriu care exclude din start marea

majoritate a populaţiei

4 Eşantion raţional Selecţia se face prin prisma unui raţionament al celui care conduce studiul

Parametru şi estimator

Parametrul este o valoare de obicei necunoscută (şi care trebuie să fie estimată prin studiu) folosită pentru a

reprezenta o anumită caracteristică a populaţiei de studiu De exemplu media populaţiei (icircnălţime) este un

parametru populaţional Raportat la o populaţie parametrul este o valoare fixă şi exactă care nu variază

Fiecare eşantion extras din populaţie va indica o valoare a mediei care nu poate decacirct să estimeze parametrul

Icircn general parametrii sunt notaţi cu litere greceşti (ex Media = μ)

Estimatorul este o valoare calculată dintr-un eşantion studiat Este folosit pentru a putea aprecia parametrul

populaţional pe care icircn căutăm Este de asemenea posibil ca dintr-o populaţie să formăm mai multe eşantioane

mediile lor de cele mai multe ori nefiind identice icircntre ele şi nici identice cu media populaţiei Estimatorii

sunt notaţi cu litere latine (ex Media = μ)

Dacă valoarea mediei calculată pe eşantion este de exemplu 168 cm atunci putem estima ca valoarea mediei

icircn populaţie este 168 cm

11

Tipuri de culegere a datelor

1 Culegere de tip eşantion reprezentativ Grupul de indivizi incluşi icircn studiu sunt reprezentativi (calitativ şi

cantitativ) pentru populaţia generală Poate fi utilizat pentru studii descriptive (cel mai frecvent) dar uneori şi

pentru studii analitice

Este necesar pentru acest tip de culegere a datelor ca iniţial să fie cunoscută talia eşantionului (calculabilă icircn

funcţie de prevalenţă şi precizie) Pentru evaluarea datelor culese se utilizează tabelul de contingenţă 2 x 2

astfel (Figura 1)

Figura 1 - Tabelul de contingenţă 2 x 2

Unde

a ndash persoane expuse unui factor de risc care au boala studiată

b ndash persoane expuse unui factor de risc care nu au boala studiată

c - persoane neexpuse unui factor de risc care au boala studiată

d - persoane neexpuse unui factor de risc care nu au boala studiată

După aranjarea datelor icircn tabelul de contingenţă (2 x 2) se poate icircncepe analiza statistică a datelor atacirct ca

procente calculabile cacirct şi din punct de vedere a aplicării de teste statistice pentru elucidarea semnificaţiei

statistice

Este posibilă din acest tip de culegere de date calcularea

1 Prevalenţei unei boli

2 Frecvenţei expunerii

3 Gradul de asociere icircntre factorul eventual de risc şi boala

2 Culegerea de tip expus ndash neexpus Icircmparte subiecţii icircn două categorii expuşi sau neexpuşi factorului de risc

studiat Ca evoluţie următoare a studiului după o astfel de culegere a datelor se poate evalua icircn timp apariţia

icircmbolnăvirii despre care se efectuează studiul Icircn timp longitudinal prospectiv se poate calcula dacă factorul

studiat reprezintă un risc de icircmbolnăvire este indiferent sau chiar este cu efect protectiv Numărul subiecţilor

din cele două grupuri poate fi egal sau poate fi diferit Numărul acestora poate fi calculat icircn vederea obţinerii

unei bune reprezentativităţi cu ajutorul formulelor de selecţie Avacircnd icircn vedere calitatea longitudinală a

12

studiului este important ca numărul ales să fie mai mare pentru a putea suplinii eventualele pierderi din

urmărire Practic rezultatele sunt introduse icircn tabelul 2 x 2 de unde se pot calcula indicatorii doriţi (Figura 2)

Avacircnd icircn vedere modul de culegere a datelor este permisă calcularea de indicatori numai pe orizontală

orice comparare icircntre coloana dreaptă şi stacircngă fiind incorectă Avantajul acestui tip de culegere a datelor ar fi

eventualul număr mai redus de subiecţi dar dezavantajul major este cel al costurilor de urmărire icircn timp dar

trebuie luată icircn calcul şi pierderea de subiecţi din evidenţe Factorul controlat este deci prezenţa expunerii iar

factorul aleator este prezenţa bolii

Figura 2 Tabelul de contingenţă pentru tipul de culegere expus ndash neexpus

4 Culegerea de tip caz ndash martor Icircn acest caz ceea ce ghidează colectarea datelor este prezenţa sau absenţa

bolii icircn momentul prezent Se vor culege date de la două loturi constituite după criteriul de bolnav B+ şi de fără

boală B+ Datele culese sunt icircn trecut deci caracterul datelor va fi retrospectiv Icircn acest caz factorul controlat

este boala factorul aleator fiind expunerea (Figura 3)

Calculul de indicatori icircn acest caz se va putea efectua numai icircntre coloane orice calcul icircntre valorile de pe linii

fiind greşit Rezultate semnificative se pot obţine icircn acest caz utilizacircnd loturi mai mici de studiu prin

comparaţie cu tipul eşantion reprezentativ permiţacircnd icircn acelaşi timp studiul bolilor rare (cu prevalenţă mică)

Figura 3 Tabelul de contingenţă pentru tipul de culegere caz ndash martor

Metode de culegere a datelor

Metoda aleasă pentru culegerea datelor trebuie să fie aleasă după un atent studiu bibliografic icircn vederea

stabilirii celui mai eficient mod de a răspunde temei de studiu

Metodele de culegere trebuie să fie bine aplicabile şi consistente ca aport informaţional necesar

13

1 Fiziologice Sunt colectate date despre anumite caracteristici fiziologice ale pacienţilor (TA glicemie

colesterol etc) Această metodă aduce rezultate obiective cacirct timp instrumentul de evaluare este bine calibrat

şi prezintă variaţii mici

2 Metode observaţionale Instrumentul de culegere a datelor trebuie să fie sincronizat cu protocolul conceput

de cercetător Datele culese trebuie să fie de asemenea consistente adică să fie colectate de aceeaşi manieră

conducătorul studiului trebuind să instruiască investigatorii (colectorii de date) Icircnregistrarea datelor trebuie să

fie de asemenea sistematică şi bine standardizată Observaţii de control trebuie icircn mod obligatoriu făcute

pentru a putea aprecia icircn mod corect orice deviere datorată unor factorii externi Este obligatorie luarea icircn

consideraţie a aspectelor etice

3 Interviul Poate fi structurat cu un set specific de icircntrebări sau nestructurat cu o temă generală cu care se

icircncepe interviul Interviurile pot fi icircnregistrate sau intervievatorul poate nota pur şi simplu răspunsurile Există

două tipuri generice de interviu interviul de profunzime care se referă la o discuţie icircn general structurată cu

un număr de icircntrebări prestabilite icircn icircncăperea de studiu fiind doară intervievatorul şi persoana chestionată şi

interviul de grup unde prin conversaţii pornind de la temă generală expusă şi condusă de intervievator se

obţin date despre subiecţii participanţi la studiu Ambele metode de interviu au indicaţiile lor precise Un

interviu pe teme intime nu va putea fi corect icircn ceea ce priveşte datele colectate dacă se aplică un interviu de

grup

4 Chestionarul Document scris adresat unor persoane pentru a răspunde la una sau mai multe icircntrebări

Trebuie să aducă răspunsurile la icircntrebările care motivează studiul constituind ansamblul icircntrebărilor destinate

culegerii de informaţii (date) Redactarea chestionarului trebuie să ţină cont de structura acestuia introducere

conţinut exprimarea icircntrebărilor grafica chestionarului

5 Icircnregistrări preexistente

Icircn cercetarea medicală sunt cel mai frecvent utilizate Informaţiile dorite sunt deja existente ceea ce icirci revine

cercetătorului este ca să structureze datele icircn funcţie de scopul studiului pe care icircn conduce Aceste surse sunt

bull Foi de observaţie

bull Registre de consultaţie

bull Buletine de analize

bull Registre de operaţii

Icircn cazul icircn care nici o metodă de culegere a datelor nu este pe placul celui ce conduce studiul există

posibilitatea de a construi un instrument nou de culegere a datelor

Acest proces trebuie să urmărească nişte paşi obligatorii fiind mare consumator de timp

bull Definirea structurii cu care se va face măsurarea

bull Formularea itemilor de măsură

bull Analiza validităţii instrumentului de măsură ndash măsoară acesta fenomenul corect

bull Elaborarea de instrucţiuni de utilizare pentru investigatori

14

bull Pretestarea instrumentului

bull Aprecierea validităţii interne şi externe a datelor culese

Instrumente de cercetare

Formularea clară a temei de cercetare necesită o foarte bună definire a factorilor studiaţi şi a criteriilor de

judecată Acestea din urmă sunt ultimele care vor trebui definite icircn cadrul protocolului de studiu

Alegerea unui instrument de măsură

Nu există un instrument de măsură perfect sau universal corect Alegerea sa dintre cele existente şi cele deja

utilizate depind de trei factori

bull Obiectivul studiului

bull Boala studiată

bull Populaţia icircn studiu

De aceste trei elemente trebuie ţinut cont icircn fiecare etapă a dezvoltării instrumentului

Definirea obiectivului

Studiu transversal Dacă se doreşte studierea unui simptom sau a unei caracteristici ale populaţiei se poate

icircmpărţi populaţia de studiu icircn mai multe grupuri Este practic vorba de a determina diferenţele dintre subiecţi

icircn cea ce priveşte o variabilă necesară studiată printr-un studiu transversal (utilizarea dozării de Ac HBS

pentru a evalua progresele bolnavilor de hepatită tip B)

Studiu longitudinal Icircn acest caz nu se poate icircmpărţii populaţia de studiu icircn mai multe grupuri datele obţinute

fiind de la acelaşi subiect colectate după un interval de timp

Icircn funcţie de boală şi populaţie se aleg şi instrumentele de măsură cele mai adecvate

Instrumentele cercetării reprezintă un mecanism specific sau o strategie pe care cercetătorul o utilizează pentru

colectarea prelucrarea şi inferenţa datelor Aceste instrumente sunt

1 Studiul icircn bibliotecă

2 Computerul

3 Determinările experimentale

4 Statistica

5 Mintea umană

6 Facilităţi de limbaj şi comunicare

Determinările experimentale

Măsurarea constă icircn aprecierea şi cuantificarea fenomenelor calitativ sau cantitativ Interpretarea

datelor se referă la transformarea lor icircn unităţi de descoperire a unor fenomene mai puţin cercetate

Standardele acceptate se referă la norme medii distribuţii etc Tot icircn cadrul interpretării datelor datele

obţinute sunt caracterizate pe scale de valori nominal ordinal de interval sau de raport

Validarea şi reproductibilitatea măsurătorilor sunt aspecte importante şi foarte necesare pentru o

cercetare corect fundamentată care doreşte obţinerea unor concluzii pertinente

15

Statistica Este implicată icircn condensarea şi procesarea unui volum mai mare de date astfel icircncacirct să se poată

interpreta corect valorile obţinute şi să se permită comparările Utilizarea unor teste statistice specifice permite

determinarea semnificaţiei (diferenţei) statistice astfel icircncacirct estimatorii să poată fi aplicaţi la populaţia

generală Furnizează informaţii şi privind corelarea sau relaţionarea icircntre date

Mintea umană este cea care reuşeşte să integreze şi să icircnţeleagă rezultatele obţinute Semnificaţia ştiinţifică

este stabilită icircn funcţie de rezultatele statisticii de mintea umană conform afirmaţiei bdquosemnificaţia ştiinţifică

nu este egală cu semnificaţia statisticărdquo Metodele aplicate pentru a putea ajunge la o concluzie pertinentă sunt

logica deductivă raţionamentul inductiv şi gacircndirea critică

Limbaj şi comunicare Exprimarea orală sau icircn scris permite nuanţarea unor aspecte seci cifrice ale unor

studii Icircn acest mod devine mai evidentă semnificaţia ştiinţifică a unor rezultate statistice

34 Prelucrarea datelor

Instrumentele de prelucrare

Statistica este o ştiinţă ramură a matematicii care studiază evoluţia fenomenelor şi proceselor

colective pe baza observării lor ştiinţifice a culegerii şi prelucrării detaliate a informaţiilor statistice cu scopul

de a formula şi explica legile legităţile şi regularităţile ce le guvernează

Statistica permite deci aprecierea unor parametrii populaţionali prin studiul unui număr redus de

elemente ale populaţiei icircn studiu (ţintă) O populaţie poate fi definită printr-un şir de valori care pot fi grupate

icircn funcţie de parametrul studiat (glicemie colesterol TAD TAS etc) Pentru fiecare astfel de şir se defineşte

o variabilă (care va purta nume propriu glicemie colesterol etc) Practic variabila este considerată o funcţie

ia valori posibil diferite de la un element la altul icircn funcţie de caracteristicile proprii acestora Sunt clasificate

icircn două grupe variabile cantitative (caracteristică măsurabilă) şi calitative (caracteristică ce nu poate fi

măsurată)

La racircndul lor variabilele calitative pot fi

bull Nominale ndash grupuri de elemente ce nu pot fi ordonate (culoarea părului)

bull Nominale ordonate ndash concluziile pot fi grupate (eficienţa unui tratament slabă bună foarte bună)

bull Binare ndash apar numai două posibilităţi (bolnav sănătos)

Variabilele cantitative pot fi

bull Continue ndash o variabilă măsurabilă care poate lua o infinitate de valori

bull Discrete ndash variabile care nu pot lua decacirct valori icircntregi

Statistica descriptivă

Există două ramuri ale statisticii statistica descriptivă şi statistica inferenţială

Statistica descriptivă (după cum rezultă din denumire) se ocupă cu descrierea unor valori obţinute ale unei

variabile studiate

16

Valorile pe care variabila le ia se constituie icircntr-o serie statistică Indicatorii care definesc o variabilă (serie)

sunt

1 Ale tendinţei centrale

Media aritmetică - notată de regulă cu

Mediana - este acea valoare din şirul de date care icircmparte icircn două părţi egale şirul ordonat de valori (atenţie

şirul este ordonat crescător) situacircndu-se la mijlocul seriei statistice

Dacă numărul de valori n este un număr impar atunci mediana este valoarea unde

Dacă n este par deci avem un număr par de valori mediana este definitatilde ca fiind

unde k = n2

Modul - constituie valoarea care apare cel mai des deci valoarea cu numărul cel mai mare de apariţii

2 De dispersie

Amplitudinea - este diferenţa dintre valoarea maximă şi cea minimă

A = Amax - Amin

Amplitudinea relativă - notată A este raportul dintre amplitudinea absolută şi media aritmetică a seriei de

date

Varianţa notată este un indicator de icircmprăştiere a datelor Formula de calcul este

Abaterea standard (S) sau deviaţia standard reprezintă rădăcina pătrată din varianţă (dispersie)

Coeficientul de variaţie se calculează ca un raport procentual icircntre abaterea standard şi valoarea medie a şirului

de valori

Eroarea standard intervine icircn estimarea intervalelor de confidenţă Se calculează astfel

17

3 De asimetrie (skewness) indică distribuţia datelor dacă sunt sau nu distribuite normal

4 De boltire (kurtosis) estimează boltirea sau aplatizarea curbei de distribuţie

Prezentarea descriptivă a datelor se face prin icircnregistrarea datelor culese icircn tabele care să reprezinte icircn mod

sintetic valorile măsurate

Icircn concluzie statistica descriptivă permite

bull Stabilirea comparabilităţii icircntre grupurile de studiu şi aprecierea prezenţei erorilor sau confuziei

bull Reprezentarea datelor icircn tabele permite evaluarea fiecărui pacient şi dacă a existat pierderi din studiu

Statistica inferenţială

Statistica inferenţială (inductivă) este partea de analiză a datelor care permite extrapolarea unei

concluzii trase pe baza unui eşantion spre populaţia ţintă pentru care a fost efectuat studiul

Scopul analizei statistice este de a evidenţia efectul unui tratament sau al unui factor de risc prin date obţinute

din eşantionul studiat spre populaţia ţintă Aceasta implică testarea ipotezelor statistice sau altfel spus testarea

semnificaţiei statistice Este una dintre cele mai importante momente ale studiului Cum rezultatele sunt

obţinute prin studiul unui eşantion există posibilitatea ca acestea să fie datorate icircntacircmplării Testele

statistice ne ajută să apreciem icircn ce măsură rezultatele sunt icircntacircmplătoare şi mai ales icircn ce măsură şi dacă se

pot aplica populaţiei generale Icircn acest scop se impune o valoare limită alfa 005 care reprezintă limita

superioară a probabilităţii ca rezultatul obţinut să fie greşit (datorat icircntacircmplării) Astfel icircn funcţie de tipul

variabilelor şi indicatorii descriptivi aplicaţi şi evaluaţi se aplică teste de semnificaţie statistică (Tabelul 1)

Tabelul 1 Alegerea testelor de semnificaţie statistică

Tipul datelor

18

Diferenţierea variabilelor din punctul de vedere a distribuţiei se face folosind testul de normalitate

Kolmogorov ndash Smirnov

Testul statistic reprezintă metoda de comparaţie a două sau mai multe populaţii prin intermediul unor

variabile observate ale lor

Scopul unui test statistic este de a defini realitatea

Definirea icircntrebării de cercetare (ipoteza clinică)

Tratamentul cu Nebivolol este la fel de eficient ca şi cel cu Valsartan icircn tratamentul

hipertensiunii arteriale

Transpunerea icircntrebării de cercetare icircn termeni statistici (ipoteza statistică)

Media tensiunii arteriale a pacienţilor trataţi cu Valsartan nu diferă semnificativ de media

tensiunii arteriale a pacienţilor trataţi cu Nebivolol

Etapele unui test statistic

1 Formularea problemei icircn termenii ipotezelor statistice

2 Alegerea şi calcularea parametrului statistic al testului

3 Regiunea critică

4 Concluzia testului

1 Formularea problemei icircn termenii ipotezelor statistice

Ipoteza nulă ipoteza care trebuie testată testul efectuacircndu-se sub prezumţia că ipoteza nulă ar

fi adevărată

Ipoteza alternativă acea ipoteză care icircntr-un sens sau altul contrazice ipoteza nulă Această

ipoteză se mai numeşte şi ipoteza de lucru

Ipoteza nulă tipuri

O coadă (ldquoone-tailedrdquo sau ldquoone-siderdquo)

Media este mai mare

Media este mai mică

Două cozi (ldquoone-tailedrdquo sau ldquoone-siderdquo)

Media este egală

2 Alegerea şi calcularea parametrului statistic al testului

Parametrul statistic al testului exprimă icircntr-o anumită formă diferenţa dintre elementele comparate

Ţinacircnd seama de faptul că eşantionul sau eşantioanele utilizate sunt aleator extrase din populaţiile care

fac obiectul testului parametrul statistic este o variabilă aleatoare de selecţie care urmează o anumită

lege de probabilitate

Un parametru statistic al testului bun trebuie să icircndeplinească două condiţii

19

Trebuie să se comporte diferit atunci cacircnd ipoteza nulă H0 este adevărată faţă de situaţia icircn

care ipoteza alternativă H1 este adevărată

Distribuţia de probabilitate a parametrului statistic al testului sub prezumţia că H0 este

adevărată este cunoscută

3 Regiunea critică

- Trebuie să fim capabili să decidem icircn funcţie de valoarea parametrului statistic calculat care dintre

ipoteze cea nulă sau cea alternativă este adevărată

- Dacă valoarea parametrului statistic aparţine regiunii critice ipoteza nulă H0 va fi respinsă şi va fi

acceptată ipoteza alternativă H1

- Dacă valoarea parametrului statistic nu aparţine regiunii critice ipoteza nulă H0 va fi acceptată

- Decidem mărimea regiunii critice

Pentru aceasta trebuie să specificăm mărimea riscului de eroare pe care icircl acceptăm

Pe scurt definim nivelul de semnificaţie notat cu a sau mărimea riscului pe care

suntem dispuşi să ni-l asumăm icircn respingerea ipotezei nule H0 icircn cazul icircn care aceasta

este adevărată De obicei se alege un nivel de semnificaţie icircntre 1 şi 5

Probabilitatea unei erori de tipul I

probabilitatea de respingere a ipotezei nule H0 icircn favoarea ipotezei alternative H1 icircn

condiţiile icircn care H0 este adevărată

probabilitatea unei erori de tipul I se notează cu a şi se mai numeşte nivel de

semnificaţie al testului

Probabilitatea unei erori de tipul II

probabilitatea acceptării ipotezei nule icircn condiţiile icircn care ipoteza alternativă H1 este

adevărată

această probabilitate se notează cu b

- Unilaterală la dreapta ndash valoarea parametrului statistic al testului este mai mare sau egală cu

valoarea din dreapta a intervalului critic

- Unilaterală la stacircnga ndash valoarea parametrului statistic al testului este mai mică sau egală cu

valoarea din stacircnga a intervalului critic

- Bilaterală ndash valoarea parametrului statistic al testului este mai mică sau egală cu valoarea extremă

din stacircnga regiunii critice sau mai mare sau egală cu valoarea extremă din dreapta regiunii critice

valorile extreme ale regiunii critice avacircnd nivele egale de semnificaţie

4 Concluzia testului

- Ipoteza nulă H0 este respinsă dacă valoarea parametrului statistic aparţine regiunii critice

20

- Regiunea critică trebuie astfel aleasă icircncacirct dacă ipoteza alternativă H1 este adevărată

probabilitatea de respingere a ipotezei nule H0 este mai mare decacirct icircn cazul icircn care ipoteza nulă H0

ar fi adevărată

- Acceptarea ipotezei nule H0 atunci cacircnd ipoteza alternativă H1 este adevărată este cunoscută ca şi

eroarea de tipul II

a probabilitatea ei se notează cu b

b măsoară bdquonivelul de eroarerdquo

- Icircn testarea oricărei ipoteze statistice există patru situaţii care determină dacă decizia noastră este

corectă sau nu

Cazuri

H0 este adevărată H0 este falsă

Concluzie H0 se acceptă decizie corectă eroare de tipul

II

H0 se

respinge

eroare de tipul I decizie corectă

Luarea deciziei pe baza valorii probabilităţii p de semnificaţie a testului

Icircn momentul icircn care prelucrăm statistic o serie de date dorim să ştim dacă rezultatele obţinute sunt sau

nu semnificative statistic

Răspunsul la această icircntrebare este dat de valoarea lui p calculată de orice program statistic la

prelucrarea unor date

Icircn cazul testelor statistice ipoteza nulă este respinsă dacă nivelul de semnificaţie este mai mic decacirct

005 iar programele de prelucrare statistică a datelor vor afişa o steluţă () icircn tabelul rezultatelor

21

Dacă p le 005 respingem ipoteza nulă şi acceptăm ipoteza alternativă (am obţinut semnificaţia

statistică)

Dacă p gt 005 acceptăm ipoteza nulă (nu am obţinut semnificaţia statistică)

p = 013

NU respingem ipoteza nulă

Risc de eroare de tip II

α = 005

p = 002

Respingem ipoteza nulă

Risc de eroare de tip I

Semnificaţia lui p

Criteriu de luare a deciziei cu privire la o ipoteză statistică nulă

Cuantifică şansa ca o decizie de respingere a ipotezei nule să fie greşită

Măsură a semnificaţiei statistice şi NU CLINICĂ

22

Semnificaţia lui p (reguli empirice)

001 le p lt 005 rezultatul e semnificativ statistic

0001 le p lt 001 rezultatul e icircnalt semnificativ statistic

p lt 0001 rezultatul e foarte icircnalt semnificativ statistic

p ge 005 rezultatul e considerat nesemnificativ statistic

Limite ale valorii p

Valoarea p NU ne dă informaţii despre

Şansa de beneficiu a unui pacient individual

Procentul de pacienţi care vor avea un beneficiu icircn urma instituirii procedurii medicale

Gradul de beneficiu expectat pentru un anumit pacient

Puterea unui test statistic

Este capacitatea de a detecta o diferenţă acolo unde există

Creşterea volumului eşantionului determină creşterea puterii testului statistic aplicat

Valoarea este icircn relaţie directă cu eroarea de tip II

Puterea = 1 ndash β

Cea mai utilizată modalitate de creştere a puterii unui test statistic este de a creşte volumul

eşantionului

Tipul scalei de măsură ndash testul statistic

Denumire test Interval Nominal Observaţii

Corelaţie Pearson 2 0 Există o relaţie liniară

χ2 0 2

Student 1 1 Doar 2 grupuri

ANOVA 1 1 2 sau mai multe grupuri

Student perechi 1 1 Eşantioane perechi

Măsurători repetate (ANOVA) 1 1 Mai mult de 2 grupuri date

perechi

Inferenţa statistică pe date calitativ e

Tabela de contingenţă 2times2

Riscuri şi raţii

Testul χ2 (testarea asocierii icircn tabela de contingenţă)

Testul Fisher

23

Testul z pentru proporţii

Testul McNemar

Tabela de contingenţă 2times2

Scale de tip nominal (dicotomiale tabela de contingenţă de 2times2) sau ordinal (tabela de contingenţă de

rtimesc)

Frecvenţa absolută (numărul de evenimente per categorie)

Tabela de contingenţă de 2times2 4 categorii

AP = adevărat pozitiv

FP = fals pozitiv

FN = fals negativ

AN = adevărat negativ

Ulcer deschis Ulcer vindecat Total

Recurenţă + AP = 1 FP = 5 = 1+5 = 6

Recurenţă - FN = 7 AN = 16 = 7+16 = 23

Total =1+7=8 =5+16=21 29

Riscuri şi raţii Mărimi ale asocierii

Denumire Formula Definiţie

Rata falşilor pozitivi =FP(FP+AN) Probabilitatea unui test fals + (α)

Rata falşilor negativi =FN(FN+AP) Probabilitatea unui test fals ndash (β)

Sensibilitate =AP(AP+FN) Probabilitatea unui test real + (1- β)

Specificitate =AN(AN+FP) Probabilitatea unui test real ndash (1- α)

Acurateţe =(AP+AN)n Probabilitatea generală a unei decizii corecte

Valoarea predictivă pozitivă =AP(AP+FP) Probabilitatea ca un test pozitiv să fie corect

Valoarea predictivă negativă =AN(AN+FN) Probabilitatea ca un test negativ să fie corect

Riscul relativ =AP(FP+AN)FN(AP+FP)

Rata şansei =(AP∙AN)(FN∙FP)

Riscul atribuabil =AP(AP+FP)-FN(FN+AN)

24

Denumire Formula

Rata falşilor pozitivi = 5(5+1) = 08334

Rata falşilor negativi = 7(7+16) = 03043

Sensibilitate = 1(1+7) = 01250

Specificitate = 16(16+5) = 07619

Acurateţe = (1+16)29 = 05862

Valoarea predictivă pozitivă = 1(1+5) = 01667

Valoarea predictivă negativă = 16(16+7) = 06957

Riscul relativ = 1(5+16)7(1+5) = 2142 = 050

Rata şansei = (1∙16)(7∙5) = 04571

Riscul atribuabil = 1(1+5)-7(7+16) = 01667-03043=-01376

Testarea asocierii icircn tabela de contingenţă

Testul χ2

Nu trebuie utilizat pentru eşantioane de volum mic

Testul este valid doar dacă valoarea expectată (aşteptată) pentru fiecare celulă este cel puţin

egală cu 1 şi frecvenţa absolută observată este de minim 5

Dacă aceste condiţii nu sunt icircndeplinite se aplică testul exact al lui Fisher (Fisherrsquos Exact Test)

Indică dacă cele două variabile sunt sau nu independente DAR NU cuantifică puterea asocierii

dintre ele

Problema S-a investigat icircntr-un studiu asocierea dintre obezitatea (ca factor de risc) şi bolile

cardio-vasculare la persoanele icircn etate (gt 60 ani) Din totalul de 620 persoane investigate s-au

identificat 150 persoane cu obezitate şi boală cardio-vasculară 230 persoane fără obezitate şi

fără boală cardio-vasculară şi 60 persoane fără obezitate dar cu boală cardio-vasculară Există

o asociere icircntre obezitate şi boala cardio-vasculară (df=1 α=005 χ2critic = 384)

Testul χ2 exemplu

H025

Nu există asociere icircntre obezitate şi bolile cardio-vasculare

Obezitatea şi bolile cardio-vasculare sunt independente

H1

Există asociere icircntre obezitate şi bolile cardio-vasculare

Obezitatea şi bolile cardio-vasculare sunt asociate

a = 005 pragul de semnificaţie al testului

urmează o lege cu (r-1)(c-1) grade de libertate

χ2 = parametrul testului χ2

fio = frecvenţa observată

fit = frecvenţa teoretică

Regiunea critică este [χα2 yen)

Pentru α = 005 χα2 = 384

OBSERVAT BCV+ BCV- Total

Obezitate + AP = 150 FP = 180 330

Obezitate - FN = 60 AN = 230 290

Total 210 410 620

TEORETIC BCV+ BCV- Total

Obezitate + = 330times210620 = 330times410620 330

Obezitate - = 290times210620 = 290times410620 290

Total 210 410 620

TEORETIC BCV+ BCV- Total

Obezitate + = 330times210620 = 330times410620 330

26

Obezitate - = 290times210620 = 290times410620 290

Total 210 410 620

TEORETIC BCV+ BCV-

Obezitate + = 112 = 218

Obezitate - = 98 = 192

Deoarece 4177Icirc[384 yen) se respinge H0 cu un risc de eroare de 5

Există asociere icircntre obezitate şi bolile cardio-vasculare

Testul Fisher

Corecţie a testului χ2

Valoarea p asociată parametrului ne dă probabilitatea ca valoarea observată de independenţă să fie

atribuită doar şansei

O valoare p mică indică că există alte cauze decacirct şansa influenţează rezultatul şi astfel cele două

variabile investigate nu sunt independente

Testul Fisher = dispersia corectată a factorului x dispersia corectată a factorilor reziduali

Icircn acest context regula adunării dispersiilor se poate scrie unde

este variaţia lui y pe seama variaţiei variabilei x

este variaţia lui y pe seama influenţei factorilor reziduali (neicircnregistraţi)

este variaţia totală a caracteristicii y

Testul Fisher empiric se calculează după formula

27

se compară cu Ftab pentru nx şi nz grade de libertate la un anumit prag de semnificaţie stabilit

Dacă Fc gt Ftab rezultă că variaţia factorului de grupare x este semnificativă pentru variaţia caracteristicii y

Testul z pentru proporţii

1 Compararea unei frecvenţe observate cu o frecvenţă teoretică

2 Testarea egalităţii a două frecvenţe

Testul z Compararea unei frecvenţe observate cu o frecvenţă teoretică

Scop Investigarea semnificaţiei diferenţei icircntre o frecvenţă teoretică p (icircntr-o populaţie) şi o frecvenţă

observată f pe un eşantion reprezentativ (variabilă calitativă (binare))

Condiţii de aplicare Testul este corect aplicat dacă numărul n al observaţiilor eşantionului este

suficient de mare (n∙p n∙(1-p)gt10

Parametrul

n = volumul eşantionului

Suntem interesaţi de investigarea prevalenţei hepatitei B la personalul care lucrează icircn laboratoarele

clinicilor de boli infecţioase din Transilvania Se ştie din studii anterioare că prevalenţa hepatitei B icircn

populaţia generală din Transilvania este de 9 S-a luat icircn studiu un eşantion de 100 persoane şi s-a

obţinut o prevalenţă a hepatitei B de 6 Există diferenţă semnificativă icircntre frecvenţa hepatitei B la

personalul care lucrează icircn laboratoarele spitalelor de boli infecţioase din Transilvania faţă de

populaţia generală

f = 006 p = 009 n = 100

Ipoteza nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat

faţă de frecvenţa hepatitei B icircn populaţia generală

Ipoteza alternativă test bilateral Există diferenţă semnificativă icircntre frecvenţa hepatitei B la

nivelul eşantionului şi prevalenţa hepatitei B icircn populaţia generală

f = 006 p = 009 n = 100

Pragul de semnificaţie a = 005

Regiunea critică test bilateral (-yen -196 ]Egrave[196 yen)

28

Concluzia testului

Deoarece parametrul statistic calculat al testului nu aparţine regiunii critice se acceptă ipoteza

nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat faţă de

frecvenţa hepatitei B icircn populaţia generală

Testul McNemar

Evaluarea dependenţei variabilelor calitative perechi (dorim să determinăm dacă o anumită

caracteristică este sau nu asociată cu o anumită patologie)

Identificăm n pacienţi care prezintă patologia de interes (eg Cancer bronho-pulmonar) şi n

pacienţi cu aceleaşi caracteristici ca şi primul grup dar care nu o prezintă

Martor = da Martor = nu

Caz = da a b

Caz = nu c d

Testul McNemar - exemplu fumat vs cancer

Martor = da Martor = nu

Cancer = da a = 2 b = 5

Cancer = nu c = 0 d = 3

29

χ2critic(α=005) = 384

32 lt 384 rarr acceptăm ipoteza nulă

Fumatul nu este icircn relaţie cu apariţia cancerului bronho-pulmonar

Inferenţa statistică pe date cantitative

Variabile cantitative continue

Testul z şi Student (t) (o medie sau medii perechi)

Testul z şi Student (t) (testarea a două medii)

ANOVA (ge 3 medii)

Ranguri (variabile cantitative discrete sau cantitative care nu icircndeplinesc condiţia de

normalitate)

Testul sumei rangurilor Wilcoxon

Kruskal-Wallis (ge 3 eşantioane independente)

Friedman (ge 3 eşantioane dependente)

Teste de normalitate variabile cantitative continue

Shapiro-Wilk

Kolmogorov-Smirnov

Shapiro-Wilk

Chi-Square Goodness-of-Fit

Dacă datele urmează o distribuţie normală aplicăm un test parametric

Dacă datele nu urmează o distribuţie normală aplicăm un test de comparare al rangurilor

30

Testul Z de comparare a mediei unui eşantion cu media unei populaţii

Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ

extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie

s2 care se cunoaşte

Condiţii de aplicare

1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru

compararea mediei unui eşantion cu media unei populaţii)

2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal

distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă

3 Talia eşantionului este mare ( ge 30)

Ipoteze

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media

eşantionului şi media populaţiei

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

(-yen -196 ] Egrave [196 yen)

Parametrul testului

n = volumul eşantionului

= media eşantionului

s = deviaţia standard a populaţiei

Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)

Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard

cunoscută

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi

media standard

Condiţii de aplicare

Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se

realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această

condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea

31

Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai

puternic

Numărul de grade de libertate (df) df = n-1

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

Parametrul testului

n = volumul eşantionului

micro0 = media standard

= media eşantionului

s = deviaţia standard a eşantionului

Testul ANOVA compararea mediilor a mai multe eşantioane

H0 = toate mediile sunt egale

H1 = nu toate mediile sunt egale

Condiţii de aplicare

1 Datele sunt independente unele faţă de celelalte

2 Datele fiecărui grup sunt normal distribuite

3 Deviaţia standard este aceeaşi pentru toate grupurile

Id Medicament

A B C D E F

1 5 6 7 10 5 9

2 6 8 8 11 8 8

3 7 7 9 13 6 7

4 8 9 11 12 4 5

32

5 9 10 10 9 7 6

Suma 35 40 45 55 30 35

Media 7 8 9 11 6 7

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =

= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)

Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2

F = (suma pătratelor(icircntre))(suma pătratelor(icircn))

Suma pătratelor (icircntre) = 16times5 = 80

Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60

Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn

interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare

SP df Media pătratelor F = MPicircntreMPicircn

Icircntre 80 5 = 805 = 16 = 1625 = 64

Icircn 60 24 = 6024 = 25

Total 140 29 -

Testul sumei rangurilor Wilcoxon

Aplicat pentru

Un set de observaţii provenite dintr-o valoare ipotetică comună

Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)

Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero

Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace

Suma rangurilor pentru diferenţele negative = 2+3+1 = 6

Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30

33

Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului

egal cu 8 = 0109

Icircnainte După Diferenţa Rang

64 66 -2 2

66 58 8 5

67 68 -1 3

71 65 6 4

72 75 -3 1

76 67 9 6

78 59 19 8

89 74 15 7

Testul Kruskal-Wallis (ge 3 eşantioane independente)

Test de ranguri aplicate pe mai mult de 3 eşantioane

H = parametrul testului

n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)

Tk = suma rangurilor

Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie

pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni

34

df = k-1 (k = numărul de eşantioane)

df = 3-1 = 2

Hcritic(α=005) = 599

H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie

pozitivă şi respectiv biopsie negativă

Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie

a tipului de studiu pe eşantioane perechi)

1 Definirea numărului de tratamente k

2 Obţinerea rangurilor pentru fiecare tratament

3 Sumarea rangurilor fiecărui tratament

4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)

5 Dacă Fr gt Frcritic rarr respingem H0

Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost

măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi

n = 9 k = 3 T12 = 225 T2

2 = 38025 T32 = 38025

Frcritic = 599

Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de

prostată

35

De reţinut

Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei

Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-

of-Fit

Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z

Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t

Compararea mediilor a 3 sau mai multe eşantioane ANOVA

Compararea mediilor a două populaţii (σ) testul Z

Compararea mediilor a două eşantioane (s) testul t

Compararea mediilor a două eşantioane perechi (s) testul t

ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi

cu cel pentru compararea a două eşantioane perechi

Ranguri

Distribuţia datelor nu are importanţă

Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)

Trei sau mai multe eşantioane Kruskal-Wallis

Trei sau mai multe eşantioane perechi Friedman

Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia

Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a

datelor)

Variabile nominale

Un singur eşantion sau eşantioane perechi

Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte

Eşantioane perechi testul Mc Nemar

Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2

Icircn analiza proporţiilor există teste diferite pentru

Compararea unei frecvenţe cu o frecvenţă cunoscută

Compararea a două frecvenţe

Semnificaţia statistică

Valoarea p (p value)

Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor

două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E

posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării

aleatorii

36

Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală

urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii

Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este

probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un

experiment de dimensiunea acestuia

Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că

diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii

diferite

Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca

fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă

ar fi fost adevărată

Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă

1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe

baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De

fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001

2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie

3 Se aplică testul statistic aferent pentru a calcula valoarea p

4 Se compară valoarea p cu valoarea ndash prag

5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe

semnificativă dpdv statisticrdquo

6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e

semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să

conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă

Teste de semnificaţie

Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului

populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)

Testarea ipotezelor implică posibile erori

Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile

sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui

grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul

icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005

ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există

37

nici o diferenţă

Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ

statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de

ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost

ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau

dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă

cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă

semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe

ipotetice variate icircn cazul icircn care ele există

Măsuri ale frecvenţei

Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)

Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate

Generic formula pe care se bazează toate cele trei este

unde x şi y sunt cantităţile de comparat

Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea

unei frecvenţe pe grupe de sex vacircrstă etc

Proporţia implică icircn mod necesar ca x să fie inclus icircn y

Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară

frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp

Pentru calcularea unei rate trebuie ţinut cont de trei aspecte

bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin

bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp

bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo

Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un

tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei

populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei

aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)

38

Indicatori

Rata de incidenţă

Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă

icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii

Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o

perioadă de timp

Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de

timp x

Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei

susceptibili de a dezvolta icircmbolnăvirea studiată

Numitorul poate fi

bull Numărul mediu al populaţiei icircn perioada de timp studiată

bull Mărimea populaţiei icircn mijlocul perioadei de studiu

bull Mărimea populaţiei la icircnceputul studiului

Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă

Este obligatorie menţionarea perioadei de timp

Prevalenţa

Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la

un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă

schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa

momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)

39

Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include

numai cazuri noi respectiv include cazuri noi şi vechi

Rata de atac

Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este

folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp

raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori

Rata persoană-timp

Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din

momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte

migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost

observate

Riscul relativ (RR)

Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment

legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele

prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două

grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la

bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la

bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai

mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo

Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2

Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn

cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă

(Tabelul 1)

Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR

Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la

neexpuşi

40

Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de

culegere a datelor

Odds ratio (OR)

Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin

raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general

studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)

Tabelul 2 Tabelul 2 x 2 pentru calcularea OR

Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală

Rate de mortalitate

Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp

specificată Există mai multe tipuri de rate de mortalitate

o Mortalitate specifică pe sex

o Mortalitate specifică pe rasă

o Mortalitate specifică pe boală

o Mortalitate neonatală

o Mortalitate postneonatală

o Mortalitate infantilă

o Mortalitate maternă

Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP

41

Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de

viaţă şi vacircrsta la care survine decesul dacă este prematur

Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu

Ani de viaţă pierduţi datorat dizabilităţii

Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt

utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru

cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite

grupuri

Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de

risc şi o boală se folosesc riscul relativ şi odds ratio

35 Analiza şi interpretarea datelor

După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date

trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul

Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor

colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului

studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu

plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde

prezenţa biostatisticianului este necesară

Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu

elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat

iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului

iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate

depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori

testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere

clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza

Interpretarea rezultatelor statistice

Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne

motive (număr mic de date) acceptarea ei să fie falsă

Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine

gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia

ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument

de decizie Intervalul de confidenţă

42

Interpretarea statistica ne interpretarea clinică

Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă

Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice

obţinute pe eşantionul studiat

Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare

Ce interpretăm Rezultatele

personale obţinute icircn urma studiului

care au fost prezentate icircn secţiunea bdquoRezultaterdquo

Explicăm rezultatele obţinute

Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale

Interpretarea trebuie să se realizeze icircn

lumina limitelor studiului

contextul cultural social şi educaţional al locului unde s-a realizat cercetarea

contextul a ceea ce se cunoaşte din literatura de specialitate

Interpretăm doar rezultatele personale obţinute icircn urma studiului

Interpretarea statistică nu este tot una cu interpretarea clinică

Interpretarea statistică este importantă

Interpretarea clinică este foarte importantă

Intervalul de confidenţă

Media calculată pe baza unui eşantion nu va echivala media populaţiei

Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului

Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a

populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a

populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)

pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru

orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare

dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de

confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de

date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de

5

Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel

Dacă valoarea p este mică

Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare

aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o

medie diferită Diferenţa este semnificativă dpdv statistic

43

Icircn continuare

Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa

reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică

pentru a fi interesante din punct de vedere ştiinţific

Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC

oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care

este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a

obţine o concluzie clară

Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o

diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că

datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din

punct de vedere ştiinţific

Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul

detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat

Erorile studiilor medicale

Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura

anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară

caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea

asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri

legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias

Erorile potenţiale icircn studiile epidemiologice

1 Erori icircntacircmplătoare

2 Erori sistematice

3 Confuzia

4 Validitatea

1 Erori icircntacircmplătoare

Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a

parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel

de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot

fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii

(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor

de măsură (eroarea de măsurare)

44

2 Erori sistematice

Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate

care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu

acurateţe mare Acurateţea nu este afectată de mărimea eşantionului

Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de

experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea

dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus

şi greu de cuantificat (consum de alcool personalitate etc)

Principalele tipuri de erori din această categorie sunt

bull Biasul de selecţie

bull Biasul de informaţie

Biasul de selecţie

Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul

trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion

inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale

persoanelor incluse

Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se

ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia

Biasul de informaţie

Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de

instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze

expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere

nesemnificativă sau chiar să nu şi-o amintească de loc

3 Confuzia

Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune

prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este

cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă

de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte

important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor

protector

4 Validitatea

Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă

Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte

estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional

Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă

45

conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se

demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)

Validitatea externă se poate realiza numai dacă studiul este valid intern

Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii

studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de

studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt

laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi

validă din punct de vedere intern)

3 6 Prezentarea rezultatelor

După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite

Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor

icircntr-o formă bdquodigerabilărdquo este necesară

Scopul prezentării datelor

1 Transmiterea concluziilor studiului

a Datele corecte şi importante merită comunicate

b Datele trebuie să confirme sau să infirme ipoteza studiului

c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală

2 Acordarea posibilităţii altor cercetători să aprecieze studiul

a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti

b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor

prezentate

Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru

fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie

statistică

Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de

valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras

(Tabel 3)

Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)

46

Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct

numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor

precum şi prezentarea acestora sub formă inteligibilă

Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care

convin cercetătorului

Prezentarea datelor se poate face

1 Figuri şi tabele icircn articole scrise

2 Figuri şi tabele icircn prezentări orale

3 Figuri şi tabele icircn postere

4 Text scris sau incluse icircn text

5 Site-uri de WEB

Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor

Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie

Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele

exprimacircnd exact ceea ce acestea exprimă

Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate

anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel

să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se

acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca

mai sus sugestive sunt formatele simple şi puţin icircncărcate

Dacă nu există reguli impuse se respectă

1 Mesaj simplu fără falsificarea datelor

2 De obicei este necesar atacirct tabelul cacirct şi graficul

3 Să fie simplu şi clar

Tabele

Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile

coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică

elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de

1 Se folosesc doar linii orizontale

2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn

evidenţi prin linie de separare (Tabelul 4)

Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland

Noua Zeelandă)

(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)

47

3 Numerele sunt aliniate icircn funcţie de virgulă

4 Indicii statistici sunt explicaţi sub tabel

5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană

6 Abrevierile pot fi folosite

7 Numărul de zecimale trebuie limitat la maxim două

8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel

9 Plasarea legendei este obligatorie sub tabel

10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)

Icircn cazul prezentărilor orale sau a posterelor este indicat ca

1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării

2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte

3 Folosirea de simboluri este permisă

Clasificarea tabelelor

Tabelele se clasifică după

i) conţinut

bull cu distribuţii de frecvenţe

bull de clase de frecvenţe

bull de contingenţă

ii) structura

bull cu doua coloane

bull cu subclasificări

bull ldquomasterrdquo

Tabele ce conţin distribuţii de frecvenţe

O modalitate comodă de a prezenta o mulţime de date brute este

1 Se ordonează datele in ordine crescătoare

2 Se determine frecvenţa fiecărei valori

3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane

(Tabelul 5)

Tabelul 5 Distribuţii de frecvenţă absolută

48

Tabelul claselor de frecvenţe

1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă

2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)

Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)

Tabele de contingenţă

1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a

tabelelor de contingenţă

2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a

combinaţiilor de perechi ordonate de valori

3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre

a factor de risc si

b starea sănătăţii

4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)

5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)

Tabelul 7 Tabel de contingenţă 2 x 2

49

Grafice

Există două categorii de moduri grafice sub care se pot prezenta datele

1 Ilustraţii şi fotografii

2 Grafice

1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă

pentru lucrare

2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit

Putem vorbi despre mai multe tipuri de grafice

bull Grafice pentru reprezentarea datelor cantitative

1048707 Grafic cartezian (X Y)

1048707 Histograma

1048707 Poligonul de frecvenţe

1048707 Diagrama bdquoscatterrdquo

bull Grafice pentru reprezentarea datelor calitative

1048707 Grafic cu bare

1048707 Diagrama tip bdquoboxplotrdquo

1048707 Diagrama bdquopierdquo

1048707 Cartograma

Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi

dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)

Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)

Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie

Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)

Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)

50

Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir

de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele

două variabile studiate (Figura 6)

Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2

(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2

rămacircne aproximativ constantă)

Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea

comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea

comparativă a mai multor variabile

Figura 7 Grafic calitativ cu bare

51

Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo

Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două

posibilităţi reprezentate grafic este mai frecventă (Figura 8)

Figura 8 Reprezentare tip bdquopierdquo

Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli

sau a oricărui element comparativ Se foloseşte de epidemiologi

Rezultate

Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare

Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o

manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu

explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția

bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la

ilustraţii tabele grafice

Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi

nici rezultatele care invalidează eventual ipoteza

Discuţii

Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd

cultura ştiinţifică şi inteligenţa autorilor

Acest capitol răspunde la trei obiective

Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia

calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de

selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează

rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv

52

este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn

care a fost abordată problema fără a face o revistă a literaturii

Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea

rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul

Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor

afirmaţii nesusţinute de conţinutul lucrării

Concluzii

Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate

să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie

Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de

concluzii va scădea valoarea lucrării

Bibliografia (lista referinţelor citarea icircn text)

Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn

lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente

Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli

- să conţină cele mai importante şi recente lucrări

- să includă numai lucrări publicate

- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate

Bibliografie

Elisabeta Jaba ndash Statistică Ed Economică 1998

Mihai Ţarcă ndash Statistică volI Ed UAIC 1979

Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale

Ed University Press 2009

Sorana Daniela Bolboacă ndash Metodologia cercetării curs

53

Page 10: cercetarea medicala - metodologie

bull Un studiu pe icircntreaga populaţie poate distruge populaţia

bull Eşantioanele pot fi studiate mai rapid

bull Costul şi resursele necesare studiului sunt mai reduse

Numărul elementelor dintr-un eşantion se numeşte talia sau volumul selecţiei

Acesta fiind icircn general mai mic decacirct icircntreaga populaţie poate fi observat icircn detaliu iar dacă este reprezentativ

se pot afla prin intermediul său proprietăţile populaţiei ţintă

Eşantionul trebuie să fie reprezentativ pentru populaţia generală De aceea dintre metodele de eşantionare se

folosesc tehnicile de randomizare Trebuie să satisfacă două condiţii principale

bull condiţie de ordin cantitativ talia să fie suficient de mare

bull condiţie de ordin calitativ trebuie extras aleator din populaţia ţintă

Metode de eşantionare

Putem vorbi icircn linii mari de două posibilităţi de eşantionare prin metode probabilistice şi prin metode

nonprobabilistice

Eşantionarea probabilistică este metoda cea mai folosită icircn studiile medicale fiind şi cea indicată pentru a

realiza reprezentativitatea calitativă

Icircn medicină se folosesc patru tipuri de eşantionări

1 Simplu randomizat

2 Sistematic

3 Stratificat

4 Cluster (icircn cuiburi)

1 Eşantionul simplu randomizat Fiecare element din populaţia ţintă are o şansă egală non zero de a fi

inclus icircn eşantion Se ia la icircntacircmplare un număr de elemente egal cu talia eşantionului Dezavantajul acestui tip

de eşantionare este că presupune cunoaşterea icircntregii populaţii ţintă

2 Eşantionul sistematic După aflarea taliei eşantionului şi a populaţiei ţintă se calculează factorul de

eşantionare k icircmpărţind talia populaţiei ţintă la volumul eşantionului Apoi fiecare al k-lea element este

selectat spre includere

Acelaşi mare dezavantaj apare şi icircn acest caz fiind obligatorie cunoaşterea icircntregii populaţii de studiu

3 Eşantionul stratificat Există icircn cele mai multe cazuri probleme medicale care studiindu-se pe eşantion

prezintă variabilităţi icircn funcţie de caracteristicile populaţiei (sex vacircrstă nivel de pregătire etc) Icircn acest caz

este obligatorie realizarea similitudinii demografice a eşantionului cu populaţia de studiu Din date provenite

de la Centrul de Statistică putem dezvolta ca procente o structură a populaţiei Această structură trebuie să se

regăsească (procentual) şi icircntre membrii eşantionului O importantă şansă ca reprezentativitatea calitativă să fie

corectă este conferită de respectarea

acestei similitudini demografice

10

4 Eşantionul bdquoclusterrdquo sau icircn cuiburi Icircn cazul unui studiu amplu cu scop de a investiga populaţia unei

icircntregi ţări sau regiuni putem ajunge icircn imposibilitatea de a alege şi mai ales investiga indivizi răspacircndiţi prin

icircntreaga zonă Din acest motiv se desemnează la icircntacircmplare un număr calculabil de

grupuri populaţionale extinse icircn toată zona de studiu Aceste grupuri poartă numele de bdquocuiburirdquo La nivelul

fiecărui bdquocuibrdquo se aplică o tehnică precedentă de selecţie a cazurilor Se poate sau de cele mai multe ori se face

la nivel de bdquocuibrdquo stratificarea iar apoi selecţia propriu-zisă se realizează sistematic sau simplu randomizat

Este metoda de eşantionare cel mai frecvent utilizată icircn cercetarea medicală de amploare Pentru ca eventualele

erori să nu se poată strecura s-a definit şi un indice DEF (design effect) cu care trebuie multiplicată talia

selecţiei care pentru eşantionarea icircn bdquocuiburirdquo este egal cu 2 astfel putem obţine şi o reprezentativitate

calitativă dar şi una cantitativă

Eşantionarea nonprobabilistică este o metodă neindicată icircn studiile medicale datorită lipsei de forţă icircn ceea ce

priveşte posibilitatea de aplicare a concluziilor asupra populaţiei de studiu

Se definesc şi icircn acest caz patru metode

1 Eşantion de convenienţă Membrii unui astfel de eşantion sunt aleşi numai pentru că sunt la icircndemacircnă

disponibili de a răspunde le un eventual chestionar

2 Eşantion pe cote Similar cu tipul de eşantion stratificat se referă la faptul că selecţia se face formacircnd

eşantionul din primele 30 de persoane care respectă un criteriu impus

3 Eşantion cu un scop Elementele incluse icircn eşantion sunt alese după un criteriu care exclude din start marea

majoritate a populaţiei

4 Eşantion raţional Selecţia se face prin prisma unui raţionament al celui care conduce studiul

Parametru şi estimator

Parametrul este o valoare de obicei necunoscută (şi care trebuie să fie estimată prin studiu) folosită pentru a

reprezenta o anumită caracteristică a populaţiei de studiu De exemplu media populaţiei (icircnălţime) este un

parametru populaţional Raportat la o populaţie parametrul este o valoare fixă şi exactă care nu variază

Fiecare eşantion extras din populaţie va indica o valoare a mediei care nu poate decacirct să estimeze parametrul

Icircn general parametrii sunt notaţi cu litere greceşti (ex Media = μ)

Estimatorul este o valoare calculată dintr-un eşantion studiat Este folosit pentru a putea aprecia parametrul

populaţional pe care icircn căutăm Este de asemenea posibil ca dintr-o populaţie să formăm mai multe eşantioane

mediile lor de cele mai multe ori nefiind identice icircntre ele şi nici identice cu media populaţiei Estimatorii

sunt notaţi cu litere latine (ex Media = μ)

Dacă valoarea mediei calculată pe eşantion este de exemplu 168 cm atunci putem estima ca valoarea mediei

icircn populaţie este 168 cm

11

Tipuri de culegere a datelor

1 Culegere de tip eşantion reprezentativ Grupul de indivizi incluşi icircn studiu sunt reprezentativi (calitativ şi

cantitativ) pentru populaţia generală Poate fi utilizat pentru studii descriptive (cel mai frecvent) dar uneori şi

pentru studii analitice

Este necesar pentru acest tip de culegere a datelor ca iniţial să fie cunoscută talia eşantionului (calculabilă icircn

funcţie de prevalenţă şi precizie) Pentru evaluarea datelor culese se utilizează tabelul de contingenţă 2 x 2

astfel (Figura 1)

Figura 1 - Tabelul de contingenţă 2 x 2

Unde

a ndash persoane expuse unui factor de risc care au boala studiată

b ndash persoane expuse unui factor de risc care nu au boala studiată

c - persoane neexpuse unui factor de risc care au boala studiată

d - persoane neexpuse unui factor de risc care nu au boala studiată

După aranjarea datelor icircn tabelul de contingenţă (2 x 2) se poate icircncepe analiza statistică a datelor atacirct ca

procente calculabile cacirct şi din punct de vedere a aplicării de teste statistice pentru elucidarea semnificaţiei

statistice

Este posibilă din acest tip de culegere de date calcularea

1 Prevalenţei unei boli

2 Frecvenţei expunerii

3 Gradul de asociere icircntre factorul eventual de risc şi boala

2 Culegerea de tip expus ndash neexpus Icircmparte subiecţii icircn două categorii expuşi sau neexpuşi factorului de risc

studiat Ca evoluţie următoare a studiului după o astfel de culegere a datelor se poate evalua icircn timp apariţia

icircmbolnăvirii despre care se efectuează studiul Icircn timp longitudinal prospectiv se poate calcula dacă factorul

studiat reprezintă un risc de icircmbolnăvire este indiferent sau chiar este cu efect protectiv Numărul subiecţilor

din cele două grupuri poate fi egal sau poate fi diferit Numărul acestora poate fi calculat icircn vederea obţinerii

unei bune reprezentativităţi cu ajutorul formulelor de selecţie Avacircnd icircn vedere calitatea longitudinală a

12

studiului este important ca numărul ales să fie mai mare pentru a putea suplinii eventualele pierderi din

urmărire Practic rezultatele sunt introduse icircn tabelul 2 x 2 de unde se pot calcula indicatorii doriţi (Figura 2)

Avacircnd icircn vedere modul de culegere a datelor este permisă calcularea de indicatori numai pe orizontală

orice comparare icircntre coloana dreaptă şi stacircngă fiind incorectă Avantajul acestui tip de culegere a datelor ar fi

eventualul număr mai redus de subiecţi dar dezavantajul major este cel al costurilor de urmărire icircn timp dar

trebuie luată icircn calcul şi pierderea de subiecţi din evidenţe Factorul controlat este deci prezenţa expunerii iar

factorul aleator este prezenţa bolii

Figura 2 Tabelul de contingenţă pentru tipul de culegere expus ndash neexpus

4 Culegerea de tip caz ndash martor Icircn acest caz ceea ce ghidează colectarea datelor este prezenţa sau absenţa

bolii icircn momentul prezent Se vor culege date de la două loturi constituite după criteriul de bolnav B+ şi de fără

boală B+ Datele culese sunt icircn trecut deci caracterul datelor va fi retrospectiv Icircn acest caz factorul controlat

este boala factorul aleator fiind expunerea (Figura 3)

Calculul de indicatori icircn acest caz se va putea efectua numai icircntre coloane orice calcul icircntre valorile de pe linii

fiind greşit Rezultate semnificative se pot obţine icircn acest caz utilizacircnd loturi mai mici de studiu prin

comparaţie cu tipul eşantion reprezentativ permiţacircnd icircn acelaşi timp studiul bolilor rare (cu prevalenţă mică)

Figura 3 Tabelul de contingenţă pentru tipul de culegere caz ndash martor

Metode de culegere a datelor

Metoda aleasă pentru culegerea datelor trebuie să fie aleasă după un atent studiu bibliografic icircn vederea

stabilirii celui mai eficient mod de a răspunde temei de studiu

Metodele de culegere trebuie să fie bine aplicabile şi consistente ca aport informaţional necesar

13

1 Fiziologice Sunt colectate date despre anumite caracteristici fiziologice ale pacienţilor (TA glicemie

colesterol etc) Această metodă aduce rezultate obiective cacirct timp instrumentul de evaluare este bine calibrat

şi prezintă variaţii mici

2 Metode observaţionale Instrumentul de culegere a datelor trebuie să fie sincronizat cu protocolul conceput

de cercetător Datele culese trebuie să fie de asemenea consistente adică să fie colectate de aceeaşi manieră

conducătorul studiului trebuind să instruiască investigatorii (colectorii de date) Icircnregistrarea datelor trebuie să

fie de asemenea sistematică şi bine standardizată Observaţii de control trebuie icircn mod obligatoriu făcute

pentru a putea aprecia icircn mod corect orice deviere datorată unor factorii externi Este obligatorie luarea icircn

consideraţie a aspectelor etice

3 Interviul Poate fi structurat cu un set specific de icircntrebări sau nestructurat cu o temă generală cu care se

icircncepe interviul Interviurile pot fi icircnregistrate sau intervievatorul poate nota pur şi simplu răspunsurile Există

două tipuri generice de interviu interviul de profunzime care se referă la o discuţie icircn general structurată cu

un număr de icircntrebări prestabilite icircn icircncăperea de studiu fiind doară intervievatorul şi persoana chestionată şi

interviul de grup unde prin conversaţii pornind de la temă generală expusă şi condusă de intervievator se

obţin date despre subiecţii participanţi la studiu Ambele metode de interviu au indicaţiile lor precise Un

interviu pe teme intime nu va putea fi corect icircn ceea ce priveşte datele colectate dacă se aplică un interviu de

grup

4 Chestionarul Document scris adresat unor persoane pentru a răspunde la una sau mai multe icircntrebări

Trebuie să aducă răspunsurile la icircntrebările care motivează studiul constituind ansamblul icircntrebărilor destinate

culegerii de informaţii (date) Redactarea chestionarului trebuie să ţină cont de structura acestuia introducere

conţinut exprimarea icircntrebărilor grafica chestionarului

5 Icircnregistrări preexistente

Icircn cercetarea medicală sunt cel mai frecvent utilizate Informaţiile dorite sunt deja existente ceea ce icirci revine

cercetătorului este ca să structureze datele icircn funcţie de scopul studiului pe care icircn conduce Aceste surse sunt

bull Foi de observaţie

bull Registre de consultaţie

bull Buletine de analize

bull Registre de operaţii

Icircn cazul icircn care nici o metodă de culegere a datelor nu este pe placul celui ce conduce studiul există

posibilitatea de a construi un instrument nou de culegere a datelor

Acest proces trebuie să urmărească nişte paşi obligatorii fiind mare consumator de timp

bull Definirea structurii cu care se va face măsurarea

bull Formularea itemilor de măsură

bull Analiza validităţii instrumentului de măsură ndash măsoară acesta fenomenul corect

bull Elaborarea de instrucţiuni de utilizare pentru investigatori

14

bull Pretestarea instrumentului

bull Aprecierea validităţii interne şi externe a datelor culese

Instrumente de cercetare

Formularea clară a temei de cercetare necesită o foarte bună definire a factorilor studiaţi şi a criteriilor de

judecată Acestea din urmă sunt ultimele care vor trebui definite icircn cadrul protocolului de studiu

Alegerea unui instrument de măsură

Nu există un instrument de măsură perfect sau universal corect Alegerea sa dintre cele existente şi cele deja

utilizate depind de trei factori

bull Obiectivul studiului

bull Boala studiată

bull Populaţia icircn studiu

De aceste trei elemente trebuie ţinut cont icircn fiecare etapă a dezvoltării instrumentului

Definirea obiectivului

Studiu transversal Dacă se doreşte studierea unui simptom sau a unei caracteristici ale populaţiei se poate

icircmpărţi populaţia de studiu icircn mai multe grupuri Este practic vorba de a determina diferenţele dintre subiecţi

icircn cea ce priveşte o variabilă necesară studiată printr-un studiu transversal (utilizarea dozării de Ac HBS

pentru a evalua progresele bolnavilor de hepatită tip B)

Studiu longitudinal Icircn acest caz nu se poate icircmpărţii populaţia de studiu icircn mai multe grupuri datele obţinute

fiind de la acelaşi subiect colectate după un interval de timp

Icircn funcţie de boală şi populaţie se aleg şi instrumentele de măsură cele mai adecvate

Instrumentele cercetării reprezintă un mecanism specific sau o strategie pe care cercetătorul o utilizează pentru

colectarea prelucrarea şi inferenţa datelor Aceste instrumente sunt

1 Studiul icircn bibliotecă

2 Computerul

3 Determinările experimentale

4 Statistica

5 Mintea umană

6 Facilităţi de limbaj şi comunicare

Determinările experimentale

Măsurarea constă icircn aprecierea şi cuantificarea fenomenelor calitativ sau cantitativ Interpretarea

datelor se referă la transformarea lor icircn unităţi de descoperire a unor fenomene mai puţin cercetate

Standardele acceptate se referă la norme medii distribuţii etc Tot icircn cadrul interpretării datelor datele

obţinute sunt caracterizate pe scale de valori nominal ordinal de interval sau de raport

Validarea şi reproductibilitatea măsurătorilor sunt aspecte importante şi foarte necesare pentru o

cercetare corect fundamentată care doreşte obţinerea unor concluzii pertinente

15

Statistica Este implicată icircn condensarea şi procesarea unui volum mai mare de date astfel icircncacirct să se poată

interpreta corect valorile obţinute şi să se permită comparările Utilizarea unor teste statistice specifice permite

determinarea semnificaţiei (diferenţei) statistice astfel icircncacirct estimatorii să poată fi aplicaţi la populaţia

generală Furnizează informaţii şi privind corelarea sau relaţionarea icircntre date

Mintea umană este cea care reuşeşte să integreze şi să icircnţeleagă rezultatele obţinute Semnificaţia ştiinţifică

este stabilită icircn funcţie de rezultatele statisticii de mintea umană conform afirmaţiei bdquosemnificaţia ştiinţifică

nu este egală cu semnificaţia statisticărdquo Metodele aplicate pentru a putea ajunge la o concluzie pertinentă sunt

logica deductivă raţionamentul inductiv şi gacircndirea critică

Limbaj şi comunicare Exprimarea orală sau icircn scris permite nuanţarea unor aspecte seci cifrice ale unor

studii Icircn acest mod devine mai evidentă semnificaţia ştiinţifică a unor rezultate statistice

34 Prelucrarea datelor

Instrumentele de prelucrare

Statistica este o ştiinţă ramură a matematicii care studiază evoluţia fenomenelor şi proceselor

colective pe baza observării lor ştiinţifice a culegerii şi prelucrării detaliate a informaţiilor statistice cu scopul

de a formula şi explica legile legităţile şi regularităţile ce le guvernează

Statistica permite deci aprecierea unor parametrii populaţionali prin studiul unui număr redus de

elemente ale populaţiei icircn studiu (ţintă) O populaţie poate fi definită printr-un şir de valori care pot fi grupate

icircn funcţie de parametrul studiat (glicemie colesterol TAD TAS etc) Pentru fiecare astfel de şir se defineşte

o variabilă (care va purta nume propriu glicemie colesterol etc) Practic variabila este considerată o funcţie

ia valori posibil diferite de la un element la altul icircn funcţie de caracteristicile proprii acestora Sunt clasificate

icircn două grupe variabile cantitative (caracteristică măsurabilă) şi calitative (caracteristică ce nu poate fi

măsurată)

La racircndul lor variabilele calitative pot fi

bull Nominale ndash grupuri de elemente ce nu pot fi ordonate (culoarea părului)

bull Nominale ordonate ndash concluziile pot fi grupate (eficienţa unui tratament slabă bună foarte bună)

bull Binare ndash apar numai două posibilităţi (bolnav sănătos)

Variabilele cantitative pot fi

bull Continue ndash o variabilă măsurabilă care poate lua o infinitate de valori

bull Discrete ndash variabile care nu pot lua decacirct valori icircntregi

Statistica descriptivă

Există două ramuri ale statisticii statistica descriptivă şi statistica inferenţială

Statistica descriptivă (după cum rezultă din denumire) se ocupă cu descrierea unor valori obţinute ale unei

variabile studiate

16

Valorile pe care variabila le ia se constituie icircntr-o serie statistică Indicatorii care definesc o variabilă (serie)

sunt

1 Ale tendinţei centrale

Media aritmetică - notată de regulă cu

Mediana - este acea valoare din şirul de date care icircmparte icircn două părţi egale şirul ordonat de valori (atenţie

şirul este ordonat crescător) situacircndu-se la mijlocul seriei statistice

Dacă numărul de valori n este un număr impar atunci mediana este valoarea unde

Dacă n este par deci avem un număr par de valori mediana este definitatilde ca fiind

unde k = n2

Modul - constituie valoarea care apare cel mai des deci valoarea cu numărul cel mai mare de apariţii

2 De dispersie

Amplitudinea - este diferenţa dintre valoarea maximă şi cea minimă

A = Amax - Amin

Amplitudinea relativă - notată A este raportul dintre amplitudinea absolută şi media aritmetică a seriei de

date

Varianţa notată este un indicator de icircmprăştiere a datelor Formula de calcul este

Abaterea standard (S) sau deviaţia standard reprezintă rădăcina pătrată din varianţă (dispersie)

Coeficientul de variaţie se calculează ca un raport procentual icircntre abaterea standard şi valoarea medie a şirului

de valori

Eroarea standard intervine icircn estimarea intervalelor de confidenţă Se calculează astfel

17

3 De asimetrie (skewness) indică distribuţia datelor dacă sunt sau nu distribuite normal

4 De boltire (kurtosis) estimează boltirea sau aplatizarea curbei de distribuţie

Prezentarea descriptivă a datelor se face prin icircnregistrarea datelor culese icircn tabele care să reprezinte icircn mod

sintetic valorile măsurate

Icircn concluzie statistica descriptivă permite

bull Stabilirea comparabilităţii icircntre grupurile de studiu şi aprecierea prezenţei erorilor sau confuziei

bull Reprezentarea datelor icircn tabele permite evaluarea fiecărui pacient şi dacă a existat pierderi din studiu

Statistica inferenţială

Statistica inferenţială (inductivă) este partea de analiză a datelor care permite extrapolarea unei

concluzii trase pe baza unui eşantion spre populaţia ţintă pentru care a fost efectuat studiul

Scopul analizei statistice este de a evidenţia efectul unui tratament sau al unui factor de risc prin date obţinute

din eşantionul studiat spre populaţia ţintă Aceasta implică testarea ipotezelor statistice sau altfel spus testarea

semnificaţiei statistice Este una dintre cele mai importante momente ale studiului Cum rezultatele sunt

obţinute prin studiul unui eşantion există posibilitatea ca acestea să fie datorate icircntacircmplării Testele

statistice ne ajută să apreciem icircn ce măsură rezultatele sunt icircntacircmplătoare şi mai ales icircn ce măsură şi dacă se

pot aplica populaţiei generale Icircn acest scop se impune o valoare limită alfa 005 care reprezintă limita

superioară a probabilităţii ca rezultatul obţinut să fie greşit (datorat icircntacircmplării) Astfel icircn funcţie de tipul

variabilelor şi indicatorii descriptivi aplicaţi şi evaluaţi se aplică teste de semnificaţie statistică (Tabelul 1)

Tabelul 1 Alegerea testelor de semnificaţie statistică

Tipul datelor

18

Diferenţierea variabilelor din punctul de vedere a distribuţiei se face folosind testul de normalitate

Kolmogorov ndash Smirnov

Testul statistic reprezintă metoda de comparaţie a două sau mai multe populaţii prin intermediul unor

variabile observate ale lor

Scopul unui test statistic este de a defini realitatea

Definirea icircntrebării de cercetare (ipoteza clinică)

Tratamentul cu Nebivolol este la fel de eficient ca şi cel cu Valsartan icircn tratamentul

hipertensiunii arteriale

Transpunerea icircntrebării de cercetare icircn termeni statistici (ipoteza statistică)

Media tensiunii arteriale a pacienţilor trataţi cu Valsartan nu diferă semnificativ de media

tensiunii arteriale a pacienţilor trataţi cu Nebivolol

Etapele unui test statistic

1 Formularea problemei icircn termenii ipotezelor statistice

2 Alegerea şi calcularea parametrului statistic al testului

3 Regiunea critică

4 Concluzia testului

1 Formularea problemei icircn termenii ipotezelor statistice

Ipoteza nulă ipoteza care trebuie testată testul efectuacircndu-se sub prezumţia că ipoteza nulă ar

fi adevărată

Ipoteza alternativă acea ipoteză care icircntr-un sens sau altul contrazice ipoteza nulă Această

ipoteză se mai numeşte şi ipoteza de lucru

Ipoteza nulă tipuri

O coadă (ldquoone-tailedrdquo sau ldquoone-siderdquo)

Media este mai mare

Media este mai mică

Două cozi (ldquoone-tailedrdquo sau ldquoone-siderdquo)

Media este egală

2 Alegerea şi calcularea parametrului statistic al testului

Parametrul statistic al testului exprimă icircntr-o anumită formă diferenţa dintre elementele comparate

Ţinacircnd seama de faptul că eşantionul sau eşantioanele utilizate sunt aleator extrase din populaţiile care

fac obiectul testului parametrul statistic este o variabilă aleatoare de selecţie care urmează o anumită

lege de probabilitate

Un parametru statistic al testului bun trebuie să icircndeplinească două condiţii

19

Trebuie să se comporte diferit atunci cacircnd ipoteza nulă H0 este adevărată faţă de situaţia icircn

care ipoteza alternativă H1 este adevărată

Distribuţia de probabilitate a parametrului statistic al testului sub prezumţia că H0 este

adevărată este cunoscută

3 Regiunea critică

- Trebuie să fim capabili să decidem icircn funcţie de valoarea parametrului statistic calculat care dintre

ipoteze cea nulă sau cea alternativă este adevărată

- Dacă valoarea parametrului statistic aparţine regiunii critice ipoteza nulă H0 va fi respinsă şi va fi

acceptată ipoteza alternativă H1

- Dacă valoarea parametrului statistic nu aparţine regiunii critice ipoteza nulă H0 va fi acceptată

- Decidem mărimea regiunii critice

Pentru aceasta trebuie să specificăm mărimea riscului de eroare pe care icircl acceptăm

Pe scurt definim nivelul de semnificaţie notat cu a sau mărimea riscului pe care

suntem dispuşi să ni-l asumăm icircn respingerea ipotezei nule H0 icircn cazul icircn care aceasta

este adevărată De obicei se alege un nivel de semnificaţie icircntre 1 şi 5

Probabilitatea unei erori de tipul I

probabilitatea de respingere a ipotezei nule H0 icircn favoarea ipotezei alternative H1 icircn

condiţiile icircn care H0 este adevărată

probabilitatea unei erori de tipul I se notează cu a şi se mai numeşte nivel de

semnificaţie al testului

Probabilitatea unei erori de tipul II

probabilitatea acceptării ipotezei nule icircn condiţiile icircn care ipoteza alternativă H1 este

adevărată

această probabilitate se notează cu b

- Unilaterală la dreapta ndash valoarea parametrului statistic al testului este mai mare sau egală cu

valoarea din dreapta a intervalului critic

- Unilaterală la stacircnga ndash valoarea parametrului statistic al testului este mai mică sau egală cu

valoarea din stacircnga a intervalului critic

- Bilaterală ndash valoarea parametrului statistic al testului este mai mică sau egală cu valoarea extremă

din stacircnga regiunii critice sau mai mare sau egală cu valoarea extremă din dreapta regiunii critice

valorile extreme ale regiunii critice avacircnd nivele egale de semnificaţie

4 Concluzia testului

- Ipoteza nulă H0 este respinsă dacă valoarea parametrului statistic aparţine regiunii critice

20

- Regiunea critică trebuie astfel aleasă icircncacirct dacă ipoteza alternativă H1 este adevărată

probabilitatea de respingere a ipotezei nule H0 este mai mare decacirct icircn cazul icircn care ipoteza nulă H0

ar fi adevărată

- Acceptarea ipotezei nule H0 atunci cacircnd ipoteza alternativă H1 este adevărată este cunoscută ca şi

eroarea de tipul II

a probabilitatea ei se notează cu b

b măsoară bdquonivelul de eroarerdquo

- Icircn testarea oricărei ipoteze statistice există patru situaţii care determină dacă decizia noastră este

corectă sau nu

Cazuri

H0 este adevărată H0 este falsă

Concluzie H0 se acceptă decizie corectă eroare de tipul

II

H0 se

respinge

eroare de tipul I decizie corectă

Luarea deciziei pe baza valorii probabilităţii p de semnificaţie a testului

Icircn momentul icircn care prelucrăm statistic o serie de date dorim să ştim dacă rezultatele obţinute sunt sau

nu semnificative statistic

Răspunsul la această icircntrebare este dat de valoarea lui p calculată de orice program statistic la

prelucrarea unor date

Icircn cazul testelor statistice ipoteza nulă este respinsă dacă nivelul de semnificaţie este mai mic decacirct

005 iar programele de prelucrare statistică a datelor vor afişa o steluţă () icircn tabelul rezultatelor

21

Dacă p le 005 respingem ipoteza nulă şi acceptăm ipoteza alternativă (am obţinut semnificaţia

statistică)

Dacă p gt 005 acceptăm ipoteza nulă (nu am obţinut semnificaţia statistică)

p = 013

NU respingem ipoteza nulă

Risc de eroare de tip II

α = 005

p = 002

Respingem ipoteza nulă

Risc de eroare de tip I

Semnificaţia lui p

Criteriu de luare a deciziei cu privire la o ipoteză statistică nulă

Cuantifică şansa ca o decizie de respingere a ipotezei nule să fie greşită

Măsură a semnificaţiei statistice şi NU CLINICĂ

22

Semnificaţia lui p (reguli empirice)

001 le p lt 005 rezultatul e semnificativ statistic

0001 le p lt 001 rezultatul e icircnalt semnificativ statistic

p lt 0001 rezultatul e foarte icircnalt semnificativ statistic

p ge 005 rezultatul e considerat nesemnificativ statistic

Limite ale valorii p

Valoarea p NU ne dă informaţii despre

Şansa de beneficiu a unui pacient individual

Procentul de pacienţi care vor avea un beneficiu icircn urma instituirii procedurii medicale

Gradul de beneficiu expectat pentru un anumit pacient

Puterea unui test statistic

Este capacitatea de a detecta o diferenţă acolo unde există

Creşterea volumului eşantionului determină creşterea puterii testului statistic aplicat

Valoarea este icircn relaţie directă cu eroarea de tip II

Puterea = 1 ndash β

Cea mai utilizată modalitate de creştere a puterii unui test statistic este de a creşte volumul

eşantionului

Tipul scalei de măsură ndash testul statistic

Denumire test Interval Nominal Observaţii

Corelaţie Pearson 2 0 Există o relaţie liniară

χ2 0 2

Student 1 1 Doar 2 grupuri

ANOVA 1 1 2 sau mai multe grupuri

Student perechi 1 1 Eşantioane perechi

Măsurători repetate (ANOVA) 1 1 Mai mult de 2 grupuri date

perechi

Inferenţa statistică pe date calitativ e

Tabela de contingenţă 2times2

Riscuri şi raţii

Testul χ2 (testarea asocierii icircn tabela de contingenţă)

Testul Fisher

23

Testul z pentru proporţii

Testul McNemar

Tabela de contingenţă 2times2

Scale de tip nominal (dicotomiale tabela de contingenţă de 2times2) sau ordinal (tabela de contingenţă de

rtimesc)

Frecvenţa absolută (numărul de evenimente per categorie)

Tabela de contingenţă de 2times2 4 categorii

AP = adevărat pozitiv

FP = fals pozitiv

FN = fals negativ

AN = adevărat negativ

Ulcer deschis Ulcer vindecat Total

Recurenţă + AP = 1 FP = 5 = 1+5 = 6

Recurenţă - FN = 7 AN = 16 = 7+16 = 23

Total =1+7=8 =5+16=21 29

Riscuri şi raţii Mărimi ale asocierii

Denumire Formula Definiţie

Rata falşilor pozitivi =FP(FP+AN) Probabilitatea unui test fals + (α)

Rata falşilor negativi =FN(FN+AP) Probabilitatea unui test fals ndash (β)

Sensibilitate =AP(AP+FN) Probabilitatea unui test real + (1- β)

Specificitate =AN(AN+FP) Probabilitatea unui test real ndash (1- α)

Acurateţe =(AP+AN)n Probabilitatea generală a unei decizii corecte

Valoarea predictivă pozitivă =AP(AP+FP) Probabilitatea ca un test pozitiv să fie corect

Valoarea predictivă negativă =AN(AN+FN) Probabilitatea ca un test negativ să fie corect

Riscul relativ =AP(FP+AN)FN(AP+FP)

Rata şansei =(AP∙AN)(FN∙FP)

Riscul atribuabil =AP(AP+FP)-FN(FN+AN)

24

Denumire Formula

Rata falşilor pozitivi = 5(5+1) = 08334

Rata falşilor negativi = 7(7+16) = 03043

Sensibilitate = 1(1+7) = 01250

Specificitate = 16(16+5) = 07619

Acurateţe = (1+16)29 = 05862

Valoarea predictivă pozitivă = 1(1+5) = 01667

Valoarea predictivă negativă = 16(16+7) = 06957

Riscul relativ = 1(5+16)7(1+5) = 2142 = 050

Rata şansei = (1∙16)(7∙5) = 04571

Riscul atribuabil = 1(1+5)-7(7+16) = 01667-03043=-01376

Testarea asocierii icircn tabela de contingenţă

Testul χ2

Nu trebuie utilizat pentru eşantioane de volum mic

Testul este valid doar dacă valoarea expectată (aşteptată) pentru fiecare celulă este cel puţin

egală cu 1 şi frecvenţa absolută observată este de minim 5

Dacă aceste condiţii nu sunt icircndeplinite se aplică testul exact al lui Fisher (Fisherrsquos Exact Test)

Indică dacă cele două variabile sunt sau nu independente DAR NU cuantifică puterea asocierii

dintre ele

Problema S-a investigat icircntr-un studiu asocierea dintre obezitatea (ca factor de risc) şi bolile

cardio-vasculare la persoanele icircn etate (gt 60 ani) Din totalul de 620 persoane investigate s-au

identificat 150 persoane cu obezitate şi boală cardio-vasculară 230 persoane fără obezitate şi

fără boală cardio-vasculară şi 60 persoane fără obezitate dar cu boală cardio-vasculară Există

o asociere icircntre obezitate şi boala cardio-vasculară (df=1 α=005 χ2critic = 384)

Testul χ2 exemplu

H025

Nu există asociere icircntre obezitate şi bolile cardio-vasculare

Obezitatea şi bolile cardio-vasculare sunt independente

H1

Există asociere icircntre obezitate şi bolile cardio-vasculare

Obezitatea şi bolile cardio-vasculare sunt asociate

a = 005 pragul de semnificaţie al testului

urmează o lege cu (r-1)(c-1) grade de libertate

χ2 = parametrul testului χ2

fio = frecvenţa observată

fit = frecvenţa teoretică

Regiunea critică este [χα2 yen)

Pentru α = 005 χα2 = 384

OBSERVAT BCV+ BCV- Total

Obezitate + AP = 150 FP = 180 330

Obezitate - FN = 60 AN = 230 290

Total 210 410 620

TEORETIC BCV+ BCV- Total

Obezitate + = 330times210620 = 330times410620 330

Obezitate - = 290times210620 = 290times410620 290

Total 210 410 620

TEORETIC BCV+ BCV- Total

Obezitate + = 330times210620 = 330times410620 330

26

Obezitate - = 290times210620 = 290times410620 290

Total 210 410 620

TEORETIC BCV+ BCV-

Obezitate + = 112 = 218

Obezitate - = 98 = 192

Deoarece 4177Icirc[384 yen) se respinge H0 cu un risc de eroare de 5

Există asociere icircntre obezitate şi bolile cardio-vasculare

Testul Fisher

Corecţie a testului χ2

Valoarea p asociată parametrului ne dă probabilitatea ca valoarea observată de independenţă să fie

atribuită doar şansei

O valoare p mică indică că există alte cauze decacirct şansa influenţează rezultatul şi astfel cele două

variabile investigate nu sunt independente

Testul Fisher = dispersia corectată a factorului x dispersia corectată a factorilor reziduali

Icircn acest context regula adunării dispersiilor se poate scrie unde

este variaţia lui y pe seama variaţiei variabilei x

este variaţia lui y pe seama influenţei factorilor reziduali (neicircnregistraţi)

este variaţia totală a caracteristicii y

Testul Fisher empiric se calculează după formula

27

se compară cu Ftab pentru nx şi nz grade de libertate la un anumit prag de semnificaţie stabilit

Dacă Fc gt Ftab rezultă că variaţia factorului de grupare x este semnificativă pentru variaţia caracteristicii y

Testul z pentru proporţii

1 Compararea unei frecvenţe observate cu o frecvenţă teoretică

2 Testarea egalităţii a două frecvenţe

Testul z Compararea unei frecvenţe observate cu o frecvenţă teoretică

Scop Investigarea semnificaţiei diferenţei icircntre o frecvenţă teoretică p (icircntr-o populaţie) şi o frecvenţă

observată f pe un eşantion reprezentativ (variabilă calitativă (binare))

Condiţii de aplicare Testul este corect aplicat dacă numărul n al observaţiilor eşantionului este

suficient de mare (n∙p n∙(1-p)gt10

Parametrul

n = volumul eşantionului

Suntem interesaţi de investigarea prevalenţei hepatitei B la personalul care lucrează icircn laboratoarele

clinicilor de boli infecţioase din Transilvania Se ştie din studii anterioare că prevalenţa hepatitei B icircn

populaţia generală din Transilvania este de 9 S-a luat icircn studiu un eşantion de 100 persoane şi s-a

obţinut o prevalenţă a hepatitei B de 6 Există diferenţă semnificativă icircntre frecvenţa hepatitei B la

personalul care lucrează icircn laboratoarele spitalelor de boli infecţioase din Transilvania faţă de

populaţia generală

f = 006 p = 009 n = 100

Ipoteza nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat

faţă de frecvenţa hepatitei B icircn populaţia generală

Ipoteza alternativă test bilateral Există diferenţă semnificativă icircntre frecvenţa hepatitei B la

nivelul eşantionului şi prevalenţa hepatitei B icircn populaţia generală

f = 006 p = 009 n = 100

Pragul de semnificaţie a = 005

Regiunea critică test bilateral (-yen -196 ]Egrave[196 yen)

28

Concluzia testului

Deoarece parametrul statistic calculat al testului nu aparţine regiunii critice se acceptă ipoteza

nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat faţă de

frecvenţa hepatitei B icircn populaţia generală

Testul McNemar

Evaluarea dependenţei variabilelor calitative perechi (dorim să determinăm dacă o anumită

caracteristică este sau nu asociată cu o anumită patologie)

Identificăm n pacienţi care prezintă patologia de interes (eg Cancer bronho-pulmonar) şi n

pacienţi cu aceleaşi caracteristici ca şi primul grup dar care nu o prezintă

Martor = da Martor = nu

Caz = da a b

Caz = nu c d

Testul McNemar - exemplu fumat vs cancer

Martor = da Martor = nu

Cancer = da a = 2 b = 5

Cancer = nu c = 0 d = 3

29

χ2critic(α=005) = 384

32 lt 384 rarr acceptăm ipoteza nulă

Fumatul nu este icircn relaţie cu apariţia cancerului bronho-pulmonar

Inferenţa statistică pe date cantitative

Variabile cantitative continue

Testul z şi Student (t) (o medie sau medii perechi)

Testul z şi Student (t) (testarea a două medii)

ANOVA (ge 3 medii)

Ranguri (variabile cantitative discrete sau cantitative care nu icircndeplinesc condiţia de

normalitate)

Testul sumei rangurilor Wilcoxon

Kruskal-Wallis (ge 3 eşantioane independente)

Friedman (ge 3 eşantioane dependente)

Teste de normalitate variabile cantitative continue

Shapiro-Wilk

Kolmogorov-Smirnov

Shapiro-Wilk

Chi-Square Goodness-of-Fit

Dacă datele urmează o distribuţie normală aplicăm un test parametric

Dacă datele nu urmează o distribuţie normală aplicăm un test de comparare al rangurilor

30

Testul Z de comparare a mediei unui eşantion cu media unei populaţii

Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ

extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie

s2 care se cunoaşte

Condiţii de aplicare

1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru

compararea mediei unui eşantion cu media unei populaţii)

2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal

distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă

3 Talia eşantionului este mare ( ge 30)

Ipoteze

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media

eşantionului şi media populaţiei

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

(-yen -196 ] Egrave [196 yen)

Parametrul testului

n = volumul eşantionului

= media eşantionului

s = deviaţia standard a populaţiei

Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)

Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard

cunoscută

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi

media standard

Condiţii de aplicare

Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se

realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această

condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea

31

Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai

puternic

Numărul de grade de libertate (df) df = n-1

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

Parametrul testului

n = volumul eşantionului

micro0 = media standard

= media eşantionului

s = deviaţia standard a eşantionului

Testul ANOVA compararea mediilor a mai multe eşantioane

H0 = toate mediile sunt egale

H1 = nu toate mediile sunt egale

Condiţii de aplicare

1 Datele sunt independente unele faţă de celelalte

2 Datele fiecărui grup sunt normal distribuite

3 Deviaţia standard este aceeaşi pentru toate grupurile

Id Medicament

A B C D E F

1 5 6 7 10 5 9

2 6 8 8 11 8 8

3 7 7 9 13 6 7

4 8 9 11 12 4 5

32

5 9 10 10 9 7 6

Suma 35 40 45 55 30 35

Media 7 8 9 11 6 7

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =

= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)

Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2

F = (suma pătratelor(icircntre))(suma pătratelor(icircn))

Suma pătratelor (icircntre) = 16times5 = 80

Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60

Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn

interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare

SP df Media pătratelor F = MPicircntreMPicircn

Icircntre 80 5 = 805 = 16 = 1625 = 64

Icircn 60 24 = 6024 = 25

Total 140 29 -

Testul sumei rangurilor Wilcoxon

Aplicat pentru

Un set de observaţii provenite dintr-o valoare ipotetică comună

Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)

Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero

Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace

Suma rangurilor pentru diferenţele negative = 2+3+1 = 6

Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30

33

Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului

egal cu 8 = 0109

Icircnainte După Diferenţa Rang

64 66 -2 2

66 58 8 5

67 68 -1 3

71 65 6 4

72 75 -3 1

76 67 9 6

78 59 19 8

89 74 15 7

Testul Kruskal-Wallis (ge 3 eşantioane independente)

Test de ranguri aplicate pe mai mult de 3 eşantioane

H = parametrul testului

n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)

Tk = suma rangurilor

Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie

pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni

34

df = k-1 (k = numărul de eşantioane)

df = 3-1 = 2

Hcritic(α=005) = 599

H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie

pozitivă şi respectiv biopsie negativă

Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie

a tipului de studiu pe eşantioane perechi)

1 Definirea numărului de tratamente k

2 Obţinerea rangurilor pentru fiecare tratament

3 Sumarea rangurilor fiecărui tratament

4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)

5 Dacă Fr gt Frcritic rarr respingem H0

Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost

măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi

n = 9 k = 3 T12 = 225 T2

2 = 38025 T32 = 38025

Frcritic = 599

Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de

prostată

35

De reţinut

Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei

Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-

of-Fit

Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z

Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t

Compararea mediilor a 3 sau mai multe eşantioane ANOVA

Compararea mediilor a două populaţii (σ) testul Z

Compararea mediilor a două eşantioane (s) testul t

Compararea mediilor a două eşantioane perechi (s) testul t

ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi

cu cel pentru compararea a două eşantioane perechi

Ranguri

Distribuţia datelor nu are importanţă

Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)

Trei sau mai multe eşantioane Kruskal-Wallis

Trei sau mai multe eşantioane perechi Friedman

Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia

Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a

datelor)

Variabile nominale

Un singur eşantion sau eşantioane perechi

Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte

Eşantioane perechi testul Mc Nemar

Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2

Icircn analiza proporţiilor există teste diferite pentru

Compararea unei frecvenţe cu o frecvenţă cunoscută

Compararea a două frecvenţe

Semnificaţia statistică

Valoarea p (p value)

Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor

două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E

posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării

aleatorii

36

Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală

urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii

Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este

probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un

experiment de dimensiunea acestuia

Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că

diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii

diferite

Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca

fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă

ar fi fost adevărată

Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă

1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe

baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De

fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001

2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie

3 Se aplică testul statistic aferent pentru a calcula valoarea p

4 Se compară valoarea p cu valoarea ndash prag

5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe

semnificativă dpdv statisticrdquo

6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e

semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să

conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă

Teste de semnificaţie

Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului

populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)

Testarea ipotezelor implică posibile erori

Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile

sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui

grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul

icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005

ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există

37

nici o diferenţă

Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ

statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de

ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost

ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau

dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă

cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă

semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe

ipotetice variate icircn cazul icircn care ele există

Măsuri ale frecvenţei

Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)

Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate

Generic formula pe care se bazează toate cele trei este

unde x şi y sunt cantităţile de comparat

Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea

unei frecvenţe pe grupe de sex vacircrstă etc

Proporţia implică icircn mod necesar ca x să fie inclus icircn y

Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară

frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp

Pentru calcularea unei rate trebuie ţinut cont de trei aspecte

bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin

bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp

bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo

Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un

tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei

populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei

aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)

38

Indicatori

Rata de incidenţă

Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă

icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii

Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o

perioadă de timp

Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de

timp x

Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei

susceptibili de a dezvolta icircmbolnăvirea studiată

Numitorul poate fi

bull Numărul mediu al populaţiei icircn perioada de timp studiată

bull Mărimea populaţiei icircn mijlocul perioadei de studiu

bull Mărimea populaţiei la icircnceputul studiului

Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă

Este obligatorie menţionarea perioadei de timp

Prevalenţa

Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la

un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă

schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa

momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)

39

Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include

numai cazuri noi respectiv include cazuri noi şi vechi

Rata de atac

Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este

folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp

raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori

Rata persoană-timp

Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din

momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte

migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost

observate

Riscul relativ (RR)

Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment

legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele

prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două

grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la

bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la

bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai

mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo

Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2

Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn

cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă

(Tabelul 1)

Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR

Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la

neexpuşi

40

Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de

culegere a datelor

Odds ratio (OR)

Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin

raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general

studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)

Tabelul 2 Tabelul 2 x 2 pentru calcularea OR

Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală

Rate de mortalitate

Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp

specificată Există mai multe tipuri de rate de mortalitate

o Mortalitate specifică pe sex

o Mortalitate specifică pe rasă

o Mortalitate specifică pe boală

o Mortalitate neonatală

o Mortalitate postneonatală

o Mortalitate infantilă

o Mortalitate maternă

Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP

41

Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de

viaţă şi vacircrsta la care survine decesul dacă este prematur

Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu

Ani de viaţă pierduţi datorat dizabilităţii

Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt

utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru

cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite

grupuri

Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de

risc şi o boală se folosesc riscul relativ şi odds ratio

35 Analiza şi interpretarea datelor

După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date

trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul

Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor

colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului

studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu

plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde

prezenţa biostatisticianului este necesară

Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu

elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat

iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului

iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate

depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori

testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere

clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza

Interpretarea rezultatelor statistice

Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne

motive (număr mic de date) acceptarea ei să fie falsă

Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine

gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia

ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument

de decizie Intervalul de confidenţă

42

Interpretarea statistica ne interpretarea clinică

Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă

Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice

obţinute pe eşantionul studiat

Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare

Ce interpretăm Rezultatele

personale obţinute icircn urma studiului

care au fost prezentate icircn secţiunea bdquoRezultaterdquo

Explicăm rezultatele obţinute

Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale

Interpretarea trebuie să se realizeze icircn

lumina limitelor studiului

contextul cultural social şi educaţional al locului unde s-a realizat cercetarea

contextul a ceea ce se cunoaşte din literatura de specialitate

Interpretăm doar rezultatele personale obţinute icircn urma studiului

Interpretarea statistică nu este tot una cu interpretarea clinică

Interpretarea statistică este importantă

Interpretarea clinică este foarte importantă

Intervalul de confidenţă

Media calculată pe baza unui eşantion nu va echivala media populaţiei

Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului

Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a

populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a

populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)

pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru

orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare

dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de

confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de

date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de

5

Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel

Dacă valoarea p este mică

Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare

aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o

medie diferită Diferenţa este semnificativă dpdv statistic

43

Icircn continuare

Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa

reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică

pentru a fi interesante din punct de vedere ştiinţific

Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC

oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care

este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a

obţine o concluzie clară

Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o

diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că

datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din

punct de vedere ştiinţific

Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul

detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat

Erorile studiilor medicale

Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura

anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară

caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea

asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri

legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias

Erorile potenţiale icircn studiile epidemiologice

1 Erori icircntacircmplătoare

2 Erori sistematice

3 Confuzia

4 Validitatea

1 Erori icircntacircmplătoare

Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a

parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel

de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot

fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii

(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor

de măsură (eroarea de măsurare)

44

2 Erori sistematice

Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate

care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu

acurateţe mare Acurateţea nu este afectată de mărimea eşantionului

Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de

experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea

dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus

şi greu de cuantificat (consum de alcool personalitate etc)

Principalele tipuri de erori din această categorie sunt

bull Biasul de selecţie

bull Biasul de informaţie

Biasul de selecţie

Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul

trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion

inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale

persoanelor incluse

Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se

ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia

Biasul de informaţie

Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de

instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze

expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere

nesemnificativă sau chiar să nu şi-o amintească de loc

3 Confuzia

Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune

prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este

cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă

de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte

important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor

protector

4 Validitatea

Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă

Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte

estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional

Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă

45

conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se

demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)

Validitatea externă se poate realiza numai dacă studiul este valid intern

Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii

studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de

studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt

laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi

validă din punct de vedere intern)

3 6 Prezentarea rezultatelor

După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite

Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor

icircntr-o formă bdquodigerabilărdquo este necesară

Scopul prezentării datelor

1 Transmiterea concluziilor studiului

a Datele corecte şi importante merită comunicate

b Datele trebuie să confirme sau să infirme ipoteza studiului

c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală

2 Acordarea posibilităţii altor cercetători să aprecieze studiul

a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti

b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor

prezentate

Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru

fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie

statistică

Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de

valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras

(Tabel 3)

Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)

46

Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct

numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor

precum şi prezentarea acestora sub formă inteligibilă

Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care

convin cercetătorului

Prezentarea datelor se poate face

1 Figuri şi tabele icircn articole scrise

2 Figuri şi tabele icircn prezentări orale

3 Figuri şi tabele icircn postere

4 Text scris sau incluse icircn text

5 Site-uri de WEB

Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor

Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie

Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele

exprimacircnd exact ceea ce acestea exprimă

Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate

anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel

să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se

acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca

mai sus sugestive sunt formatele simple şi puţin icircncărcate

Dacă nu există reguli impuse se respectă

1 Mesaj simplu fără falsificarea datelor

2 De obicei este necesar atacirct tabelul cacirct şi graficul

3 Să fie simplu şi clar

Tabele

Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile

coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică

elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de

1 Se folosesc doar linii orizontale

2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn

evidenţi prin linie de separare (Tabelul 4)

Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland

Noua Zeelandă)

(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)

47

3 Numerele sunt aliniate icircn funcţie de virgulă

4 Indicii statistici sunt explicaţi sub tabel

5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană

6 Abrevierile pot fi folosite

7 Numărul de zecimale trebuie limitat la maxim două

8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel

9 Plasarea legendei este obligatorie sub tabel

10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)

Icircn cazul prezentărilor orale sau a posterelor este indicat ca

1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării

2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte

3 Folosirea de simboluri este permisă

Clasificarea tabelelor

Tabelele se clasifică după

i) conţinut

bull cu distribuţii de frecvenţe

bull de clase de frecvenţe

bull de contingenţă

ii) structura

bull cu doua coloane

bull cu subclasificări

bull ldquomasterrdquo

Tabele ce conţin distribuţii de frecvenţe

O modalitate comodă de a prezenta o mulţime de date brute este

1 Se ordonează datele in ordine crescătoare

2 Se determine frecvenţa fiecărei valori

3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane

(Tabelul 5)

Tabelul 5 Distribuţii de frecvenţă absolută

48

Tabelul claselor de frecvenţe

1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă

2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)

Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)

Tabele de contingenţă

1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a

tabelelor de contingenţă

2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a

combinaţiilor de perechi ordonate de valori

3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre

a factor de risc si

b starea sănătăţii

4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)

5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)

Tabelul 7 Tabel de contingenţă 2 x 2

49

Grafice

Există două categorii de moduri grafice sub care se pot prezenta datele

1 Ilustraţii şi fotografii

2 Grafice

1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă

pentru lucrare

2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit

Putem vorbi despre mai multe tipuri de grafice

bull Grafice pentru reprezentarea datelor cantitative

1048707 Grafic cartezian (X Y)

1048707 Histograma

1048707 Poligonul de frecvenţe

1048707 Diagrama bdquoscatterrdquo

bull Grafice pentru reprezentarea datelor calitative

1048707 Grafic cu bare

1048707 Diagrama tip bdquoboxplotrdquo

1048707 Diagrama bdquopierdquo

1048707 Cartograma

Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi

dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)

Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)

Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie

Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)

Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)

50

Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir

de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele

două variabile studiate (Figura 6)

Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2

(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2

rămacircne aproximativ constantă)

Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea

comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea

comparativă a mai multor variabile

Figura 7 Grafic calitativ cu bare

51

Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo

Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două

posibilităţi reprezentate grafic este mai frecventă (Figura 8)

Figura 8 Reprezentare tip bdquopierdquo

Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli

sau a oricărui element comparativ Se foloseşte de epidemiologi

Rezultate

Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare

Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o

manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu

explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția

bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la

ilustraţii tabele grafice

Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi

nici rezultatele care invalidează eventual ipoteza

Discuţii

Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd

cultura ştiinţifică şi inteligenţa autorilor

Acest capitol răspunde la trei obiective

Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia

calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de

selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează

rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv

52

este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn

care a fost abordată problema fără a face o revistă a literaturii

Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea

rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul

Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor

afirmaţii nesusţinute de conţinutul lucrării

Concluzii

Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate

să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie

Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de

concluzii va scădea valoarea lucrării

Bibliografia (lista referinţelor citarea icircn text)

Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn

lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente

Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli

- să conţină cele mai importante şi recente lucrări

- să includă numai lucrări publicate

- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate

Bibliografie

Elisabeta Jaba ndash Statistică Ed Economică 1998

Mihai Ţarcă ndash Statistică volI Ed UAIC 1979

Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale

Ed University Press 2009

Sorana Daniela Bolboacă ndash Metodologia cercetării curs

53

Page 11: cercetarea medicala - metodologie

4 Eşantionul bdquoclusterrdquo sau icircn cuiburi Icircn cazul unui studiu amplu cu scop de a investiga populaţia unei

icircntregi ţări sau regiuni putem ajunge icircn imposibilitatea de a alege şi mai ales investiga indivizi răspacircndiţi prin

icircntreaga zonă Din acest motiv se desemnează la icircntacircmplare un număr calculabil de

grupuri populaţionale extinse icircn toată zona de studiu Aceste grupuri poartă numele de bdquocuiburirdquo La nivelul

fiecărui bdquocuibrdquo se aplică o tehnică precedentă de selecţie a cazurilor Se poate sau de cele mai multe ori se face

la nivel de bdquocuibrdquo stratificarea iar apoi selecţia propriu-zisă se realizează sistematic sau simplu randomizat

Este metoda de eşantionare cel mai frecvent utilizată icircn cercetarea medicală de amploare Pentru ca eventualele

erori să nu se poată strecura s-a definit şi un indice DEF (design effect) cu care trebuie multiplicată talia

selecţiei care pentru eşantionarea icircn bdquocuiburirdquo este egal cu 2 astfel putem obţine şi o reprezentativitate

calitativă dar şi una cantitativă

Eşantionarea nonprobabilistică este o metodă neindicată icircn studiile medicale datorită lipsei de forţă icircn ceea ce

priveşte posibilitatea de aplicare a concluziilor asupra populaţiei de studiu

Se definesc şi icircn acest caz patru metode

1 Eşantion de convenienţă Membrii unui astfel de eşantion sunt aleşi numai pentru că sunt la icircndemacircnă

disponibili de a răspunde le un eventual chestionar

2 Eşantion pe cote Similar cu tipul de eşantion stratificat se referă la faptul că selecţia se face formacircnd

eşantionul din primele 30 de persoane care respectă un criteriu impus

3 Eşantion cu un scop Elementele incluse icircn eşantion sunt alese după un criteriu care exclude din start marea

majoritate a populaţiei

4 Eşantion raţional Selecţia se face prin prisma unui raţionament al celui care conduce studiul

Parametru şi estimator

Parametrul este o valoare de obicei necunoscută (şi care trebuie să fie estimată prin studiu) folosită pentru a

reprezenta o anumită caracteristică a populaţiei de studiu De exemplu media populaţiei (icircnălţime) este un

parametru populaţional Raportat la o populaţie parametrul este o valoare fixă şi exactă care nu variază

Fiecare eşantion extras din populaţie va indica o valoare a mediei care nu poate decacirct să estimeze parametrul

Icircn general parametrii sunt notaţi cu litere greceşti (ex Media = μ)

Estimatorul este o valoare calculată dintr-un eşantion studiat Este folosit pentru a putea aprecia parametrul

populaţional pe care icircn căutăm Este de asemenea posibil ca dintr-o populaţie să formăm mai multe eşantioane

mediile lor de cele mai multe ori nefiind identice icircntre ele şi nici identice cu media populaţiei Estimatorii

sunt notaţi cu litere latine (ex Media = μ)

Dacă valoarea mediei calculată pe eşantion este de exemplu 168 cm atunci putem estima ca valoarea mediei

icircn populaţie este 168 cm

11

Tipuri de culegere a datelor

1 Culegere de tip eşantion reprezentativ Grupul de indivizi incluşi icircn studiu sunt reprezentativi (calitativ şi

cantitativ) pentru populaţia generală Poate fi utilizat pentru studii descriptive (cel mai frecvent) dar uneori şi

pentru studii analitice

Este necesar pentru acest tip de culegere a datelor ca iniţial să fie cunoscută talia eşantionului (calculabilă icircn

funcţie de prevalenţă şi precizie) Pentru evaluarea datelor culese se utilizează tabelul de contingenţă 2 x 2

astfel (Figura 1)

Figura 1 - Tabelul de contingenţă 2 x 2

Unde

a ndash persoane expuse unui factor de risc care au boala studiată

b ndash persoane expuse unui factor de risc care nu au boala studiată

c - persoane neexpuse unui factor de risc care au boala studiată

d - persoane neexpuse unui factor de risc care nu au boala studiată

După aranjarea datelor icircn tabelul de contingenţă (2 x 2) se poate icircncepe analiza statistică a datelor atacirct ca

procente calculabile cacirct şi din punct de vedere a aplicării de teste statistice pentru elucidarea semnificaţiei

statistice

Este posibilă din acest tip de culegere de date calcularea

1 Prevalenţei unei boli

2 Frecvenţei expunerii

3 Gradul de asociere icircntre factorul eventual de risc şi boala

2 Culegerea de tip expus ndash neexpus Icircmparte subiecţii icircn două categorii expuşi sau neexpuşi factorului de risc

studiat Ca evoluţie următoare a studiului după o astfel de culegere a datelor se poate evalua icircn timp apariţia

icircmbolnăvirii despre care se efectuează studiul Icircn timp longitudinal prospectiv se poate calcula dacă factorul

studiat reprezintă un risc de icircmbolnăvire este indiferent sau chiar este cu efect protectiv Numărul subiecţilor

din cele două grupuri poate fi egal sau poate fi diferit Numărul acestora poate fi calculat icircn vederea obţinerii

unei bune reprezentativităţi cu ajutorul formulelor de selecţie Avacircnd icircn vedere calitatea longitudinală a

12

studiului este important ca numărul ales să fie mai mare pentru a putea suplinii eventualele pierderi din

urmărire Practic rezultatele sunt introduse icircn tabelul 2 x 2 de unde se pot calcula indicatorii doriţi (Figura 2)

Avacircnd icircn vedere modul de culegere a datelor este permisă calcularea de indicatori numai pe orizontală

orice comparare icircntre coloana dreaptă şi stacircngă fiind incorectă Avantajul acestui tip de culegere a datelor ar fi

eventualul număr mai redus de subiecţi dar dezavantajul major este cel al costurilor de urmărire icircn timp dar

trebuie luată icircn calcul şi pierderea de subiecţi din evidenţe Factorul controlat este deci prezenţa expunerii iar

factorul aleator este prezenţa bolii

Figura 2 Tabelul de contingenţă pentru tipul de culegere expus ndash neexpus

4 Culegerea de tip caz ndash martor Icircn acest caz ceea ce ghidează colectarea datelor este prezenţa sau absenţa

bolii icircn momentul prezent Se vor culege date de la două loturi constituite după criteriul de bolnav B+ şi de fără

boală B+ Datele culese sunt icircn trecut deci caracterul datelor va fi retrospectiv Icircn acest caz factorul controlat

este boala factorul aleator fiind expunerea (Figura 3)

Calculul de indicatori icircn acest caz se va putea efectua numai icircntre coloane orice calcul icircntre valorile de pe linii

fiind greşit Rezultate semnificative se pot obţine icircn acest caz utilizacircnd loturi mai mici de studiu prin

comparaţie cu tipul eşantion reprezentativ permiţacircnd icircn acelaşi timp studiul bolilor rare (cu prevalenţă mică)

Figura 3 Tabelul de contingenţă pentru tipul de culegere caz ndash martor

Metode de culegere a datelor

Metoda aleasă pentru culegerea datelor trebuie să fie aleasă după un atent studiu bibliografic icircn vederea

stabilirii celui mai eficient mod de a răspunde temei de studiu

Metodele de culegere trebuie să fie bine aplicabile şi consistente ca aport informaţional necesar

13

1 Fiziologice Sunt colectate date despre anumite caracteristici fiziologice ale pacienţilor (TA glicemie

colesterol etc) Această metodă aduce rezultate obiective cacirct timp instrumentul de evaluare este bine calibrat

şi prezintă variaţii mici

2 Metode observaţionale Instrumentul de culegere a datelor trebuie să fie sincronizat cu protocolul conceput

de cercetător Datele culese trebuie să fie de asemenea consistente adică să fie colectate de aceeaşi manieră

conducătorul studiului trebuind să instruiască investigatorii (colectorii de date) Icircnregistrarea datelor trebuie să

fie de asemenea sistematică şi bine standardizată Observaţii de control trebuie icircn mod obligatoriu făcute

pentru a putea aprecia icircn mod corect orice deviere datorată unor factorii externi Este obligatorie luarea icircn

consideraţie a aspectelor etice

3 Interviul Poate fi structurat cu un set specific de icircntrebări sau nestructurat cu o temă generală cu care se

icircncepe interviul Interviurile pot fi icircnregistrate sau intervievatorul poate nota pur şi simplu răspunsurile Există

două tipuri generice de interviu interviul de profunzime care se referă la o discuţie icircn general structurată cu

un număr de icircntrebări prestabilite icircn icircncăperea de studiu fiind doară intervievatorul şi persoana chestionată şi

interviul de grup unde prin conversaţii pornind de la temă generală expusă şi condusă de intervievator se

obţin date despre subiecţii participanţi la studiu Ambele metode de interviu au indicaţiile lor precise Un

interviu pe teme intime nu va putea fi corect icircn ceea ce priveşte datele colectate dacă se aplică un interviu de

grup

4 Chestionarul Document scris adresat unor persoane pentru a răspunde la una sau mai multe icircntrebări

Trebuie să aducă răspunsurile la icircntrebările care motivează studiul constituind ansamblul icircntrebărilor destinate

culegerii de informaţii (date) Redactarea chestionarului trebuie să ţină cont de structura acestuia introducere

conţinut exprimarea icircntrebărilor grafica chestionarului

5 Icircnregistrări preexistente

Icircn cercetarea medicală sunt cel mai frecvent utilizate Informaţiile dorite sunt deja existente ceea ce icirci revine

cercetătorului este ca să structureze datele icircn funcţie de scopul studiului pe care icircn conduce Aceste surse sunt

bull Foi de observaţie

bull Registre de consultaţie

bull Buletine de analize

bull Registre de operaţii

Icircn cazul icircn care nici o metodă de culegere a datelor nu este pe placul celui ce conduce studiul există

posibilitatea de a construi un instrument nou de culegere a datelor

Acest proces trebuie să urmărească nişte paşi obligatorii fiind mare consumator de timp

bull Definirea structurii cu care se va face măsurarea

bull Formularea itemilor de măsură

bull Analiza validităţii instrumentului de măsură ndash măsoară acesta fenomenul corect

bull Elaborarea de instrucţiuni de utilizare pentru investigatori

14

bull Pretestarea instrumentului

bull Aprecierea validităţii interne şi externe a datelor culese

Instrumente de cercetare

Formularea clară a temei de cercetare necesită o foarte bună definire a factorilor studiaţi şi a criteriilor de

judecată Acestea din urmă sunt ultimele care vor trebui definite icircn cadrul protocolului de studiu

Alegerea unui instrument de măsură

Nu există un instrument de măsură perfect sau universal corect Alegerea sa dintre cele existente şi cele deja

utilizate depind de trei factori

bull Obiectivul studiului

bull Boala studiată

bull Populaţia icircn studiu

De aceste trei elemente trebuie ţinut cont icircn fiecare etapă a dezvoltării instrumentului

Definirea obiectivului

Studiu transversal Dacă se doreşte studierea unui simptom sau a unei caracteristici ale populaţiei se poate

icircmpărţi populaţia de studiu icircn mai multe grupuri Este practic vorba de a determina diferenţele dintre subiecţi

icircn cea ce priveşte o variabilă necesară studiată printr-un studiu transversal (utilizarea dozării de Ac HBS

pentru a evalua progresele bolnavilor de hepatită tip B)

Studiu longitudinal Icircn acest caz nu se poate icircmpărţii populaţia de studiu icircn mai multe grupuri datele obţinute

fiind de la acelaşi subiect colectate după un interval de timp

Icircn funcţie de boală şi populaţie se aleg şi instrumentele de măsură cele mai adecvate

Instrumentele cercetării reprezintă un mecanism specific sau o strategie pe care cercetătorul o utilizează pentru

colectarea prelucrarea şi inferenţa datelor Aceste instrumente sunt

1 Studiul icircn bibliotecă

2 Computerul

3 Determinările experimentale

4 Statistica

5 Mintea umană

6 Facilităţi de limbaj şi comunicare

Determinările experimentale

Măsurarea constă icircn aprecierea şi cuantificarea fenomenelor calitativ sau cantitativ Interpretarea

datelor se referă la transformarea lor icircn unităţi de descoperire a unor fenomene mai puţin cercetate

Standardele acceptate se referă la norme medii distribuţii etc Tot icircn cadrul interpretării datelor datele

obţinute sunt caracterizate pe scale de valori nominal ordinal de interval sau de raport

Validarea şi reproductibilitatea măsurătorilor sunt aspecte importante şi foarte necesare pentru o

cercetare corect fundamentată care doreşte obţinerea unor concluzii pertinente

15

Statistica Este implicată icircn condensarea şi procesarea unui volum mai mare de date astfel icircncacirct să se poată

interpreta corect valorile obţinute şi să se permită comparările Utilizarea unor teste statistice specifice permite

determinarea semnificaţiei (diferenţei) statistice astfel icircncacirct estimatorii să poată fi aplicaţi la populaţia

generală Furnizează informaţii şi privind corelarea sau relaţionarea icircntre date

Mintea umană este cea care reuşeşte să integreze şi să icircnţeleagă rezultatele obţinute Semnificaţia ştiinţifică

este stabilită icircn funcţie de rezultatele statisticii de mintea umană conform afirmaţiei bdquosemnificaţia ştiinţifică

nu este egală cu semnificaţia statisticărdquo Metodele aplicate pentru a putea ajunge la o concluzie pertinentă sunt

logica deductivă raţionamentul inductiv şi gacircndirea critică

Limbaj şi comunicare Exprimarea orală sau icircn scris permite nuanţarea unor aspecte seci cifrice ale unor

studii Icircn acest mod devine mai evidentă semnificaţia ştiinţifică a unor rezultate statistice

34 Prelucrarea datelor

Instrumentele de prelucrare

Statistica este o ştiinţă ramură a matematicii care studiază evoluţia fenomenelor şi proceselor

colective pe baza observării lor ştiinţifice a culegerii şi prelucrării detaliate a informaţiilor statistice cu scopul

de a formula şi explica legile legităţile şi regularităţile ce le guvernează

Statistica permite deci aprecierea unor parametrii populaţionali prin studiul unui număr redus de

elemente ale populaţiei icircn studiu (ţintă) O populaţie poate fi definită printr-un şir de valori care pot fi grupate

icircn funcţie de parametrul studiat (glicemie colesterol TAD TAS etc) Pentru fiecare astfel de şir se defineşte

o variabilă (care va purta nume propriu glicemie colesterol etc) Practic variabila este considerată o funcţie

ia valori posibil diferite de la un element la altul icircn funcţie de caracteristicile proprii acestora Sunt clasificate

icircn două grupe variabile cantitative (caracteristică măsurabilă) şi calitative (caracteristică ce nu poate fi

măsurată)

La racircndul lor variabilele calitative pot fi

bull Nominale ndash grupuri de elemente ce nu pot fi ordonate (culoarea părului)

bull Nominale ordonate ndash concluziile pot fi grupate (eficienţa unui tratament slabă bună foarte bună)

bull Binare ndash apar numai două posibilităţi (bolnav sănătos)

Variabilele cantitative pot fi

bull Continue ndash o variabilă măsurabilă care poate lua o infinitate de valori

bull Discrete ndash variabile care nu pot lua decacirct valori icircntregi

Statistica descriptivă

Există două ramuri ale statisticii statistica descriptivă şi statistica inferenţială

Statistica descriptivă (după cum rezultă din denumire) se ocupă cu descrierea unor valori obţinute ale unei

variabile studiate

16

Valorile pe care variabila le ia se constituie icircntr-o serie statistică Indicatorii care definesc o variabilă (serie)

sunt

1 Ale tendinţei centrale

Media aritmetică - notată de regulă cu

Mediana - este acea valoare din şirul de date care icircmparte icircn două părţi egale şirul ordonat de valori (atenţie

şirul este ordonat crescător) situacircndu-se la mijlocul seriei statistice

Dacă numărul de valori n este un număr impar atunci mediana este valoarea unde

Dacă n este par deci avem un număr par de valori mediana este definitatilde ca fiind

unde k = n2

Modul - constituie valoarea care apare cel mai des deci valoarea cu numărul cel mai mare de apariţii

2 De dispersie

Amplitudinea - este diferenţa dintre valoarea maximă şi cea minimă

A = Amax - Amin

Amplitudinea relativă - notată A este raportul dintre amplitudinea absolută şi media aritmetică a seriei de

date

Varianţa notată este un indicator de icircmprăştiere a datelor Formula de calcul este

Abaterea standard (S) sau deviaţia standard reprezintă rădăcina pătrată din varianţă (dispersie)

Coeficientul de variaţie se calculează ca un raport procentual icircntre abaterea standard şi valoarea medie a şirului

de valori

Eroarea standard intervine icircn estimarea intervalelor de confidenţă Se calculează astfel

17

3 De asimetrie (skewness) indică distribuţia datelor dacă sunt sau nu distribuite normal

4 De boltire (kurtosis) estimează boltirea sau aplatizarea curbei de distribuţie

Prezentarea descriptivă a datelor se face prin icircnregistrarea datelor culese icircn tabele care să reprezinte icircn mod

sintetic valorile măsurate

Icircn concluzie statistica descriptivă permite

bull Stabilirea comparabilităţii icircntre grupurile de studiu şi aprecierea prezenţei erorilor sau confuziei

bull Reprezentarea datelor icircn tabele permite evaluarea fiecărui pacient şi dacă a existat pierderi din studiu

Statistica inferenţială

Statistica inferenţială (inductivă) este partea de analiză a datelor care permite extrapolarea unei

concluzii trase pe baza unui eşantion spre populaţia ţintă pentru care a fost efectuat studiul

Scopul analizei statistice este de a evidenţia efectul unui tratament sau al unui factor de risc prin date obţinute

din eşantionul studiat spre populaţia ţintă Aceasta implică testarea ipotezelor statistice sau altfel spus testarea

semnificaţiei statistice Este una dintre cele mai importante momente ale studiului Cum rezultatele sunt

obţinute prin studiul unui eşantion există posibilitatea ca acestea să fie datorate icircntacircmplării Testele

statistice ne ajută să apreciem icircn ce măsură rezultatele sunt icircntacircmplătoare şi mai ales icircn ce măsură şi dacă se

pot aplica populaţiei generale Icircn acest scop se impune o valoare limită alfa 005 care reprezintă limita

superioară a probabilităţii ca rezultatul obţinut să fie greşit (datorat icircntacircmplării) Astfel icircn funcţie de tipul

variabilelor şi indicatorii descriptivi aplicaţi şi evaluaţi se aplică teste de semnificaţie statistică (Tabelul 1)

Tabelul 1 Alegerea testelor de semnificaţie statistică

Tipul datelor

18

Diferenţierea variabilelor din punctul de vedere a distribuţiei se face folosind testul de normalitate

Kolmogorov ndash Smirnov

Testul statistic reprezintă metoda de comparaţie a două sau mai multe populaţii prin intermediul unor

variabile observate ale lor

Scopul unui test statistic este de a defini realitatea

Definirea icircntrebării de cercetare (ipoteza clinică)

Tratamentul cu Nebivolol este la fel de eficient ca şi cel cu Valsartan icircn tratamentul

hipertensiunii arteriale

Transpunerea icircntrebării de cercetare icircn termeni statistici (ipoteza statistică)

Media tensiunii arteriale a pacienţilor trataţi cu Valsartan nu diferă semnificativ de media

tensiunii arteriale a pacienţilor trataţi cu Nebivolol

Etapele unui test statistic

1 Formularea problemei icircn termenii ipotezelor statistice

2 Alegerea şi calcularea parametrului statistic al testului

3 Regiunea critică

4 Concluzia testului

1 Formularea problemei icircn termenii ipotezelor statistice

Ipoteza nulă ipoteza care trebuie testată testul efectuacircndu-se sub prezumţia că ipoteza nulă ar

fi adevărată

Ipoteza alternativă acea ipoteză care icircntr-un sens sau altul contrazice ipoteza nulă Această

ipoteză se mai numeşte şi ipoteza de lucru

Ipoteza nulă tipuri

O coadă (ldquoone-tailedrdquo sau ldquoone-siderdquo)

Media este mai mare

Media este mai mică

Două cozi (ldquoone-tailedrdquo sau ldquoone-siderdquo)

Media este egală

2 Alegerea şi calcularea parametrului statistic al testului

Parametrul statistic al testului exprimă icircntr-o anumită formă diferenţa dintre elementele comparate

Ţinacircnd seama de faptul că eşantionul sau eşantioanele utilizate sunt aleator extrase din populaţiile care

fac obiectul testului parametrul statistic este o variabilă aleatoare de selecţie care urmează o anumită

lege de probabilitate

Un parametru statistic al testului bun trebuie să icircndeplinească două condiţii

19

Trebuie să se comporte diferit atunci cacircnd ipoteza nulă H0 este adevărată faţă de situaţia icircn

care ipoteza alternativă H1 este adevărată

Distribuţia de probabilitate a parametrului statistic al testului sub prezumţia că H0 este

adevărată este cunoscută

3 Regiunea critică

- Trebuie să fim capabili să decidem icircn funcţie de valoarea parametrului statistic calculat care dintre

ipoteze cea nulă sau cea alternativă este adevărată

- Dacă valoarea parametrului statistic aparţine regiunii critice ipoteza nulă H0 va fi respinsă şi va fi

acceptată ipoteza alternativă H1

- Dacă valoarea parametrului statistic nu aparţine regiunii critice ipoteza nulă H0 va fi acceptată

- Decidem mărimea regiunii critice

Pentru aceasta trebuie să specificăm mărimea riscului de eroare pe care icircl acceptăm

Pe scurt definim nivelul de semnificaţie notat cu a sau mărimea riscului pe care

suntem dispuşi să ni-l asumăm icircn respingerea ipotezei nule H0 icircn cazul icircn care aceasta

este adevărată De obicei se alege un nivel de semnificaţie icircntre 1 şi 5

Probabilitatea unei erori de tipul I

probabilitatea de respingere a ipotezei nule H0 icircn favoarea ipotezei alternative H1 icircn

condiţiile icircn care H0 este adevărată

probabilitatea unei erori de tipul I se notează cu a şi se mai numeşte nivel de

semnificaţie al testului

Probabilitatea unei erori de tipul II

probabilitatea acceptării ipotezei nule icircn condiţiile icircn care ipoteza alternativă H1 este

adevărată

această probabilitate se notează cu b

- Unilaterală la dreapta ndash valoarea parametrului statistic al testului este mai mare sau egală cu

valoarea din dreapta a intervalului critic

- Unilaterală la stacircnga ndash valoarea parametrului statistic al testului este mai mică sau egală cu

valoarea din stacircnga a intervalului critic

- Bilaterală ndash valoarea parametrului statistic al testului este mai mică sau egală cu valoarea extremă

din stacircnga regiunii critice sau mai mare sau egală cu valoarea extremă din dreapta regiunii critice

valorile extreme ale regiunii critice avacircnd nivele egale de semnificaţie

4 Concluzia testului

- Ipoteza nulă H0 este respinsă dacă valoarea parametrului statistic aparţine regiunii critice

20

- Regiunea critică trebuie astfel aleasă icircncacirct dacă ipoteza alternativă H1 este adevărată

probabilitatea de respingere a ipotezei nule H0 este mai mare decacirct icircn cazul icircn care ipoteza nulă H0

ar fi adevărată

- Acceptarea ipotezei nule H0 atunci cacircnd ipoteza alternativă H1 este adevărată este cunoscută ca şi

eroarea de tipul II

a probabilitatea ei se notează cu b

b măsoară bdquonivelul de eroarerdquo

- Icircn testarea oricărei ipoteze statistice există patru situaţii care determină dacă decizia noastră este

corectă sau nu

Cazuri

H0 este adevărată H0 este falsă

Concluzie H0 se acceptă decizie corectă eroare de tipul

II

H0 se

respinge

eroare de tipul I decizie corectă

Luarea deciziei pe baza valorii probabilităţii p de semnificaţie a testului

Icircn momentul icircn care prelucrăm statistic o serie de date dorim să ştim dacă rezultatele obţinute sunt sau

nu semnificative statistic

Răspunsul la această icircntrebare este dat de valoarea lui p calculată de orice program statistic la

prelucrarea unor date

Icircn cazul testelor statistice ipoteza nulă este respinsă dacă nivelul de semnificaţie este mai mic decacirct

005 iar programele de prelucrare statistică a datelor vor afişa o steluţă () icircn tabelul rezultatelor

21

Dacă p le 005 respingem ipoteza nulă şi acceptăm ipoteza alternativă (am obţinut semnificaţia

statistică)

Dacă p gt 005 acceptăm ipoteza nulă (nu am obţinut semnificaţia statistică)

p = 013

NU respingem ipoteza nulă

Risc de eroare de tip II

α = 005

p = 002

Respingem ipoteza nulă

Risc de eroare de tip I

Semnificaţia lui p

Criteriu de luare a deciziei cu privire la o ipoteză statistică nulă

Cuantifică şansa ca o decizie de respingere a ipotezei nule să fie greşită

Măsură a semnificaţiei statistice şi NU CLINICĂ

22

Semnificaţia lui p (reguli empirice)

001 le p lt 005 rezultatul e semnificativ statistic

0001 le p lt 001 rezultatul e icircnalt semnificativ statistic

p lt 0001 rezultatul e foarte icircnalt semnificativ statistic

p ge 005 rezultatul e considerat nesemnificativ statistic

Limite ale valorii p

Valoarea p NU ne dă informaţii despre

Şansa de beneficiu a unui pacient individual

Procentul de pacienţi care vor avea un beneficiu icircn urma instituirii procedurii medicale

Gradul de beneficiu expectat pentru un anumit pacient

Puterea unui test statistic

Este capacitatea de a detecta o diferenţă acolo unde există

Creşterea volumului eşantionului determină creşterea puterii testului statistic aplicat

Valoarea este icircn relaţie directă cu eroarea de tip II

Puterea = 1 ndash β

Cea mai utilizată modalitate de creştere a puterii unui test statistic este de a creşte volumul

eşantionului

Tipul scalei de măsură ndash testul statistic

Denumire test Interval Nominal Observaţii

Corelaţie Pearson 2 0 Există o relaţie liniară

χ2 0 2

Student 1 1 Doar 2 grupuri

ANOVA 1 1 2 sau mai multe grupuri

Student perechi 1 1 Eşantioane perechi

Măsurători repetate (ANOVA) 1 1 Mai mult de 2 grupuri date

perechi

Inferenţa statistică pe date calitativ e

Tabela de contingenţă 2times2

Riscuri şi raţii

Testul χ2 (testarea asocierii icircn tabela de contingenţă)

Testul Fisher

23

Testul z pentru proporţii

Testul McNemar

Tabela de contingenţă 2times2

Scale de tip nominal (dicotomiale tabela de contingenţă de 2times2) sau ordinal (tabela de contingenţă de

rtimesc)

Frecvenţa absolută (numărul de evenimente per categorie)

Tabela de contingenţă de 2times2 4 categorii

AP = adevărat pozitiv

FP = fals pozitiv

FN = fals negativ

AN = adevărat negativ

Ulcer deschis Ulcer vindecat Total

Recurenţă + AP = 1 FP = 5 = 1+5 = 6

Recurenţă - FN = 7 AN = 16 = 7+16 = 23

Total =1+7=8 =5+16=21 29

Riscuri şi raţii Mărimi ale asocierii

Denumire Formula Definiţie

Rata falşilor pozitivi =FP(FP+AN) Probabilitatea unui test fals + (α)

Rata falşilor negativi =FN(FN+AP) Probabilitatea unui test fals ndash (β)

Sensibilitate =AP(AP+FN) Probabilitatea unui test real + (1- β)

Specificitate =AN(AN+FP) Probabilitatea unui test real ndash (1- α)

Acurateţe =(AP+AN)n Probabilitatea generală a unei decizii corecte

Valoarea predictivă pozitivă =AP(AP+FP) Probabilitatea ca un test pozitiv să fie corect

Valoarea predictivă negativă =AN(AN+FN) Probabilitatea ca un test negativ să fie corect

Riscul relativ =AP(FP+AN)FN(AP+FP)

Rata şansei =(AP∙AN)(FN∙FP)

Riscul atribuabil =AP(AP+FP)-FN(FN+AN)

24

Denumire Formula

Rata falşilor pozitivi = 5(5+1) = 08334

Rata falşilor negativi = 7(7+16) = 03043

Sensibilitate = 1(1+7) = 01250

Specificitate = 16(16+5) = 07619

Acurateţe = (1+16)29 = 05862

Valoarea predictivă pozitivă = 1(1+5) = 01667

Valoarea predictivă negativă = 16(16+7) = 06957

Riscul relativ = 1(5+16)7(1+5) = 2142 = 050

Rata şansei = (1∙16)(7∙5) = 04571

Riscul atribuabil = 1(1+5)-7(7+16) = 01667-03043=-01376

Testarea asocierii icircn tabela de contingenţă

Testul χ2

Nu trebuie utilizat pentru eşantioane de volum mic

Testul este valid doar dacă valoarea expectată (aşteptată) pentru fiecare celulă este cel puţin

egală cu 1 şi frecvenţa absolută observată este de minim 5

Dacă aceste condiţii nu sunt icircndeplinite se aplică testul exact al lui Fisher (Fisherrsquos Exact Test)

Indică dacă cele două variabile sunt sau nu independente DAR NU cuantifică puterea asocierii

dintre ele

Problema S-a investigat icircntr-un studiu asocierea dintre obezitatea (ca factor de risc) şi bolile

cardio-vasculare la persoanele icircn etate (gt 60 ani) Din totalul de 620 persoane investigate s-au

identificat 150 persoane cu obezitate şi boală cardio-vasculară 230 persoane fără obezitate şi

fără boală cardio-vasculară şi 60 persoane fără obezitate dar cu boală cardio-vasculară Există

o asociere icircntre obezitate şi boala cardio-vasculară (df=1 α=005 χ2critic = 384)

Testul χ2 exemplu

H025

Nu există asociere icircntre obezitate şi bolile cardio-vasculare

Obezitatea şi bolile cardio-vasculare sunt independente

H1

Există asociere icircntre obezitate şi bolile cardio-vasculare

Obezitatea şi bolile cardio-vasculare sunt asociate

a = 005 pragul de semnificaţie al testului

urmează o lege cu (r-1)(c-1) grade de libertate

χ2 = parametrul testului χ2

fio = frecvenţa observată

fit = frecvenţa teoretică

Regiunea critică este [χα2 yen)

Pentru α = 005 χα2 = 384

OBSERVAT BCV+ BCV- Total

Obezitate + AP = 150 FP = 180 330

Obezitate - FN = 60 AN = 230 290

Total 210 410 620

TEORETIC BCV+ BCV- Total

Obezitate + = 330times210620 = 330times410620 330

Obezitate - = 290times210620 = 290times410620 290

Total 210 410 620

TEORETIC BCV+ BCV- Total

Obezitate + = 330times210620 = 330times410620 330

26

Obezitate - = 290times210620 = 290times410620 290

Total 210 410 620

TEORETIC BCV+ BCV-

Obezitate + = 112 = 218

Obezitate - = 98 = 192

Deoarece 4177Icirc[384 yen) se respinge H0 cu un risc de eroare de 5

Există asociere icircntre obezitate şi bolile cardio-vasculare

Testul Fisher

Corecţie a testului χ2

Valoarea p asociată parametrului ne dă probabilitatea ca valoarea observată de independenţă să fie

atribuită doar şansei

O valoare p mică indică că există alte cauze decacirct şansa influenţează rezultatul şi astfel cele două

variabile investigate nu sunt independente

Testul Fisher = dispersia corectată a factorului x dispersia corectată a factorilor reziduali

Icircn acest context regula adunării dispersiilor se poate scrie unde

este variaţia lui y pe seama variaţiei variabilei x

este variaţia lui y pe seama influenţei factorilor reziduali (neicircnregistraţi)

este variaţia totală a caracteristicii y

Testul Fisher empiric se calculează după formula

27

se compară cu Ftab pentru nx şi nz grade de libertate la un anumit prag de semnificaţie stabilit

Dacă Fc gt Ftab rezultă că variaţia factorului de grupare x este semnificativă pentru variaţia caracteristicii y

Testul z pentru proporţii

1 Compararea unei frecvenţe observate cu o frecvenţă teoretică

2 Testarea egalităţii a două frecvenţe

Testul z Compararea unei frecvenţe observate cu o frecvenţă teoretică

Scop Investigarea semnificaţiei diferenţei icircntre o frecvenţă teoretică p (icircntr-o populaţie) şi o frecvenţă

observată f pe un eşantion reprezentativ (variabilă calitativă (binare))

Condiţii de aplicare Testul este corect aplicat dacă numărul n al observaţiilor eşantionului este

suficient de mare (n∙p n∙(1-p)gt10

Parametrul

n = volumul eşantionului

Suntem interesaţi de investigarea prevalenţei hepatitei B la personalul care lucrează icircn laboratoarele

clinicilor de boli infecţioase din Transilvania Se ştie din studii anterioare că prevalenţa hepatitei B icircn

populaţia generală din Transilvania este de 9 S-a luat icircn studiu un eşantion de 100 persoane şi s-a

obţinut o prevalenţă a hepatitei B de 6 Există diferenţă semnificativă icircntre frecvenţa hepatitei B la

personalul care lucrează icircn laboratoarele spitalelor de boli infecţioase din Transilvania faţă de

populaţia generală

f = 006 p = 009 n = 100

Ipoteza nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat

faţă de frecvenţa hepatitei B icircn populaţia generală

Ipoteza alternativă test bilateral Există diferenţă semnificativă icircntre frecvenţa hepatitei B la

nivelul eşantionului şi prevalenţa hepatitei B icircn populaţia generală

f = 006 p = 009 n = 100

Pragul de semnificaţie a = 005

Regiunea critică test bilateral (-yen -196 ]Egrave[196 yen)

28

Concluzia testului

Deoarece parametrul statistic calculat al testului nu aparţine regiunii critice se acceptă ipoteza

nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat faţă de

frecvenţa hepatitei B icircn populaţia generală

Testul McNemar

Evaluarea dependenţei variabilelor calitative perechi (dorim să determinăm dacă o anumită

caracteristică este sau nu asociată cu o anumită patologie)

Identificăm n pacienţi care prezintă patologia de interes (eg Cancer bronho-pulmonar) şi n

pacienţi cu aceleaşi caracteristici ca şi primul grup dar care nu o prezintă

Martor = da Martor = nu

Caz = da a b

Caz = nu c d

Testul McNemar - exemplu fumat vs cancer

Martor = da Martor = nu

Cancer = da a = 2 b = 5

Cancer = nu c = 0 d = 3

29

χ2critic(α=005) = 384

32 lt 384 rarr acceptăm ipoteza nulă

Fumatul nu este icircn relaţie cu apariţia cancerului bronho-pulmonar

Inferenţa statistică pe date cantitative

Variabile cantitative continue

Testul z şi Student (t) (o medie sau medii perechi)

Testul z şi Student (t) (testarea a două medii)

ANOVA (ge 3 medii)

Ranguri (variabile cantitative discrete sau cantitative care nu icircndeplinesc condiţia de

normalitate)

Testul sumei rangurilor Wilcoxon

Kruskal-Wallis (ge 3 eşantioane independente)

Friedman (ge 3 eşantioane dependente)

Teste de normalitate variabile cantitative continue

Shapiro-Wilk

Kolmogorov-Smirnov

Shapiro-Wilk

Chi-Square Goodness-of-Fit

Dacă datele urmează o distribuţie normală aplicăm un test parametric

Dacă datele nu urmează o distribuţie normală aplicăm un test de comparare al rangurilor

30

Testul Z de comparare a mediei unui eşantion cu media unei populaţii

Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ

extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie

s2 care se cunoaşte

Condiţii de aplicare

1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru

compararea mediei unui eşantion cu media unei populaţii)

2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal

distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă

3 Talia eşantionului este mare ( ge 30)

Ipoteze

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media

eşantionului şi media populaţiei

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

(-yen -196 ] Egrave [196 yen)

Parametrul testului

n = volumul eşantionului

= media eşantionului

s = deviaţia standard a populaţiei

Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)

Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard

cunoscută

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi

media standard

Condiţii de aplicare

Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se

realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această

condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea

31

Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai

puternic

Numărul de grade de libertate (df) df = n-1

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

Parametrul testului

n = volumul eşantionului

micro0 = media standard

= media eşantionului

s = deviaţia standard a eşantionului

Testul ANOVA compararea mediilor a mai multe eşantioane

H0 = toate mediile sunt egale

H1 = nu toate mediile sunt egale

Condiţii de aplicare

1 Datele sunt independente unele faţă de celelalte

2 Datele fiecărui grup sunt normal distribuite

3 Deviaţia standard este aceeaşi pentru toate grupurile

Id Medicament

A B C D E F

1 5 6 7 10 5 9

2 6 8 8 11 8 8

3 7 7 9 13 6 7

4 8 9 11 12 4 5

32

5 9 10 10 9 7 6

Suma 35 40 45 55 30 35

Media 7 8 9 11 6 7

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =

= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)

Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2

F = (suma pătratelor(icircntre))(suma pătratelor(icircn))

Suma pătratelor (icircntre) = 16times5 = 80

Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60

Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn

interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare

SP df Media pătratelor F = MPicircntreMPicircn

Icircntre 80 5 = 805 = 16 = 1625 = 64

Icircn 60 24 = 6024 = 25

Total 140 29 -

Testul sumei rangurilor Wilcoxon

Aplicat pentru

Un set de observaţii provenite dintr-o valoare ipotetică comună

Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)

Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero

Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace

Suma rangurilor pentru diferenţele negative = 2+3+1 = 6

Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30

33

Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului

egal cu 8 = 0109

Icircnainte După Diferenţa Rang

64 66 -2 2

66 58 8 5

67 68 -1 3

71 65 6 4

72 75 -3 1

76 67 9 6

78 59 19 8

89 74 15 7

Testul Kruskal-Wallis (ge 3 eşantioane independente)

Test de ranguri aplicate pe mai mult de 3 eşantioane

H = parametrul testului

n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)

Tk = suma rangurilor

Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie

pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni

34

df = k-1 (k = numărul de eşantioane)

df = 3-1 = 2

Hcritic(α=005) = 599

H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie

pozitivă şi respectiv biopsie negativă

Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie

a tipului de studiu pe eşantioane perechi)

1 Definirea numărului de tratamente k

2 Obţinerea rangurilor pentru fiecare tratament

3 Sumarea rangurilor fiecărui tratament

4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)

5 Dacă Fr gt Frcritic rarr respingem H0

Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost

măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi

n = 9 k = 3 T12 = 225 T2

2 = 38025 T32 = 38025

Frcritic = 599

Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de

prostată

35

De reţinut

Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei

Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-

of-Fit

Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z

Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t

Compararea mediilor a 3 sau mai multe eşantioane ANOVA

Compararea mediilor a două populaţii (σ) testul Z

Compararea mediilor a două eşantioane (s) testul t

Compararea mediilor a două eşantioane perechi (s) testul t

ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi

cu cel pentru compararea a două eşantioane perechi

Ranguri

Distribuţia datelor nu are importanţă

Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)

Trei sau mai multe eşantioane Kruskal-Wallis

Trei sau mai multe eşantioane perechi Friedman

Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia

Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a

datelor)

Variabile nominale

Un singur eşantion sau eşantioane perechi

Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte

Eşantioane perechi testul Mc Nemar

Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2

Icircn analiza proporţiilor există teste diferite pentru

Compararea unei frecvenţe cu o frecvenţă cunoscută

Compararea a două frecvenţe

Semnificaţia statistică

Valoarea p (p value)

Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor

două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E

posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării

aleatorii

36

Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală

urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii

Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este

probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un

experiment de dimensiunea acestuia

Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că

diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii

diferite

Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca

fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă

ar fi fost adevărată

Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă

1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe

baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De

fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001

2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie

3 Se aplică testul statistic aferent pentru a calcula valoarea p

4 Se compară valoarea p cu valoarea ndash prag

5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe

semnificativă dpdv statisticrdquo

6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e

semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să

conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă

Teste de semnificaţie

Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului

populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)

Testarea ipotezelor implică posibile erori

Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile

sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui

grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul

icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005

ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există

37

nici o diferenţă

Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ

statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de

ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost

ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau

dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă

cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă

semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe

ipotetice variate icircn cazul icircn care ele există

Măsuri ale frecvenţei

Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)

Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate

Generic formula pe care se bazează toate cele trei este

unde x şi y sunt cantităţile de comparat

Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea

unei frecvenţe pe grupe de sex vacircrstă etc

Proporţia implică icircn mod necesar ca x să fie inclus icircn y

Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară

frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp

Pentru calcularea unei rate trebuie ţinut cont de trei aspecte

bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin

bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp

bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo

Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un

tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei

populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei

aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)

38

Indicatori

Rata de incidenţă

Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă

icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii

Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o

perioadă de timp

Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de

timp x

Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei

susceptibili de a dezvolta icircmbolnăvirea studiată

Numitorul poate fi

bull Numărul mediu al populaţiei icircn perioada de timp studiată

bull Mărimea populaţiei icircn mijlocul perioadei de studiu

bull Mărimea populaţiei la icircnceputul studiului

Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă

Este obligatorie menţionarea perioadei de timp

Prevalenţa

Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la

un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă

schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa

momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)

39

Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include

numai cazuri noi respectiv include cazuri noi şi vechi

Rata de atac

Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este

folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp

raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori

Rata persoană-timp

Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din

momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte

migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost

observate

Riscul relativ (RR)

Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment

legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele

prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două

grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la

bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la

bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai

mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo

Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2

Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn

cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă

(Tabelul 1)

Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR

Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la

neexpuşi

40

Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de

culegere a datelor

Odds ratio (OR)

Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin

raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general

studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)

Tabelul 2 Tabelul 2 x 2 pentru calcularea OR

Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală

Rate de mortalitate

Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp

specificată Există mai multe tipuri de rate de mortalitate

o Mortalitate specifică pe sex

o Mortalitate specifică pe rasă

o Mortalitate specifică pe boală

o Mortalitate neonatală

o Mortalitate postneonatală

o Mortalitate infantilă

o Mortalitate maternă

Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP

41

Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de

viaţă şi vacircrsta la care survine decesul dacă este prematur

Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu

Ani de viaţă pierduţi datorat dizabilităţii

Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt

utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru

cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite

grupuri

Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de

risc şi o boală se folosesc riscul relativ şi odds ratio

35 Analiza şi interpretarea datelor

După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date

trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul

Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor

colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului

studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu

plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde

prezenţa biostatisticianului este necesară

Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu

elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat

iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului

iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate

depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori

testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere

clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza

Interpretarea rezultatelor statistice

Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne

motive (număr mic de date) acceptarea ei să fie falsă

Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine

gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia

ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument

de decizie Intervalul de confidenţă

42

Interpretarea statistica ne interpretarea clinică

Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă

Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice

obţinute pe eşantionul studiat

Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare

Ce interpretăm Rezultatele

personale obţinute icircn urma studiului

care au fost prezentate icircn secţiunea bdquoRezultaterdquo

Explicăm rezultatele obţinute

Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale

Interpretarea trebuie să se realizeze icircn

lumina limitelor studiului

contextul cultural social şi educaţional al locului unde s-a realizat cercetarea

contextul a ceea ce se cunoaşte din literatura de specialitate

Interpretăm doar rezultatele personale obţinute icircn urma studiului

Interpretarea statistică nu este tot una cu interpretarea clinică

Interpretarea statistică este importantă

Interpretarea clinică este foarte importantă

Intervalul de confidenţă

Media calculată pe baza unui eşantion nu va echivala media populaţiei

Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului

Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a

populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a

populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)

pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru

orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare

dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de

confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de

date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de

5

Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel

Dacă valoarea p este mică

Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare

aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o

medie diferită Diferenţa este semnificativă dpdv statistic

43

Icircn continuare

Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa

reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică

pentru a fi interesante din punct de vedere ştiinţific

Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC

oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care

este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a

obţine o concluzie clară

Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o

diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că

datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din

punct de vedere ştiinţific

Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul

detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat

Erorile studiilor medicale

Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura

anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară

caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea

asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri

legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias

Erorile potenţiale icircn studiile epidemiologice

1 Erori icircntacircmplătoare

2 Erori sistematice

3 Confuzia

4 Validitatea

1 Erori icircntacircmplătoare

Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a

parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel

de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot

fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii

(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor

de măsură (eroarea de măsurare)

44

2 Erori sistematice

Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate

care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu

acurateţe mare Acurateţea nu este afectată de mărimea eşantionului

Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de

experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea

dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus

şi greu de cuantificat (consum de alcool personalitate etc)

Principalele tipuri de erori din această categorie sunt

bull Biasul de selecţie

bull Biasul de informaţie

Biasul de selecţie

Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul

trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion

inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale

persoanelor incluse

Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se

ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia

Biasul de informaţie

Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de

instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze

expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere

nesemnificativă sau chiar să nu şi-o amintească de loc

3 Confuzia

Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune

prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este

cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă

de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte

important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor

protector

4 Validitatea

Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă

Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte

estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional

Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă

45

conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se

demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)

Validitatea externă se poate realiza numai dacă studiul este valid intern

Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii

studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de

studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt

laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi

validă din punct de vedere intern)

3 6 Prezentarea rezultatelor

După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite

Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor

icircntr-o formă bdquodigerabilărdquo este necesară

Scopul prezentării datelor

1 Transmiterea concluziilor studiului

a Datele corecte şi importante merită comunicate

b Datele trebuie să confirme sau să infirme ipoteza studiului

c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală

2 Acordarea posibilităţii altor cercetători să aprecieze studiul

a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti

b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor

prezentate

Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru

fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie

statistică

Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de

valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras

(Tabel 3)

Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)

46

Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct

numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor

precum şi prezentarea acestora sub formă inteligibilă

Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care

convin cercetătorului

Prezentarea datelor se poate face

1 Figuri şi tabele icircn articole scrise

2 Figuri şi tabele icircn prezentări orale

3 Figuri şi tabele icircn postere

4 Text scris sau incluse icircn text

5 Site-uri de WEB

Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor

Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie

Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele

exprimacircnd exact ceea ce acestea exprimă

Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate

anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel

să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se

acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca

mai sus sugestive sunt formatele simple şi puţin icircncărcate

Dacă nu există reguli impuse se respectă

1 Mesaj simplu fără falsificarea datelor

2 De obicei este necesar atacirct tabelul cacirct şi graficul

3 Să fie simplu şi clar

Tabele

Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile

coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică

elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de

1 Se folosesc doar linii orizontale

2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn

evidenţi prin linie de separare (Tabelul 4)

Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland

Noua Zeelandă)

(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)

47

3 Numerele sunt aliniate icircn funcţie de virgulă

4 Indicii statistici sunt explicaţi sub tabel

5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană

6 Abrevierile pot fi folosite

7 Numărul de zecimale trebuie limitat la maxim două

8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel

9 Plasarea legendei este obligatorie sub tabel

10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)

Icircn cazul prezentărilor orale sau a posterelor este indicat ca

1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării

2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte

3 Folosirea de simboluri este permisă

Clasificarea tabelelor

Tabelele se clasifică după

i) conţinut

bull cu distribuţii de frecvenţe

bull de clase de frecvenţe

bull de contingenţă

ii) structura

bull cu doua coloane

bull cu subclasificări

bull ldquomasterrdquo

Tabele ce conţin distribuţii de frecvenţe

O modalitate comodă de a prezenta o mulţime de date brute este

1 Se ordonează datele in ordine crescătoare

2 Se determine frecvenţa fiecărei valori

3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane

(Tabelul 5)

Tabelul 5 Distribuţii de frecvenţă absolută

48

Tabelul claselor de frecvenţe

1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă

2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)

Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)

Tabele de contingenţă

1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a

tabelelor de contingenţă

2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a

combinaţiilor de perechi ordonate de valori

3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre

a factor de risc si

b starea sănătăţii

4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)

5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)

Tabelul 7 Tabel de contingenţă 2 x 2

49

Grafice

Există două categorii de moduri grafice sub care se pot prezenta datele

1 Ilustraţii şi fotografii

2 Grafice

1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă

pentru lucrare

2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit

Putem vorbi despre mai multe tipuri de grafice

bull Grafice pentru reprezentarea datelor cantitative

1048707 Grafic cartezian (X Y)

1048707 Histograma

1048707 Poligonul de frecvenţe

1048707 Diagrama bdquoscatterrdquo

bull Grafice pentru reprezentarea datelor calitative

1048707 Grafic cu bare

1048707 Diagrama tip bdquoboxplotrdquo

1048707 Diagrama bdquopierdquo

1048707 Cartograma

Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi

dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)

Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)

Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie

Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)

Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)

50

Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir

de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele

două variabile studiate (Figura 6)

Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2

(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2

rămacircne aproximativ constantă)

Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea

comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea

comparativă a mai multor variabile

Figura 7 Grafic calitativ cu bare

51

Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo

Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două

posibilităţi reprezentate grafic este mai frecventă (Figura 8)

Figura 8 Reprezentare tip bdquopierdquo

Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli

sau a oricărui element comparativ Se foloseşte de epidemiologi

Rezultate

Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare

Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o

manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu

explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția

bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la

ilustraţii tabele grafice

Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi

nici rezultatele care invalidează eventual ipoteza

Discuţii

Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd

cultura ştiinţifică şi inteligenţa autorilor

Acest capitol răspunde la trei obiective

Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia

calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de

selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează

rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv

52

este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn

care a fost abordată problema fără a face o revistă a literaturii

Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea

rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul

Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor

afirmaţii nesusţinute de conţinutul lucrării

Concluzii

Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate

să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie

Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de

concluzii va scădea valoarea lucrării

Bibliografia (lista referinţelor citarea icircn text)

Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn

lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente

Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli

- să conţină cele mai importante şi recente lucrări

- să includă numai lucrări publicate

- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate

Bibliografie

Elisabeta Jaba ndash Statistică Ed Economică 1998

Mihai Ţarcă ndash Statistică volI Ed UAIC 1979

Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale

Ed University Press 2009

Sorana Daniela Bolboacă ndash Metodologia cercetării curs

53

Page 12: cercetarea medicala - metodologie

Tipuri de culegere a datelor

1 Culegere de tip eşantion reprezentativ Grupul de indivizi incluşi icircn studiu sunt reprezentativi (calitativ şi

cantitativ) pentru populaţia generală Poate fi utilizat pentru studii descriptive (cel mai frecvent) dar uneori şi

pentru studii analitice

Este necesar pentru acest tip de culegere a datelor ca iniţial să fie cunoscută talia eşantionului (calculabilă icircn

funcţie de prevalenţă şi precizie) Pentru evaluarea datelor culese se utilizează tabelul de contingenţă 2 x 2

astfel (Figura 1)

Figura 1 - Tabelul de contingenţă 2 x 2

Unde

a ndash persoane expuse unui factor de risc care au boala studiată

b ndash persoane expuse unui factor de risc care nu au boala studiată

c - persoane neexpuse unui factor de risc care au boala studiată

d - persoane neexpuse unui factor de risc care nu au boala studiată

După aranjarea datelor icircn tabelul de contingenţă (2 x 2) se poate icircncepe analiza statistică a datelor atacirct ca

procente calculabile cacirct şi din punct de vedere a aplicării de teste statistice pentru elucidarea semnificaţiei

statistice

Este posibilă din acest tip de culegere de date calcularea

1 Prevalenţei unei boli

2 Frecvenţei expunerii

3 Gradul de asociere icircntre factorul eventual de risc şi boala

2 Culegerea de tip expus ndash neexpus Icircmparte subiecţii icircn două categorii expuşi sau neexpuşi factorului de risc

studiat Ca evoluţie următoare a studiului după o astfel de culegere a datelor se poate evalua icircn timp apariţia

icircmbolnăvirii despre care se efectuează studiul Icircn timp longitudinal prospectiv se poate calcula dacă factorul

studiat reprezintă un risc de icircmbolnăvire este indiferent sau chiar este cu efect protectiv Numărul subiecţilor

din cele două grupuri poate fi egal sau poate fi diferit Numărul acestora poate fi calculat icircn vederea obţinerii

unei bune reprezentativităţi cu ajutorul formulelor de selecţie Avacircnd icircn vedere calitatea longitudinală a

12

studiului este important ca numărul ales să fie mai mare pentru a putea suplinii eventualele pierderi din

urmărire Practic rezultatele sunt introduse icircn tabelul 2 x 2 de unde se pot calcula indicatorii doriţi (Figura 2)

Avacircnd icircn vedere modul de culegere a datelor este permisă calcularea de indicatori numai pe orizontală

orice comparare icircntre coloana dreaptă şi stacircngă fiind incorectă Avantajul acestui tip de culegere a datelor ar fi

eventualul număr mai redus de subiecţi dar dezavantajul major este cel al costurilor de urmărire icircn timp dar

trebuie luată icircn calcul şi pierderea de subiecţi din evidenţe Factorul controlat este deci prezenţa expunerii iar

factorul aleator este prezenţa bolii

Figura 2 Tabelul de contingenţă pentru tipul de culegere expus ndash neexpus

4 Culegerea de tip caz ndash martor Icircn acest caz ceea ce ghidează colectarea datelor este prezenţa sau absenţa

bolii icircn momentul prezent Se vor culege date de la două loturi constituite după criteriul de bolnav B+ şi de fără

boală B+ Datele culese sunt icircn trecut deci caracterul datelor va fi retrospectiv Icircn acest caz factorul controlat

este boala factorul aleator fiind expunerea (Figura 3)

Calculul de indicatori icircn acest caz se va putea efectua numai icircntre coloane orice calcul icircntre valorile de pe linii

fiind greşit Rezultate semnificative se pot obţine icircn acest caz utilizacircnd loturi mai mici de studiu prin

comparaţie cu tipul eşantion reprezentativ permiţacircnd icircn acelaşi timp studiul bolilor rare (cu prevalenţă mică)

Figura 3 Tabelul de contingenţă pentru tipul de culegere caz ndash martor

Metode de culegere a datelor

Metoda aleasă pentru culegerea datelor trebuie să fie aleasă după un atent studiu bibliografic icircn vederea

stabilirii celui mai eficient mod de a răspunde temei de studiu

Metodele de culegere trebuie să fie bine aplicabile şi consistente ca aport informaţional necesar

13

1 Fiziologice Sunt colectate date despre anumite caracteristici fiziologice ale pacienţilor (TA glicemie

colesterol etc) Această metodă aduce rezultate obiective cacirct timp instrumentul de evaluare este bine calibrat

şi prezintă variaţii mici

2 Metode observaţionale Instrumentul de culegere a datelor trebuie să fie sincronizat cu protocolul conceput

de cercetător Datele culese trebuie să fie de asemenea consistente adică să fie colectate de aceeaşi manieră

conducătorul studiului trebuind să instruiască investigatorii (colectorii de date) Icircnregistrarea datelor trebuie să

fie de asemenea sistematică şi bine standardizată Observaţii de control trebuie icircn mod obligatoriu făcute

pentru a putea aprecia icircn mod corect orice deviere datorată unor factorii externi Este obligatorie luarea icircn

consideraţie a aspectelor etice

3 Interviul Poate fi structurat cu un set specific de icircntrebări sau nestructurat cu o temă generală cu care se

icircncepe interviul Interviurile pot fi icircnregistrate sau intervievatorul poate nota pur şi simplu răspunsurile Există

două tipuri generice de interviu interviul de profunzime care se referă la o discuţie icircn general structurată cu

un număr de icircntrebări prestabilite icircn icircncăperea de studiu fiind doară intervievatorul şi persoana chestionată şi

interviul de grup unde prin conversaţii pornind de la temă generală expusă şi condusă de intervievator se

obţin date despre subiecţii participanţi la studiu Ambele metode de interviu au indicaţiile lor precise Un

interviu pe teme intime nu va putea fi corect icircn ceea ce priveşte datele colectate dacă se aplică un interviu de

grup

4 Chestionarul Document scris adresat unor persoane pentru a răspunde la una sau mai multe icircntrebări

Trebuie să aducă răspunsurile la icircntrebările care motivează studiul constituind ansamblul icircntrebărilor destinate

culegerii de informaţii (date) Redactarea chestionarului trebuie să ţină cont de structura acestuia introducere

conţinut exprimarea icircntrebărilor grafica chestionarului

5 Icircnregistrări preexistente

Icircn cercetarea medicală sunt cel mai frecvent utilizate Informaţiile dorite sunt deja existente ceea ce icirci revine

cercetătorului este ca să structureze datele icircn funcţie de scopul studiului pe care icircn conduce Aceste surse sunt

bull Foi de observaţie

bull Registre de consultaţie

bull Buletine de analize

bull Registre de operaţii

Icircn cazul icircn care nici o metodă de culegere a datelor nu este pe placul celui ce conduce studiul există

posibilitatea de a construi un instrument nou de culegere a datelor

Acest proces trebuie să urmărească nişte paşi obligatorii fiind mare consumator de timp

bull Definirea structurii cu care se va face măsurarea

bull Formularea itemilor de măsură

bull Analiza validităţii instrumentului de măsură ndash măsoară acesta fenomenul corect

bull Elaborarea de instrucţiuni de utilizare pentru investigatori

14

bull Pretestarea instrumentului

bull Aprecierea validităţii interne şi externe a datelor culese

Instrumente de cercetare

Formularea clară a temei de cercetare necesită o foarte bună definire a factorilor studiaţi şi a criteriilor de

judecată Acestea din urmă sunt ultimele care vor trebui definite icircn cadrul protocolului de studiu

Alegerea unui instrument de măsură

Nu există un instrument de măsură perfect sau universal corect Alegerea sa dintre cele existente şi cele deja

utilizate depind de trei factori

bull Obiectivul studiului

bull Boala studiată

bull Populaţia icircn studiu

De aceste trei elemente trebuie ţinut cont icircn fiecare etapă a dezvoltării instrumentului

Definirea obiectivului

Studiu transversal Dacă se doreşte studierea unui simptom sau a unei caracteristici ale populaţiei se poate

icircmpărţi populaţia de studiu icircn mai multe grupuri Este practic vorba de a determina diferenţele dintre subiecţi

icircn cea ce priveşte o variabilă necesară studiată printr-un studiu transversal (utilizarea dozării de Ac HBS

pentru a evalua progresele bolnavilor de hepatită tip B)

Studiu longitudinal Icircn acest caz nu se poate icircmpărţii populaţia de studiu icircn mai multe grupuri datele obţinute

fiind de la acelaşi subiect colectate după un interval de timp

Icircn funcţie de boală şi populaţie se aleg şi instrumentele de măsură cele mai adecvate

Instrumentele cercetării reprezintă un mecanism specific sau o strategie pe care cercetătorul o utilizează pentru

colectarea prelucrarea şi inferenţa datelor Aceste instrumente sunt

1 Studiul icircn bibliotecă

2 Computerul

3 Determinările experimentale

4 Statistica

5 Mintea umană

6 Facilităţi de limbaj şi comunicare

Determinările experimentale

Măsurarea constă icircn aprecierea şi cuantificarea fenomenelor calitativ sau cantitativ Interpretarea

datelor se referă la transformarea lor icircn unităţi de descoperire a unor fenomene mai puţin cercetate

Standardele acceptate se referă la norme medii distribuţii etc Tot icircn cadrul interpretării datelor datele

obţinute sunt caracterizate pe scale de valori nominal ordinal de interval sau de raport

Validarea şi reproductibilitatea măsurătorilor sunt aspecte importante şi foarte necesare pentru o

cercetare corect fundamentată care doreşte obţinerea unor concluzii pertinente

15

Statistica Este implicată icircn condensarea şi procesarea unui volum mai mare de date astfel icircncacirct să se poată

interpreta corect valorile obţinute şi să se permită comparările Utilizarea unor teste statistice specifice permite

determinarea semnificaţiei (diferenţei) statistice astfel icircncacirct estimatorii să poată fi aplicaţi la populaţia

generală Furnizează informaţii şi privind corelarea sau relaţionarea icircntre date

Mintea umană este cea care reuşeşte să integreze şi să icircnţeleagă rezultatele obţinute Semnificaţia ştiinţifică

este stabilită icircn funcţie de rezultatele statisticii de mintea umană conform afirmaţiei bdquosemnificaţia ştiinţifică

nu este egală cu semnificaţia statisticărdquo Metodele aplicate pentru a putea ajunge la o concluzie pertinentă sunt

logica deductivă raţionamentul inductiv şi gacircndirea critică

Limbaj şi comunicare Exprimarea orală sau icircn scris permite nuanţarea unor aspecte seci cifrice ale unor

studii Icircn acest mod devine mai evidentă semnificaţia ştiinţifică a unor rezultate statistice

34 Prelucrarea datelor

Instrumentele de prelucrare

Statistica este o ştiinţă ramură a matematicii care studiază evoluţia fenomenelor şi proceselor

colective pe baza observării lor ştiinţifice a culegerii şi prelucrării detaliate a informaţiilor statistice cu scopul

de a formula şi explica legile legităţile şi regularităţile ce le guvernează

Statistica permite deci aprecierea unor parametrii populaţionali prin studiul unui număr redus de

elemente ale populaţiei icircn studiu (ţintă) O populaţie poate fi definită printr-un şir de valori care pot fi grupate

icircn funcţie de parametrul studiat (glicemie colesterol TAD TAS etc) Pentru fiecare astfel de şir se defineşte

o variabilă (care va purta nume propriu glicemie colesterol etc) Practic variabila este considerată o funcţie

ia valori posibil diferite de la un element la altul icircn funcţie de caracteristicile proprii acestora Sunt clasificate

icircn două grupe variabile cantitative (caracteristică măsurabilă) şi calitative (caracteristică ce nu poate fi

măsurată)

La racircndul lor variabilele calitative pot fi

bull Nominale ndash grupuri de elemente ce nu pot fi ordonate (culoarea părului)

bull Nominale ordonate ndash concluziile pot fi grupate (eficienţa unui tratament slabă bună foarte bună)

bull Binare ndash apar numai două posibilităţi (bolnav sănătos)

Variabilele cantitative pot fi

bull Continue ndash o variabilă măsurabilă care poate lua o infinitate de valori

bull Discrete ndash variabile care nu pot lua decacirct valori icircntregi

Statistica descriptivă

Există două ramuri ale statisticii statistica descriptivă şi statistica inferenţială

Statistica descriptivă (după cum rezultă din denumire) se ocupă cu descrierea unor valori obţinute ale unei

variabile studiate

16

Valorile pe care variabila le ia se constituie icircntr-o serie statistică Indicatorii care definesc o variabilă (serie)

sunt

1 Ale tendinţei centrale

Media aritmetică - notată de regulă cu

Mediana - este acea valoare din şirul de date care icircmparte icircn două părţi egale şirul ordonat de valori (atenţie

şirul este ordonat crescător) situacircndu-se la mijlocul seriei statistice

Dacă numărul de valori n este un număr impar atunci mediana este valoarea unde

Dacă n este par deci avem un număr par de valori mediana este definitatilde ca fiind

unde k = n2

Modul - constituie valoarea care apare cel mai des deci valoarea cu numărul cel mai mare de apariţii

2 De dispersie

Amplitudinea - este diferenţa dintre valoarea maximă şi cea minimă

A = Amax - Amin

Amplitudinea relativă - notată A este raportul dintre amplitudinea absolută şi media aritmetică a seriei de

date

Varianţa notată este un indicator de icircmprăştiere a datelor Formula de calcul este

Abaterea standard (S) sau deviaţia standard reprezintă rădăcina pătrată din varianţă (dispersie)

Coeficientul de variaţie se calculează ca un raport procentual icircntre abaterea standard şi valoarea medie a şirului

de valori

Eroarea standard intervine icircn estimarea intervalelor de confidenţă Se calculează astfel

17

3 De asimetrie (skewness) indică distribuţia datelor dacă sunt sau nu distribuite normal

4 De boltire (kurtosis) estimează boltirea sau aplatizarea curbei de distribuţie

Prezentarea descriptivă a datelor se face prin icircnregistrarea datelor culese icircn tabele care să reprezinte icircn mod

sintetic valorile măsurate

Icircn concluzie statistica descriptivă permite

bull Stabilirea comparabilităţii icircntre grupurile de studiu şi aprecierea prezenţei erorilor sau confuziei

bull Reprezentarea datelor icircn tabele permite evaluarea fiecărui pacient şi dacă a existat pierderi din studiu

Statistica inferenţială

Statistica inferenţială (inductivă) este partea de analiză a datelor care permite extrapolarea unei

concluzii trase pe baza unui eşantion spre populaţia ţintă pentru care a fost efectuat studiul

Scopul analizei statistice este de a evidenţia efectul unui tratament sau al unui factor de risc prin date obţinute

din eşantionul studiat spre populaţia ţintă Aceasta implică testarea ipotezelor statistice sau altfel spus testarea

semnificaţiei statistice Este una dintre cele mai importante momente ale studiului Cum rezultatele sunt

obţinute prin studiul unui eşantion există posibilitatea ca acestea să fie datorate icircntacircmplării Testele

statistice ne ajută să apreciem icircn ce măsură rezultatele sunt icircntacircmplătoare şi mai ales icircn ce măsură şi dacă se

pot aplica populaţiei generale Icircn acest scop se impune o valoare limită alfa 005 care reprezintă limita

superioară a probabilităţii ca rezultatul obţinut să fie greşit (datorat icircntacircmplării) Astfel icircn funcţie de tipul

variabilelor şi indicatorii descriptivi aplicaţi şi evaluaţi se aplică teste de semnificaţie statistică (Tabelul 1)

Tabelul 1 Alegerea testelor de semnificaţie statistică

Tipul datelor

18

Diferenţierea variabilelor din punctul de vedere a distribuţiei se face folosind testul de normalitate

Kolmogorov ndash Smirnov

Testul statistic reprezintă metoda de comparaţie a două sau mai multe populaţii prin intermediul unor

variabile observate ale lor

Scopul unui test statistic este de a defini realitatea

Definirea icircntrebării de cercetare (ipoteza clinică)

Tratamentul cu Nebivolol este la fel de eficient ca şi cel cu Valsartan icircn tratamentul

hipertensiunii arteriale

Transpunerea icircntrebării de cercetare icircn termeni statistici (ipoteza statistică)

Media tensiunii arteriale a pacienţilor trataţi cu Valsartan nu diferă semnificativ de media

tensiunii arteriale a pacienţilor trataţi cu Nebivolol

Etapele unui test statistic

1 Formularea problemei icircn termenii ipotezelor statistice

2 Alegerea şi calcularea parametrului statistic al testului

3 Regiunea critică

4 Concluzia testului

1 Formularea problemei icircn termenii ipotezelor statistice

Ipoteza nulă ipoteza care trebuie testată testul efectuacircndu-se sub prezumţia că ipoteza nulă ar

fi adevărată

Ipoteza alternativă acea ipoteză care icircntr-un sens sau altul contrazice ipoteza nulă Această

ipoteză se mai numeşte şi ipoteza de lucru

Ipoteza nulă tipuri

O coadă (ldquoone-tailedrdquo sau ldquoone-siderdquo)

Media este mai mare

Media este mai mică

Două cozi (ldquoone-tailedrdquo sau ldquoone-siderdquo)

Media este egală

2 Alegerea şi calcularea parametrului statistic al testului

Parametrul statistic al testului exprimă icircntr-o anumită formă diferenţa dintre elementele comparate

Ţinacircnd seama de faptul că eşantionul sau eşantioanele utilizate sunt aleator extrase din populaţiile care

fac obiectul testului parametrul statistic este o variabilă aleatoare de selecţie care urmează o anumită

lege de probabilitate

Un parametru statistic al testului bun trebuie să icircndeplinească două condiţii

19

Trebuie să se comporte diferit atunci cacircnd ipoteza nulă H0 este adevărată faţă de situaţia icircn

care ipoteza alternativă H1 este adevărată

Distribuţia de probabilitate a parametrului statistic al testului sub prezumţia că H0 este

adevărată este cunoscută

3 Regiunea critică

- Trebuie să fim capabili să decidem icircn funcţie de valoarea parametrului statistic calculat care dintre

ipoteze cea nulă sau cea alternativă este adevărată

- Dacă valoarea parametrului statistic aparţine regiunii critice ipoteza nulă H0 va fi respinsă şi va fi

acceptată ipoteza alternativă H1

- Dacă valoarea parametrului statistic nu aparţine regiunii critice ipoteza nulă H0 va fi acceptată

- Decidem mărimea regiunii critice

Pentru aceasta trebuie să specificăm mărimea riscului de eroare pe care icircl acceptăm

Pe scurt definim nivelul de semnificaţie notat cu a sau mărimea riscului pe care

suntem dispuşi să ni-l asumăm icircn respingerea ipotezei nule H0 icircn cazul icircn care aceasta

este adevărată De obicei se alege un nivel de semnificaţie icircntre 1 şi 5

Probabilitatea unei erori de tipul I

probabilitatea de respingere a ipotezei nule H0 icircn favoarea ipotezei alternative H1 icircn

condiţiile icircn care H0 este adevărată

probabilitatea unei erori de tipul I se notează cu a şi se mai numeşte nivel de

semnificaţie al testului

Probabilitatea unei erori de tipul II

probabilitatea acceptării ipotezei nule icircn condiţiile icircn care ipoteza alternativă H1 este

adevărată

această probabilitate se notează cu b

- Unilaterală la dreapta ndash valoarea parametrului statistic al testului este mai mare sau egală cu

valoarea din dreapta a intervalului critic

- Unilaterală la stacircnga ndash valoarea parametrului statistic al testului este mai mică sau egală cu

valoarea din stacircnga a intervalului critic

- Bilaterală ndash valoarea parametrului statistic al testului este mai mică sau egală cu valoarea extremă

din stacircnga regiunii critice sau mai mare sau egală cu valoarea extremă din dreapta regiunii critice

valorile extreme ale regiunii critice avacircnd nivele egale de semnificaţie

4 Concluzia testului

- Ipoteza nulă H0 este respinsă dacă valoarea parametrului statistic aparţine regiunii critice

20

- Regiunea critică trebuie astfel aleasă icircncacirct dacă ipoteza alternativă H1 este adevărată

probabilitatea de respingere a ipotezei nule H0 este mai mare decacirct icircn cazul icircn care ipoteza nulă H0

ar fi adevărată

- Acceptarea ipotezei nule H0 atunci cacircnd ipoteza alternativă H1 este adevărată este cunoscută ca şi

eroarea de tipul II

a probabilitatea ei se notează cu b

b măsoară bdquonivelul de eroarerdquo

- Icircn testarea oricărei ipoteze statistice există patru situaţii care determină dacă decizia noastră este

corectă sau nu

Cazuri

H0 este adevărată H0 este falsă

Concluzie H0 se acceptă decizie corectă eroare de tipul

II

H0 se

respinge

eroare de tipul I decizie corectă

Luarea deciziei pe baza valorii probabilităţii p de semnificaţie a testului

Icircn momentul icircn care prelucrăm statistic o serie de date dorim să ştim dacă rezultatele obţinute sunt sau

nu semnificative statistic

Răspunsul la această icircntrebare este dat de valoarea lui p calculată de orice program statistic la

prelucrarea unor date

Icircn cazul testelor statistice ipoteza nulă este respinsă dacă nivelul de semnificaţie este mai mic decacirct

005 iar programele de prelucrare statistică a datelor vor afişa o steluţă () icircn tabelul rezultatelor

21

Dacă p le 005 respingem ipoteza nulă şi acceptăm ipoteza alternativă (am obţinut semnificaţia

statistică)

Dacă p gt 005 acceptăm ipoteza nulă (nu am obţinut semnificaţia statistică)

p = 013

NU respingem ipoteza nulă

Risc de eroare de tip II

α = 005

p = 002

Respingem ipoteza nulă

Risc de eroare de tip I

Semnificaţia lui p

Criteriu de luare a deciziei cu privire la o ipoteză statistică nulă

Cuantifică şansa ca o decizie de respingere a ipotezei nule să fie greşită

Măsură a semnificaţiei statistice şi NU CLINICĂ

22

Semnificaţia lui p (reguli empirice)

001 le p lt 005 rezultatul e semnificativ statistic

0001 le p lt 001 rezultatul e icircnalt semnificativ statistic

p lt 0001 rezultatul e foarte icircnalt semnificativ statistic

p ge 005 rezultatul e considerat nesemnificativ statistic

Limite ale valorii p

Valoarea p NU ne dă informaţii despre

Şansa de beneficiu a unui pacient individual

Procentul de pacienţi care vor avea un beneficiu icircn urma instituirii procedurii medicale

Gradul de beneficiu expectat pentru un anumit pacient

Puterea unui test statistic

Este capacitatea de a detecta o diferenţă acolo unde există

Creşterea volumului eşantionului determină creşterea puterii testului statistic aplicat

Valoarea este icircn relaţie directă cu eroarea de tip II

Puterea = 1 ndash β

Cea mai utilizată modalitate de creştere a puterii unui test statistic este de a creşte volumul

eşantionului

Tipul scalei de măsură ndash testul statistic

Denumire test Interval Nominal Observaţii

Corelaţie Pearson 2 0 Există o relaţie liniară

χ2 0 2

Student 1 1 Doar 2 grupuri

ANOVA 1 1 2 sau mai multe grupuri

Student perechi 1 1 Eşantioane perechi

Măsurători repetate (ANOVA) 1 1 Mai mult de 2 grupuri date

perechi

Inferenţa statistică pe date calitativ e

Tabela de contingenţă 2times2

Riscuri şi raţii

Testul χ2 (testarea asocierii icircn tabela de contingenţă)

Testul Fisher

23

Testul z pentru proporţii

Testul McNemar

Tabela de contingenţă 2times2

Scale de tip nominal (dicotomiale tabela de contingenţă de 2times2) sau ordinal (tabela de contingenţă de

rtimesc)

Frecvenţa absolută (numărul de evenimente per categorie)

Tabela de contingenţă de 2times2 4 categorii

AP = adevărat pozitiv

FP = fals pozitiv

FN = fals negativ

AN = adevărat negativ

Ulcer deschis Ulcer vindecat Total

Recurenţă + AP = 1 FP = 5 = 1+5 = 6

Recurenţă - FN = 7 AN = 16 = 7+16 = 23

Total =1+7=8 =5+16=21 29

Riscuri şi raţii Mărimi ale asocierii

Denumire Formula Definiţie

Rata falşilor pozitivi =FP(FP+AN) Probabilitatea unui test fals + (α)

Rata falşilor negativi =FN(FN+AP) Probabilitatea unui test fals ndash (β)

Sensibilitate =AP(AP+FN) Probabilitatea unui test real + (1- β)

Specificitate =AN(AN+FP) Probabilitatea unui test real ndash (1- α)

Acurateţe =(AP+AN)n Probabilitatea generală a unei decizii corecte

Valoarea predictivă pozitivă =AP(AP+FP) Probabilitatea ca un test pozitiv să fie corect

Valoarea predictivă negativă =AN(AN+FN) Probabilitatea ca un test negativ să fie corect

Riscul relativ =AP(FP+AN)FN(AP+FP)

Rata şansei =(AP∙AN)(FN∙FP)

Riscul atribuabil =AP(AP+FP)-FN(FN+AN)

24

Denumire Formula

Rata falşilor pozitivi = 5(5+1) = 08334

Rata falşilor negativi = 7(7+16) = 03043

Sensibilitate = 1(1+7) = 01250

Specificitate = 16(16+5) = 07619

Acurateţe = (1+16)29 = 05862

Valoarea predictivă pozitivă = 1(1+5) = 01667

Valoarea predictivă negativă = 16(16+7) = 06957

Riscul relativ = 1(5+16)7(1+5) = 2142 = 050

Rata şansei = (1∙16)(7∙5) = 04571

Riscul atribuabil = 1(1+5)-7(7+16) = 01667-03043=-01376

Testarea asocierii icircn tabela de contingenţă

Testul χ2

Nu trebuie utilizat pentru eşantioane de volum mic

Testul este valid doar dacă valoarea expectată (aşteptată) pentru fiecare celulă este cel puţin

egală cu 1 şi frecvenţa absolută observată este de minim 5

Dacă aceste condiţii nu sunt icircndeplinite se aplică testul exact al lui Fisher (Fisherrsquos Exact Test)

Indică dacă cele două variabile sunt sau nu independente DAR NU cuantifică puterea asocierii

dintre ele

Problema S-a investigat icircntr-un studiu asocierea dintre obezitatea (ca factor de risc) şi bolile

cardio-vasculare la persoanele icircn etate (gt 60 ani) Din totalul de 620 persoane investigate s-au

identificat 150 persoane cu obezitate şi boală cardio-vasculară 230 persoane fără obezitate şi

fără boală cardio-vasculară şi 60 persoane fără obezitate dar cu boală cardio-vasculară Există

o asociere icircntre obezitate şi boala cardio-vasculară (df=1 α=005 χ2critic = 384)

Testul χ2 exemplu

H025

Nu există asociere icircntre obezitate şi bolile cardio-vasculare

Obezitatea şi bolile cardio-vasculare sunt independente

H1

Există asociere icircntre obezitate şi bolile cardio-vasculare

Obezitatea şi bolile cardio-vasculare sunt asociate

a = 005 pragul de semnificaţie al testului

urmează o lege cu (r-1)(c-1) grade de libertate

χ2 = parametrul testului χ2

fio = frecvenţa observată

fit = frecvenţa teoretică

Regiunea critică este [χα2 yen)

Pentru α = 005 χα2 = 384

OBSERVAT BCV+ BCV- Total

Obezitate + AP = 150 FP = 180 330

Obezitate - FN = 60 AN = 230 290

Total 210 410 620

TEORETIC BCV+ BCV- Total

Obezitate + = 330times210620 = 330times410620 330

Obezitate - = 290times210620 = 290times410620 290

Total 210 410 620

TEORETIC BCV+ BCV- Total

Obezitate + = 330times210620 = 330times410620 330

26

Obezitate - = 290times210620 = 290times410620 290

Total 210 410 620

TEORETIC BCV+ BCV-

Obezitate + = 112 = 218

Obezitate - = 98 = 192

Deoarece 4177Icirc[384 yen) se respinge H0 cu un risc de eroare de 5

Există asociere icircntre obezitate şi bolile cardio-vasculare

Testul Fisher

Corecţie a testului χ2

Valoarea p asociată parametrului ne dă probabilitatea ca valoarea observată de independenţă să fie

atribuită doar şansei

O valoare p mică indică că există alte cauze decacirct şansa influenţează rezultatul şi astfel cele două

variabile investigate nu sunt independente

Testul Fisher = dispersia corectată a factorului x dispersia corectată a factorilor reziduali

Icircn acest context regula adunării dispersiilor se poate scrie unde

este variaţia lui y pe seama variaţiei variabilei x

este variaţia lui y pe seama influenţei factorilor reziduali (neicircnregistraţi)

este variaţia totală a caracteristicii y

Testul Fisher empiric se calculează după formula

27

se compară cu Ftab pentru nx şi nz grade de libertate la un anumit prag de semnificaţie stabilit

Dacă Fc gt Ftab rezultă că variaţia factorului de grupare x este semnificativă pentru variaţia caracteristicii y

Testul z pentru proporţii

1 Compararea unei frecvenţe observate cu o frecvenţă teoretică

2 Testarea egalităţii a două frecvenţe

Testul z Compararea unei frecvenţe observate cu o frecvenţă teoretică

Scop Investigarea semnificaţiei diferenţei icircntre o frecvenţă teoretică p (icircntr-o populaţie) şi o frecvenţă

observată f pe un eşantion reprezentativ (variabilă calitativă (binare))

Condiţii de aplicare Testul este corect aplicat dacă numărul n al observaţiilor eşantionului este

suficient de mare (n∙p n∙(1-p)gt10

Parametrul

n = volumul eşantionului

Suntem interesaţi de investigarea prevalenţei hepatitei B la personalul care lucrează icircn laboratoarele

clinicilor de boli infecţioase din Transilvania Se ştie din studii anterioare că prevalenţa hepatitei B icircn

populaţia generală din Transilvania este de 9 S-a luat icircn studiu un eşantion de 100 persoane şi s-a

obţinut o prevalenţă a hepatitei B de 6 Există diferenţă semnificativă icircntre frecvenţa hepatitei B la

personalul care lucrează icircn laboratoarele spitalelor de boli infecţioase din Transilvania faţă de

populaţia generală

f = 006 p = 009 n = 100

Ipoteza nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat

faţă de frecvenţa hepatitei B icircn populaţia generală

Ipoteza alternativă test bilateral Există diferenţă semnificativă icircntre frecvenţa hepatitei B la

nivelul eşantionului şi prevalenţa hepatitei B icircn populaţia generală

f = 006 p = 009 n = 100

Pragul de semnificaţie a = 005

Regiunea critică test bilateral (-yen -196 ]Egrave[196 yen)

28

Concluzia testului

Deoarece parametrul statistic calculat al testului nu aparţine regiunii critice se acceptă ipoteza

nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat faţă de

frecvenţa hepatitei B icircn populaţia generală

Testul McNemar

Evaluarea dependenţei variabilelor calitative perechi (dorim să determinăm dacă o anumită

caracteristică este sau nu asociată cu o anumită patologie)

Identificăm n pacienţi care prezintă patologia de interes (eg Cancer bronho-pulmonar) şi n

pacienţi cu aceleaşi caracteristici ca şi primul grup dar care nu o prezintă

Martor = da Martor = nu

Caz = da a b

Caz = nu c d

Testul McNemar - exemplu fumat vs cancer

Martor = da Martor = nu

Cancer = da a = 2 b = 5

Cancer = nu c = 0 d = 3

29

χ2critic(α=005) = 384

32 lt 384 rarr acceptăm ipoteza nulă

Fumatul nu este icircn relaţie cu apariţia cancerului bronho-pulmonar

Inferenţa statistică pe date cantitative

Variabile cantitative continue

Testul z şi Student (t) (o medie sau medii perechi)

Testul z şi Student (t) (testarea a două medii)

ANOVA (ge 3 medii)

Ranguri (variabile cantitative discrete sau cantitative care nu icircndeplinesc condiţia de

normalitate)

Testul sumei rangurilor Wilcoxon

Kruskal-Wallis (ge 3 eşantioane independente)

Friedman (ge 3 eşantioane dependente)

Teste de normalitate variabile cantitative continue

Shapiro-Wilk

Kolmogorov-Smirnov

Shapiro-Wilk

Chi-Square Goodness-of-Fit

Dacă datele urmează o distribuţie normală aplicăm un test parametric

Dacă datele nu urmează o distribuţie normală aplicăm un test de comparare al rangurilor

30

Testul Z de comparare a mediei unui eşantion cu media unei populaţii

Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ

extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie

s2 care se cunoaşte

Condiţii de aplicare

1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru

compararea mediei unui eşantion cu media unei populaţii)

2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal

distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă

3 Talia eşantionului este mare ( ge 30)

Ipoteze

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media

eşantionului şi media populaţiei

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

(-yen -196 ] Egrave [196 yen)

Parametrul testului

n = volumul eşantionului

= media eşantionului

s = deviaţia standard a populaţiei

Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)

Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard

cunoscută

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi

media standard

Condiţii de aplicare

Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se

realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această

condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea

31

Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai

puternic

Numărul de grade de libertate (df) df = n-1

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

Parametrul testului

n = volumul eşantionului

micro0 = media standard

= media eşantionului

s = deviaţia standard a eşantionului

Testul ANOVA compararea mediilor a mai multe eşantioane

H0 = toate mediile sunt egale

H1 = nu toate mediile sunt egale

Condiţii de aplicare

1 Datele sunt independente unele faţă de celelalte

2 Datele fiecărui grup sunt normal distribuite

3 Deviaţia standard este aceeaşi pentru toate grupurile

Id Medicament

A B C D E F

1 5 6 7 10 5 9

2 6 8 8 11 8 8

3 7 7 9 13 6 7

4 8 9 11 12 4 5

32

5 9 10 10 9 7 6

Suma 35 40 45 55 30 35

Media 7 8 9 11 6 7

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =

= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)

Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2

F = (suma pătratelor(icircntre))(suma pătratelor(icircn))

Suma pătratelor (icircntre) = 16times5 = 80

Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60

Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn

interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare

SP df Media pătratelor F = MPicircntreMPicircn

Icircntre 80 5 = 805 = 16 = 1625 = 64

Icircn 60 24 = 6024 = 25

Total 140 29 -

Testul sumei rangurilor Wilcoxon

Aplicat pentru

Un set de observaţii provenite dintr-o valoare ipotetică comună

Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)

Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero

Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace

Suma rangurilor pentru diferenţele negative = 2+3+1 = 6

Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30

33

Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului

egal cu 8 = 0109

Icircnainte După Diferenţa Rang

64 66 -2 2

66 58 8 5

67 68 -1 3

71 65 6 4

72 75 -3 1

76 67 9 6

78 59 19 8

89 74 15 7

Testul Kruskal-Wallis (ge 3 eşantioane independente)

Test de ranguri aplicate pe mai mult de 3 eşantioane

H = parametrul testului

n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)

Tk = suma rangurilor

Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie

pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni

34

df = k-1 (k = numărul de eşantioane)

df = 3-1 = 2

Hcritic(α=005) = 599

H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie

pozitivă şi respectiv biopsie negativă

Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie

a tipului de studiu pe eşantioane perechi)

1 Definirea numărului de tratamente k

2 Obţinerea rangurilor pentru fiecare tratament

3 Sumarea rangurilor fiecărui tratament

4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)

5 Dacă Fr gt Frcritic rarr respingem H0

Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost

măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi

n = 9 k = 3 T12 = 225 T2

2 = 38025 T32 = 38025

Frcritic = 599

Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de

prostată

35

De reţinut

Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei

Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-

of-Fit

Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z

Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t

Compararea mediilor a 3 sau mai multe eşantioane ANOVA

Compararea mediilor a două populaţii (σ) testul Z

Compararea mediilor a două eşantioane (s) testul t

Compararea mediilor a două eşantioane perechi (s) testul t

ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi

cu cel pentru compararea a două eşantioane perechi

Ranguri

Distribuţia datelor nu are importanţă

Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)

Trei sau mai multe eşantioane Kruskal-Wallis

Trei sau mai multe eşantioane perechi Friedman

Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia

Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a

datelor)

Variabile nominale

Un singur eşantion sau eşantioane perechi

Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte

Eşantioane perechi testul Mc Nemar

Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2

Icircn analiza proporţiilor există teste diferite pentru

Compararea unei frecvenţe cu o frecvenţă cunoscută

Compararea a două frecvenţe

Semnificaţia statistică

Valoarea p (p value)

Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor

două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E

posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării

aleatorii

36

Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală

urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii

Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este

probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un

experiment de dimensiunea acestuia

Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că

diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii

diferite

Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca

fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă

ar fi fost adevărată

Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă

1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe

baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De

fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001

2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie

3 Se aplică testul statistic aferent pentru a calcula valoarea p

4 Se compară valoarea p cu valoarea ndash prag

5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe

semnificativă dpdv statisticrdquo

6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e

semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să

conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă

Teste de semnificaţie

Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului

populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)

Testarea ipotezelor implică posibile erori

Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile

sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui

grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul

icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005

ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există

37

nici o diferenţă

Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ

statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de

ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost

ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau

dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă

cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă

semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe

ipotetice variate icircn cazul icircn care ele există

Măsuri ale frecvenţei

Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)

Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate

Generic formula pe care se bazează toate cele trei este

unde x şi y sunt cantităţile de comparat

Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea

unei frecvenţe pe grupe de sex vacircrstă etc

Proporţia implică icircn mod necesar ca x să fie inclus icircn y

Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară

frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp

Pentru calcularea unei rate trebuie ţinut cont de trei aspecte

bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin

bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp

bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo

Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un

tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei

populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei

aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)

38

Indicatori

Rata de incidenţă

Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă

icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii

Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o

perioadă de timp

Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de

timp x

Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei

susceptibili de a dezvolta icircmbolnăvirea studiată

Numitorul poate fi

bull Numărul mediu al populaţiei icircn perioada de timp studiată

bull Mărimea populaţiei icircn mijlocul perioadei de studiu

bull Mărimea populaţiei la icircnceputul studiului

Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă

Este obligatorie menţionarea perioadei de timp

Prevalenţa

Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la

un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă

schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa

momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)

39

Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include

numai cazuri noi respectiv include cazuri noi şi vechi

Rata de atac

Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este

folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp

raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori

Rata persoană-timp

Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din

momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte

migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost

observate

Riscul relativ (RR)

Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment

legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele

prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două

grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la

bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la

bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai

mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo

Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2

Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn

cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă

(Tabelul 1)

Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR

Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la

neexpuşi

40

Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de

culegere a datelor

Odds ratio (OR)

Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin

raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general

studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)

Tabelul 2 Tabelul 2 x 2 pentru calcularea OR

Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală

Rate de mortalitate

Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp

specificată Există mai multe tipuri de rate de mortalitate

o Mortalitate specifică pe sex

o Mortalitate specifică pe rasă

o Mortalitate specifică pe boală

o Mortalitate neonatală

o Mortalitate postneonatală

o Mortalitate infantilă

o Mortalitate maternă

Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP

41

Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de

viaţă şi vacircrsta la care survine decesul dacă este prematur

Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu

Ani de viaţă pierduţi datorat dizabilităţii

Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt

utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru

cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite

grupuri

Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de

risc şi o boală se folosesc riscul relativ şi odds ratio

35 Analiza şi interpretarea datelor

După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date

trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul

Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor

colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului

studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu

plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde

prezenţa biostatisticianului este necesară

Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu

elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat

iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului

iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate

depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori

testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere

clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza

Interpretarea rezultatelor statistice

Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne

motive (număr mic de date) acceptarea ei să fie falsă

Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine

gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia

ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument

de decizie Intervalul de confidenţă

42

Interpretarea statistica ne interpretarea clinică

Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă

Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice

obţinute pe eşantionul studiat

Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare

Ce interpretăm Rezultatele

personale obţinute icircn urma studiului

care au fost prezentate icircn secţiunea bdquoRezultaterdquo

Explicăm rezultatele obţinute

Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale

Interpretarea trebuie să se realizeze icircn

lumina limitelor studiului

contextul cultural social şi educaţional al locului unde s-a realizat cercetarea

contextul a ceea ce se cunoaşte din literatura de specialitate

Interpretăm doar rezultatele personale obţinute icircn urma studiului

Interpretarea statistică nu este tot una cu interpretarea clinică

Interpretarea statistică este importantă

Interpretarea clinică este foarte importantă

Intervalul de confidenţă

Media calculată pe baza unui eşantion nu va echivala media populaţiei

Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului

Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a

populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a

populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)

pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru

orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare

dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de

confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de

date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de

5

Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel

Dacă valoarea p este mică

Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare

aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o

medie diferită Diferenţa este semnificativă dpdv statistic

43

Icircn continuare

Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa

reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică

pentru a fi interesante din punct de vedere ştiinţific

Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC

oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care

este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a

obţine o concluzie clară

Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o

diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că

datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din

punct de vedere ştiinţific

Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul

detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat

Erorile studiilor medicale

Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura

anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară

caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea

asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri

legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias

Erorile potenţiale icircn studiile epidemiologice

1 Erori icircntacircmplătoare

2 Erori sistematice

3 Confuzia

4 Validitatea

1 Erori icircntacircmplătoare

Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a

parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel

de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot

fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii

(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor

de măsură (eroarea de măsurare)

44

2 Erori sistematice

Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate

care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu

acurateţe mare Acurateţea nu este afectată de mărimea eşantionului

Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de

experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea

dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus

şi greu de cuantificat (consum de alcool personalitate etc)

Principalele tipuri de erori din această categorie sunt

bull Biasul de selecţie

bull Biasul de informaţie

Biasul de selecţie

Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul

trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion

inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale

persoanelor incluse

Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se

ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia

Biasul de informaţie

Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de

instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze

expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere

nesemnificativă sau chiar să nu şi-o amintească de loc

3 Confuzia

Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune

prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este

cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă

de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte

important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor

protector

4 Validitatea

Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă

Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte

estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional

Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă

45

conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se

demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)

Validitatea externă se poate realiza numai dacă studiul este valid intern

Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii

studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de

studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt

laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi

validă din punct de vedere intern)

3 6 Prezentarea rezultatelor

După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite

Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor

icircntr-o formă bdquodigerabilărdquo este necesară

Scopul prezentării datelor

1 Transmiterea concluziilor studiului

a Datele corecte şi importante merită comunicate

b Datele trebuie să confirme sau să infirme ipoteza studiului

c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală

2 Acordarea posibilităţii altor cercetători să aprecieze studiul

a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti

b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor

prezentate

Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru

fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie

statistică

Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de

valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras

(Tabel 3)

Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)

46

Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct

numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor

precum şi prezentarea acestora sub formă inteligibilă

Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care

convin cercetătorului

Prezentarea datelor se poate face

1 Figuri şi tabele icircn articole scrise

2 Figuri şi tabele icircn prezentări orale

3 Figuri şi tabele icircn postere

4 Text scris sau incluse icircn text

5 Site-uri de WEB

Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor

Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie

Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele

exprimacircnd exact ceea ce acestea exprimă

Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate

anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel

să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se

acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca

mai sus sugestive sunt formatele simple şi puţin icircncărcate

Dacă nu există reguli impuse se respectă

1 Mesaj simplu fără falsificarea datelor

2 De obicei este necesar atacirct tabelul cacirct şi graficul

3 Să fie simplu şi clar

Tabele

Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile

coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică

elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de

1 Se folosesc doar linii orizontale

2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn

evidenţi prin linie de separare (Tabelul 4)

Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland

Noua Zeelandă)

(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)

47

3 Numerele sunt aliniate icircn funcţie de virgulă

4 Indicii statistici sunt explicaţi sub tabel

5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană

6 Abrevierile pot fi folosite

7 Numărul de zecimale trebuie limitat la maxim două

8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel

9 Plasarea legendei este obligatorie sub tabel

10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)

Icircn cazul prezentărilor orale sau a posterelor este indicat ca

1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării

2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte

3 Folosirea de simboluri este permisă

Clasificarea tabelelor

Tabelele se clasifică după

i) conţinut

bull cu distribuţii de frecvenţe

bull de clase de frecvenţe

bull de contingenţă

ii) structura

bull cu doua coloane

bull cu subclasificări

bull ldquomasterrdquo

Tabele ce conţin distribuţii de frecvenţe

O modalitate comodă de a prezenta o mulţime de date brute este

1 Se ordonează datele in ordine crescătoare

2 Se determine frecvenţa fiecărei valori

3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane

(Tabelul 5)

Tabelul 5 Distribuţii de frecvenţă absolută

48

Tabelul claselor de frecvenţe

1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă

2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)

Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)

Tabele de contingenţă

1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a

tabelelor de contingenţă

2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a

combinaţiilor de perechi ordonate de valori

3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre

a factor de risc si

b starea sănătăţii

4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)

5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)

Tabelul 7 Tabel de contingenţă 2 x 2

49

Grafice

Există două categorii de moduri grafice sub care se pot prezenta datele

1 Ilustraţii şi fotografii

2 Grafice

1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă

pentru lucrare

2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit

Putem vorbi despre mai multe tipuri de grafice

bull Grafice pentru reprezentarea datelor cantitative

1048707 Grafic cartezian (X Y)

1048707 Histograma

1048707 Poligonul de frecvenţe

1048707 Diagrama bdquoscatterrdquo

bull Grafice pentru reprezentarea datelor calitative

1048707 Grafic cu bare

1048707 Diagrama tip bdquoboxplotrdquo

1048707 Diagrama bdquopierdquo

1048707 Cartograma

Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi

dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)

Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)

Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie

Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)

Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)

50

Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir

de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele

două variabile studiate (Figura 6)

Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2

(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2

rămacircne aproximativ constantă)

Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea

comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea

comparativă a mai multor variabile

Figura 7 Grafic calitativ cu bare

51

Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo

Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două

posibilităţi reprezentate grafic este mai frecventă (Figura 8)

Figura 8 Reprezentare tip bdquopierdquo

Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli

sau a oricărui element comparativ Se foloseşte de epidemiologi

Rezultate

Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare

Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o

manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu

explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția

bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la

ilustraţii tabele grafice

Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi

nici rezultatele care invalidează eventual ipoteza

Discuţii

Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd

cultura ştiinţifică şi inteligenţa autorilor

Acest capitol răspunde la trei obiective

Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia

calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de

selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează

rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv

52

este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn

care a fost abordată problema fără a face o revistă a literaturii

Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea

rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul

Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor

afirmaţii nesusţinute de conţinutul lucrării

Concluzii

Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate

să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie

Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de

concluzii va scădea valoarea lucrării

Bibliografia (lista referinţelor citarea icircn text)

Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn

lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente

Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli

- să conţină cele mai importante şi recente lucrări

- să includă numai lucrări publicate

- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate

Bibliografie

Elisabeta Jaba ndash Statistică Ed Economică 1998

Mihai Ţarcă ndash Statistică volI Ed UAIC 1979

Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale

Ed University Press 2009

Sorana Daniela Bolboacă ndash Metodologia cercetării curs

53

Page 13: cercetarea medicala - metodologie

studiului este important ca numărul ales să fie mai mare pentru a putea suplinii eventualele pierderi din

urmărire Practic rezultatele sunt introduse icircn tabelul 2 x 2 de unde se pot calcula indicatorii doriţi (Figura 2)

Avacircnd icircn vedere modul de culegere a datelor este permisă calcularea de indicatori numai pe orizontală

orice comparare icircntre coloana dreaptă şi stacircngă fiind incorectă Avantajul acestui tip de culegere a datelor ar fi

eventualul număr mai redus de subiecţi dar dezavantajul major este cel al costurilor de urmărire icircn timp dar

trebuie luată icircn calcul şi pierderea de subiecţi din evidenţe Factorul controlat este deci prezenţa expunerii iar

factorul aleator este prezenţa bolii

Figura 2 Tabelul de contingenţă pentru tipul de culegere expus ndash neexpus

4 Culegerea de tip caz ndash martor Icircn acest caz ceea ce ghidează colectarea datelor este prezenţa sau absenţa

bolii icircn momentul prezent Se vor culege date de la două loturi constituite după criteriul de bolnav B+ şi de fără

boală B+ Datele culese sunt icircn trecut deci caracterul datelor va fi retrospectiv Icircn acest caz factorul controlat

este boala factorul aleator fiind expunerea (Figura 3)

Calculul de indicatori icircn acest caz se va putea efectua numai icircntre coloane orice calcul icircntre valorile de pe linii

fiind greşit Rezultate semnificative se pot obţine icircn acest caz utilizacircnd loturi mai mici de studiu prin

comparaţie cu tipul eşantion reprezentativ permiţacircnd icircn acelaşi timp studiul bolilor rare (cu prevalenţă mică)

Figura 3 Tabelul de contingenţă pentru tipul de culegere caz ndash martor

Metode de culegere a datelor

Metoda aleasă pentru culegerea datelor trebuie să fie aleasă după un atent studiu bibliografic icircn vederea

stabilirii celui mai eficient mod de a răspunde temei de studiu

Metodele de culegere trebuie să fie bine aplicabile şi consistente ca aport informaţional necesar

13

1 Fiziologice Sunt colectate date despre anumite caracteristici fiziologice ale pacienţilor (TA glicemie

colesterol etc) Această metodă aduce rezultate obiective cacirct timp instrumentul de evaluare este bine calibrat

şi prezintă variaţii mici

2 Metode observaţionale Instrumentul de culegere a datelor trebuie să fie sincronizat cu protocolul conceput

de cercetător Datele culese trebuie să fie de asemenea consistente adică să fie colectate de aceeaşi manieră

conducătorul studiului trebuind să instruiască investigatorii (colectorii de date) Icircnregistrarea datelor trebuie să

fie de asemenea sistematică şi bine standardizată Observaţii de control trebuie icircn mod obligatoriu făcute

pentru a putea aprecia icircn mod corect orice deviere datorată unor factorii externi Este obligatorie luarea icircn

consideraţie a aspectelor etice

3 Interviul Poate fi structurat cu un set specific de icircntrebări sau nestructurat cu o temă generală cu care se

icircncepe interviul Interviurile pot fi icircnregistrate sau intervievatorul poate nota pur şi simplu răspunsurile Există

două tipuri generice de interviu interviul de profunzime care se referă la o discuţie icircn general structurată cu

un număr de icircntrebări prestabilite icircn icircncăperea de studiu fiind doară intervievatorul şi persoana chestionată şi

interviul de grup unde prin conversaţii pornind de la temă generală expusă şi condusă de intervievator se

obţin date despre subiecţii participanţi la studiu Ambele metode de interviu au indicaţiile lor precise Un

interviu pe teme intime nu va putea fi corect icircn ceea ce priveşte datele colectate dacă se aplică un interviu de

grup

4 Chestionarul Document scris adresat unor persoane pentru a răspunde la una sau mai multe icircntrebări

Trebuie să aducă răspunsurile la icircntrebările care motivează studiul constituind ansamblul icircntrebărilor destinate

culegerii de informaţii (date) Redactarea chestionarului trebuie să ţină cont de structura acestuia introducere

conţinut exprimarea icircntrebărilor grafica chestionarului

5 Icircnregistrări preexistente

Icircn cercetarea medicală sunt cel mai frecvent utilizate Informaţiile dorite sunt deja existente ceea ce icirci revine

cercetătorului este ca să structureze datele icircn funcţie de scopul studiului pe care icircn conduce Aceste surse sunt

bull Foi de observaţie

bull Registre de consultaţie

bull Buletine de analize

bull Registre de operaţii

Icircn cazul icircn care nici o metodă de culegere a datelor nu este pe placul celui ce conduce studiul există

posibilitatea de a construi un instrument nou de culegere a datelor

Acest proces trebuie să urmărească nişte paşi obligatorii fiind mare consumator de timp

bull Definirea structurii cu care se va face măsurarea

bull Formularea itemilor de măsură

bull Analiza validităţii instrumentului de măsură ndash măsoară acesta fenomenul corect

bull Elaborarea de instrucţiuni de utilizare pentru investigatori

14

bull Pretestarea instrumentului

bull Aprecierea validităţii interne şi externe a datelor culese

Instrumente de cercetare

Formularea clară a temei de cercetare necesită o foarte bună definire a factorilor studiaţi şi a criteriilor de

judecată Acestea din urmă sunt ultimele care vor trebui definite icircn cadrul protocolului de studiu

Alegerea unui instrument de măsură

Nu există un instrument de măsură perfect sau universal corect Alegerea sa dintre cele existente şi cele deja

utilizate depind de trei factori

bull Obiectivul studiului

bull Boala studiată

bull Populaţia icircn studiu

De aceste trei elemente trebuie ţinut cont icircn fiecare etapă a dezvoltării instrumentului

Definirea obiectivului

Studiu transversal Dacă se doreşte studierea unui simptom sau a unei caracteristici ale populaţiei se poate

icircmpărţi populaţia de studiu icircn mai multe grupuri Este practic vorba de a determina diferenţele dintre subiecţi

icircn cea ce priveşte o variabilă necesară studiată printr-un studiu transversal (utilizarea dozării de Ac HBS

pentru a evalua progresele bolnavilor de hepatită tip B)

Studiu longitudinal Icircn acest caz nu se poate icircmpărţii populaţia de studiu icircn mai multe grupuri datele obţinute

fiind de la acelaşi subiect colectate după un interval de timp

Icircn funcţie de boală şi populaţie se aleg şi instrumentele de măsură cele mai adecvate

Instrumentele cercetării reprezintă un mecanism specific sau o strategie pe care cercetătorul o utilizează pentru

colectarea prelucrarea şi inferenţa datelor Aceste instrumente sunt

1 Studiul icircn bibliotecă

2 Computerul

3 Determinările experimentale

4 Statistica

5 Mintea umană

6 Facilităţi de limbaj şi comunicare

Determinările experimentale

Măsurarea constă icircn aprecierea şi cuantificarea fenomenelor calitativ sau cantitativ Interpretarea

datelor se referă la transformarea lor icircn unităţi de descoperire a unor fenomene mai puţin cercetate

Standardele acceptate se referă la norme medii distribuţii etc Tot icircn cadrul interpretării datelor datele

obţinute sunt caracterizate pe scale de valori nominal ordinal de interval sau de raport

Validarea şi reproductibilitatea măsurătorilor sunt aspecte importante şi foarte necesare pentru o

cercetare corect fundamentată care doreşte obţinerea unor concluzii pertinente

15

Statistica Este implicată icircn condensarea şi procesarea unui volum mai mare de date astfel icircncacirct să se poată

interpreta corect valorile obţinute şi să se permită comparările Utilizarea unor teste statistice specifice permite

determinarea semnificaţiei (diferenţei) statistice astfel icircncacirct estimatorii să poată fi aplicaţi la populaţia

generală Furnizează informaţii şi privind corelarea sau relaţionarea icircntre date

Mintea umană este cea care reuşeşte să integreze şi să icircnţeleagă rezultatele obţinute Semnificaţia ştiinţifică

este stabilită icircn funcţie de rezultatele statisticii de mintea umană conform afirmaţiei bdquosemnificaţia ştiinţifică

nu este egală cu semnificaţia statisticărdquo Metodele aplicate pentru a putea ajunge la o concluzie pertinentă sunt

logica deductivă raţionamentul inductiv şi gacircndirea critică

Limbaj şi comunicare Exprimarea orală sau icircn scris permite nuanţarea unor aspecte seci cifrice ale unor

studii Icircn acest mod devine mai evidentă semnificaţia ştiinţifică a unor rezultate statistice

34 Prelucrarea datelor

Instrumentele de prelucrare

Statistica este o ştiinţă ramură a matematicii care studiază evoluţia fenomenelor şi proceselor

colective pe baza observării lor ştiinţifice a culegerii şi prelucrării detaliate a informaţiilor statistice cu scopul

de a formula şi explica legile legităţile şi regularităţile ce le guvernează

Statistica permite deci aprecierea unor parametrii populaţionali prin studiul unui număr redus de

elemente ale populaţiei icircn studiu (ţintă) O populaţie poate fi definită printr-un şir de valori care pot fi grupate

icircn funcţie de parametrul studiat (glicemie colesterol TAD TAS etc) Pentru fiecare astfel de şir se defineşte

o variabilă (care va purta nume propriu glicemie colesterol etc) Practic variabila este considerată o funcţie

ia valori posibil diferite de la un element la altul icircn funcţie de caracteristicile proprii acestora Sunt clasificate

icircn două grupe variabile cantitative (caracteristică măsurabilă) şi calitative (caracteristică ce nu poate fi

măsurată)

La racircndul lor variabilele calitative pot fi

bull Nominale ndash grupuri de elemente ce nu pot fi ordonate (culoarea părului)

bull Nominale ordonate ndash concluziile pot fi grupate (eficienţa unui tratament slabă bună foarte bună)

bull Binare ndash apar numai două posibilităţi (bolnav sănătos)

Variabilele cantitative pot fi

bull Continue ndash o variabilă măsurabilă care poate lua o infinitate de valori

bull Discrete ndash variabile care nu pot lua decacirct valori icircntregi

Statistica descriptivă

Există două ramuri ale statisticii statistica descriptivă şi statistica inferenţială

Statistica descriptivă (după cum rezultă din denumire) se ocupă cu descrierea unor valori obţinute ale unei

variabile studiate

16

Valorile pe care variabila le ia se constituie icircntr-o serie statistică Indicatorii care definesc o variabilă (serie)

sunt

1 Ale tendinţei centrale

Media aritmetică - notată de regulă cu

Mediana - este acea valoare din şirul de date care icircmparte icircn două părţi egale şirul ordonat de valori (atenţie

şirul este ordonat crescător) situacircndu-se la mijlocul seriei statistice

Dacă numărul de valori n este un număr impar atunci mediana este valoarea unde

Dacă n este par deci avem un număr par de valori mediana este definitatilde ca fiind

unde k = n2

Modul - constituie valoarea care apare cel mai des deci valoarea cu numărul cel mai mare de apariţii

2 De dispersie

Amplitudinea - este diferenţa dintre valoarea maximă şi cea minimă

A = Amax - Amin

Amplitudinea relativă - notată A este raportul dintre amplitudinea absolută şi media aritmetică a seriei de

date

Varianţa notată este un indicator de icircmprăştiere a datelor Formula de calcul este

Abaterea standard (S) sau deviaţia standard reprezintă rădăcina pătrată din varianţă (dispersie)

Coeficientul de variaţie se calculează ca un raport procentual icircntre abaterea standard şi valoarea medie a şirului

de valori

Eroarea standard intervine icircn estimarea intervalelor de confidenţă Se calculează astfel

17

3 De asimetrie (skewness) indică distribuţia datelor dacă sunt sau nu distribuite normal

4 De boltire (kurtosis) estimează boltirea sau aplatizarea curbei de distribuţie

Prezentarea descriptivă a datelor se face prin icircnregistrarea datelor culese icircn tabele care să reprezinte icircn mod

sintetic valorile măsurate

Icircn concluzie statistica descriptivă permite

bull Stabilirea comparabilităţii icircntre grupurile de studiu şi aprecierea prezenţei erorilor sau confuziei

bull Reprezentarea datelor icircn tabele permite evaluarea fiecărui pacient şi dacă a existat pierderi din studiu

Statistica inferenţială

Statistica inferenţială (inductivă) este partea de analiză a datelor care permite extrapolarea unei

concluzii trase pe baza unui eşantion spre populaţia ţintă pentru care a fost efectuat studiul

Scopul analizei statistice este de a evidenţia efectul unui tratament sau al unui factor de risc prin date obţinute

din eşantionul studiat spre populaţia ţintă Aceasta implică testarea ipotezelor statistice sau altfel spus testarea

semnificaţiei statistice Este una dintre cele mai importante momente ale studiului Cum rezultatele sunt

obţinute prin studiul unui eşantion există posibilitatea ca acestea să fie datorate icircntacircmplării Testele

statistice ne ajută să apreciem icircn ce măsură rezultatele sunt icircntacircmplătoare şi mai ales icircn ce măsură şi dacă se

pot aplica populaţiei generale Icircn acest scop se impune o valoare limită alfa 005 care reprezintă limita

superioară a probabilităţii ca rezultatul obţinut să fie greşit (datorat icircntacircmplării) Astfel icircn funcţie de tipul

variabilelor şi indicatorii descriptivi aplicaţi şi evaluaţi se aplică teste de semnificaţie statistică (Tabelul 1)

Tabelul 1 Alegerea testelor de semnificaţie statistică

Tipul datelor

18

Diferenţierea variabilelor din punctul de vedere a distribuţiei se face folosind testul de normalitate

Kolmogorov ndash Smirnov

Testul statistic reprezintă metoda de comparaţie a două sau mai multe populaţii prin intermediul unor

variabile observate ale lor

Scopul unui test statistic este de a defini realitatea

Definirea icircntrebării de cercetare (ipoteza clinică)

Tratamentul cu Nebivolol este la fel de eficient ca şi cel cu Valsartan icircn tratamentul

hipertensiunii arteriale

Transpunerea icircntrebării de cercetare icircn termeni statistici (ipoteza statistică)

Media tensiunii arteriale a pacienţilor trataţi cu Valsartan nu diferă semnificativ de media

tensiunii arteriale a pacienţilor trataţi cu Nebivolol

Etapele unui test statistic

1 Formularea problemei icircn termenii ipotezelor statistice

2 Alegerea şi calcularea parametrului statistic al testului

3 Regiunea critică

4 Concluzia testului

1 Formularea problemei icircn termenii ipotezelor statistice

Ipoteza nulă ipoteza care trebuie testată testul efectuacircndu-se sub prezumţia că ipoteza nulă ar

fi adevărată

Ipoteza alternativă acea ipoteză care icircntr-un sens sau altul contrazice ipoteza nulă Această

ipoteză se mai numeşte şi ipoteza de lucru

Ipoteza nulă tipuri

O coadă (ldquoone-tailedrdquo sau ldquoone-siderdquo)

Media este mai mare

Media este mai mică

Două cozi (ldquoone-tailedrdquo sau ldquoone-siderdquo)

Media este egală

2 Alegerea şi calcularea parametrului statistic al testului

Parametrul statistic al testului exprimă icircntr-o anumită formă diferenţa dintre elementele comparate

Ţinacircnd seama de faptul că eşantionul sau eşantioanele utilizate sunt aleator extrase din populaţiile care

fac obiectul testului parametrul statistic este o variabilă aleatoare de selecţie care urmează o anumită

lege de probabilitate

Un parametru statistic al testului bun trebuie să icircndeplinească două condiţii

19

Trebuie să se comporte diferit atunci cacircnd ipoteza nulă H0 este adevărată faţă de situaţia icircn

care ipoteza alternativă H1 este adevărată

Distribuţia de probabilitate a parametrului statistic al testului sub prezumţia că H0 este

adevărată este cunoscută

3 Regiunea critică

- Trebuie să fim capabili să decidem icircn funcţie de valoarea parametrului statistic calculat care dintre

ipoteze cea nulă sau cea alternativă este adevărată

- Dacă valoarea parametrului statistic aparţine regiunii critice ipoteza nulă H0 va fi respinsă şi va fi

acceptată ipoteza alternativă H1

- Dacă valoarea parametrului statistic nu aparţine regiunii critice ipoteza nulă H0 va fi acceptată

- Decidem mărimea regiunii critice

Pentru aceasta trebuie să specificăm mărimea riscului de eroare pe care icircl acceptăm

Pe scurt definim nivelul de semnificaţie notat cu a sau mărimea riscului pe care

suntem dispuşi să ni-l asumăm icircn respingerea ipotezei nule H0 icircn cazul icircn care aceasta

este adevărată De obicei se alege un nivel de semnificaţie icircntre 1 şi 5

Probabilitatea unei erori de tipul I

probabilitatea de respingere a ipotezei nule H0 icircn favoarea ipotezei alternative H1 icircn

condiţiile icircn care H0 este adevărată

probabilitatea unei erori de tipul I se notează cu a şi se mai numeşte nivel de

semnificaţie al testului

Probabilitatea unei erori de tipul II

probabilitatea acceptării ipotezei nule icircn condiţiile icircn care ipoteza alternativă H1 este

adevărată

această probabilitate se notează cu b

- Unilaterală la dreapta ndash valoarea parametrului statistic al testului este mai mare sau egală cu

valoarea din dreapta a intervalului critic

- Unilaterală la stacircnga ndash valoarea parametrului statistic al testului este mai mică sau egală cu

valoarea din stacircnga a intervalului critic

- Bilaterală ndash valoarea parametrului statistic al testului este mai mică sau egală cu valoarea extremă

din stacircnga regiunii critice sau mai mare sau egală cu valoarea extremă din dreapta regiunii critice

valorile extreme ale regiunii critice avacircnd nivele egale de semnificaţie

4 Concluzia testului

- Ipoteza nulă H0 este respinsă dacă valoarea parametrului statistic aparţine regiunii critice

20

- Regiunea critică trebuie astfel aleasă icircncacirct dacă ipoteza alternativă H1 este adevărată

probabilitatea de respingere a ipotezei nule H0 este mai mare decacirct icircn cazul icircn care ipoteza nulă H0

ar fi adevărată

- Acceptarea ipotezei nule H0 atunci cacircnd ipoteza alternativă H1 este adevărată este cunoscută ca şi

eroarea de tipul II

a probabilitatea ei se notează cu b

b măsoară bdquonivelul de eroarerdquo

- Icircn testarea oricărei ipoteze statistice există patru situaţii care determină dacă decizia noastră este

corectă sau nu

Cazuri

H0 este adevărată H0 este falsă

Concluzie H0 se acceptă decizie corectă eroare de tipul

II

H0 se

respinge

eroare de tipul I decizie corectă

Luarea deciziei pe baza valorii probabilităţii p de semnificaţie a testului

Icircn momentul icircn care prelucrăm statistic o serie de date dorim să ştim dacă rezultatele obţinute sunt sau

nu semnificative statistic

Răspunsul la această icircntrebare este dat de valoarea lui p calculată de orice program statistic la

prelucrarea unor date

Icircn cazul testelor statistice ipoteza nulă este respinsă dacă nivelul de semnificaţie este mai mic decacirct

005 iar programele de prelucrare statistică a datelor vor afişa o steluţă () icircn tabelul rezultatelor

21

Dacă p le 005 respingem ipoteza nulă şi acceptăm ipoteza alternativă (am obţinut semnificaţia

statistică)

Dacă p gt 005 acceptăm ipoteza nulă (nu am obţinut semnificaţia statistică)

p = 013

NU respingem ipoteza nulă

Risc de eroare de tip II

α = 005

p = 002

Respingem ipoteza nulă

Risc de eroare de tip I

Semnificaţia lui p

Criteriu de luare a deciziei cu privire la o ipoteză statistică nulă

Cuantifică şansa ca o decizie de respingere a ipotezei nule să fie greşită

Măsură a semnificaţiei statistice şi NU CLINICĂ

22

Semnificaţia lui p (reguli empirice)

001 le p lt 005 rezultatul e semnificativ statistic

0001 le p lt 001 rezultatul e icircnalt semnificativ statistic

p lt 0001 rezultatul e foarte icircnalt semnificativ statistic

p ge 005 rezultatul e considerat nesemnificativ statistic

Limite ale valorii p

Valoarea p NU ne dă informaţii despre

Şansa de beneficiu a unui pacient individual

Procentul de pacienţi care vor avea un beneficiu icircn urma instituirii procedurii medicale

Gradul de beneficiu expectat pentru un anumit pacient

Puterea unui test statistic

Este capacitatea de a detecta o diferenţă acolo unde există

Creşterea volumului eşantionului determină creşterea puterii testului statistic aplicat

Valoarea este icircn relaţie directă cu eroarea de tip II

Puterea = 1 ndash β

Cea mai utilizată modalitate de creştere a puterii unui test statistic este de a creşte volumul

eşantionului

Tipul scalei de măsură ndash testul statistic

Denumire test Interval Nominal Observaţii

Corelaţie Pearson 2 0 Există o relaţie liniară

χ2 0 2

Student 1 1 Doar 2 grupuri

ANOVA 1 1 2 sau mai multe grupuri

Student perechi 1 1 Eşantioane perechi

Măsurători repetate (ANOVA) 1 1 Mai mult de 2 grupuri date

perechi

Inferenţa statistică pe date calitativ e

Tabela de contingenţă 2times2

Riscuri şi raţii

Testul χ2 (testarea asocierii icircn tabela de contingenţă)

Testul Fisher

23

Testul z pentru proporţii

Testul McNemar

Tabela de contingenţă 2times2

Scale de tip nominal (dicotomiale tabela de contingenţă de 2times2) sau ordinal (tabela de contingenţă de

rtimesc)

Frecvenţa absolută (numărul de evenimente per categorie)

Tabela de contingenţă de 2times2 4 categorii

AP = adevărat pozitiv

FP = fals pozitiv

FN = fals negativ

AN = adevărat negativ

Ulcer deschis Ulcer vindecat Total

Recurenţă + AP = 1 FP = 5 = 1+5 = 6

Recurenţă - FN = 7 AN = 16 = 7+16 = 23

Total =1+7=8 =5+16=21 29

Riscuri şi raţii Mărimi ale asocierii

Denumire Formula Definiţie

Rata falşilor pozitivi =FP(FP+AN) Probabilitatea unui test fals + (α)

Rata falşilor negativi =FN(FN+AP) Probabilitatea unui test fals ndash (β)

Sensibilitate =AP(AP+FN) Probabilitatea unui test real + (1- β)

Specificitate =AN(AN+FP) Probabilitatea unui test real ndash (1- α)

Acurateţe =(AP+AN)n Probabilitatea generală a unei decizii corecte

Valoarea predictivă pozitivă =AP(AP+FP) Probabilitatea ca un test pozitiv să fie corect

Valoarea predictivă negativă =AN(AN+FN) Probabilitatea ca un test negativ să fie corect

Riscul relativ =AP(FP+AN)FN(AP+FP)

Rata şansei =(AP∙AN)(FN∙FP)

Riscul atribuabil =AP(AP+FP)-FN(FN+AN)

24

Denumire Formula

Rata falşilor pozitivi = 5(5+1) = 08334

Rata falşilor negativi = 7(7+16) = 03043

Sensibilitate = 1(1+7) = 01250

Specificitate = 16(16+5) = 07619

Acurateţe = (1+16)29 = 05862

Valoarea predictivă pozitivă = 1(1+5) = 01667

Valoarea predictivă negativă = 16(16+7) = 06957

Riscul relativ = 1(5+16)7(1+5) = 2142 = 050

Rata şansei = (1∙16)(7∙5) = 04571

Riscul atribuabil = 1(1+5)-7(7+16) = 01667-03043=-01376

Testarea asocierii icircn tabela de contingenţă

Testul χ2

Nu trebuie utilizat pentru eşantioane de volum mic

Testul este valid doar dacă valoarea expectată (aşteptată) pentru fiecare celulă este cel puţin

egală cu 1 şi frecvenţa absolută observată este de minim 5

Dacă aceste condiţii nu sunt icircndeplinite se aplică testul exact al lui Fisher (Fisherrsquos Exact Test)

Indică dacă cele două variabile sunt sau nu independente DAR NU cuantifică puterea asocierii

dintre ele

Problema S-a investigat icircntr-un studiu asocierea dintre obezitatea (ca factor de risc) şi bolile

cardio-vasculare la persoanele icircn etate (gt 60 ani) Din totalul de 620 persoane investigate s-au

identificat 150 persoane cu obezitate şi boală cardio-vasculară 230 persoane fără obezitate şi

fără boală cardio-vasculară şi 60 persoane fără obezitate dar cu boală cardio-vasculară Există

o asociere icircntre obezitate şi boala cardio-vasculară (df=1 α=005 χ2critic = 384)

Testul χ2 exemplu

H025

Nu există asociere icircntre obezitate şi bolile cardio-vasculare

Obezitatea şi bolile cardio-vasculare sunt independente

H1

Există asociere icircntre obezitate şi bolile cardio-vasculare

Obezitatea şi bolile cardio-vasculare sunt asociate

a = 005 pragul de semnificaţie al testului

urmează o lege cu (r-1)(c-1) grade de libertate

χ2 = parametrul testului χ2

fio = frecvenţa observată

fit = frecvenţa teoretică

Regiunea critică este [χα2 yen)

Pentru α = 005 χα2 = 384

OBSERVAT BCV+ BCV- Total

Obezitate + AP = 150 FP = 180 330

Obezitate - FN = 60 AN = 230 290

Total 210 410 620

TEORETIC BCV+ BCV- Total

Obezitate + = 330times210620 = 330times410620 330

Obezitate - = 290times210620 = 290times410620 290

Total 210 410 620

TEORETIC BCV+ BCV- Total

Obezitate + = 330times210620 = 330times410620 330

26

Obezitate - = 290times210620 = 290times410620 290

Total 210 410 620

TEORETIC BCV+ BCV-

Obezitate + = 112 = 218

Obezitate - = 98 = 192

Deoarece 4177Icirc[384 yen) se respinge H0 cu un risc de eroare de 5

Există asociere icircntre obezitate şi bolile cardio-vasculare

Testul Fisher

Corecţie a testului χ2

Valoarea p asociată parametrului ne dă probabilitatea ca valoarea observată de independenţă să fie

atribuită doar şansei

O valoare p mică indică că există alte cauze decacirct şansa influenţează rezultatul şi astfel cele două

variabile investigate nu sunt independente

Testul Fisher = dispersia corectată a factorului x dispersia corectată a factorilor reziduali

Icircn acest context regula adunării dispersiilor se poate scrie unde

este variaţia lui y pe seama variaţiei variabilei x

este variaţia lui y pe seama influenţei factorilor reziduali (neicircnregistraţi)

este variaţia totală a caracteristicii y

Testul Fisher empiric se calculează după formula

27

se compară cu Ftab pentru nx şi nz grade de libertate la un anumit prag de semnificaţie stabilit

Dacă Fc gt Ftab rezultă că variaţia factorului de grupare x este semnificativă pentru variaţia caracteristicii y

Testul z pentru proporţii

1 Compararea unei frecvenţe observate cu o frecvenţă teoretică

2 Testarea egalităţii a două frecvenţe

Testul z Compararea unei frecvenţe observate cu o frecvenţă teoretică

Scop Investigarea semnificaţiei diferenţei icircntre o frecvenţă teoretică p (icircntr-o populaţie) şi o frecvenţă

observată f pe un eşantion reprezentativ (variabilă calitativă (binare))

Condiţii de aplicare Testul este corect aplicat dacă numărul n al observaţiilor eşantionului este

suficient de mare (n∙p n∙(1-p)gt10

Parametrul

n = volumul eşantionului

Suntem interesaţi de investigarea prevalenţei hepatitei B la personalul care lucrează icircn laboratoarele

clinicilor de boli infecţioase din Transilvania Se ştie din studii anterioare că prevalenţa hepatitei B icircn

populaţia generală din Transilvania este de 9 S-a luat icircn studiu un eşantion de 100 persoane şi s-a

obţinut o prevalenţă a hepatitei B de 6 Există diferenţă semnificativă icircntre frecvenţa hepatitei B la

personalul care lucrează icircn laboratoarele spitalelor de boli infecţioase din Transilvania faţă de

populaţia generală

f = 006 p = 009 n = 100

Ipoteza nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat

faţă de frecvenţa hepatitei B icircn populaţia generală

Ipoteza alternativă test bilateral Există diferenţă semnificativă icircntre frecvenţa hepatitei B la

nivelul eşantionului şi prevalenţa hepatitei B icircn populaţia generală

f = 006 p = 009 n = 100

Pragul de semnificaţie a = 005

Regiunea critică test bilateral (-yen -196 ]Egrave[196 yen)

28

Concluzia testului

Deoarece parametrul statistic calculat al testului nu aparţine regiunii critice se acceptă ipoteza

nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat faţă de

frecvenţa hepatitei B icircn populaţia generală

Testul McNemar

Evaluarea dependenţei variabilelor calitative perechi (dorim să determinăm dacă o anumită

caracteristică este sau nu asociată cu o anumită patologie)

Identificăm n pacienţi care prezintă patologia de interes (eg Cancer bronho-pulmonar) şi n

pacienţi cu aceleaşi caracteristici ca şi primul grup dar care nu o prezintă

Martor = da Martor = nu

Caz = da a b

Caz = nu c d

Testul McNemar - exemplu fumat vs cancer

Martor = da Martor = nu

Cancer = da a = 2 b = 5

Cancer = nu c = 0 d = 3

29

χ2critic(α=005) = 384

32 lt 384 rarr acceptăm ipoteza nulă

Fumatul nu este icircn relaţie cu apariţia cancerului bronho-pulmonar

Inferenţa statistică pe date cantitative

Variabile cantitative continue

Testul z şi Student (t) (o medie sau medii perechi)

Testul z şi Student (t) (testarea a două medii)

ANOVA (ge 3 medii)

Ranguri (variabile cantitative discrete sau cantitative care nu icircndeplinesc condiţia de

normalitate)

Testul sumei rangurilor Wilcoxon

Kruskal-Wallis (ge 3 eşantioane independente)

Friedman (ge 3 eşantioane dependente)

Teste de normalitate variabile cantitative continue

Shapiro-Wilk

Kolmogorov-Smirnov

Shapiro-Wilk

Chi-Square Goodness-of-Fit

Dacă datele urmează o distribuţie normală aplicăm un test parametric

Dacă datele nu urmează o distribuţie normală aplicăm un test de comparare al rangurilor

30

Testul Z de comparare a mediei unui eşantion cu media unei populaţii

Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ

extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie

s2 care se cunoaşte

Condiţii de aplicare

1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru

compararea mediei unui eşantion cu media unei populaţii)

2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal

distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă

3 Talia eşantionului este mare ( ge 30)

Ipoteze

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media

eşantionului şi media populaţiei

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

(-yen -196 ] Egrave [196 yen)

Parametrul testului

n = volumul eşantionului

= media eşantionului

s = deviaţia standard a populaţiei

Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)

Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard

cunoscută

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi

media standard

Condiţii de aplicare

Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se

realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această

condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea

31

Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai

puternic

Numărul de grade de libertate (df) df = n-1

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

Parametrul testului

n = volumul eşantionului

micro0 = media standard

= media eşantionului

s = deviaţia standard a eşantionului

Testul ANOVA compararea mediilor a mai multe eşantioane

H0 = toate mediile sunt egale

H1 = nu toate mediile sunt egale

Condiţii de aplicare

1 Datele sunt independente unele faţă de celelalte

2 Datele fiecărui grup sunt normal distribuite

3 Deviaţia standard este aceeaşi pentru toate grupurile

Id Medicament

A B C D E F

1 5 6 7 10 5 9

2 6 8 8 11 8 8

3 7 7 9 13 6 7

4 8 9 11 12 4 5

32

5 9 10 10 9 7 6

Suma 35 40 45 55 30 35

Media 7 8 9 11 6 7

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =

= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)

Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2

F = (suma pătratelor(icircntre))(suma pătratelor(icircn))

Suma pătratelor (icircntre) = 16times5 = 80

Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60

Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn

interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare

SP df Media pătratelor F = MPicircntreMPicircn

Icircntre 80 5 = 805 = 16 = 1625 = 64

Icircn 60 24 = 6024 = 25

Total 140 29 -

Testul sumei rangurilor Wilcoxon

Aplicat pentru

Un set de observaţii provenite dintr-o valoare ipotetică comună

Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)

Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero

Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace

Suma rangurilor pentru diferenţele negative = 2+3+1 = 6

Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30

33

Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului

egal cu 8 = 0109

Icircnainte După Diferenţa Rang

64 66 -2 2

66 58 8 5

67 68 -1 3

71 65 6 4

72 75 -3 1

76 67 9 6

78 59 19 8

89 74 15 7

Testul Kruskal-Wallis (ge 3 eşantioane independente)

Test de ranguri aplicate pe mai mult de 3 eşantioane

H = parametrul testului

n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)

Tk = suma rangurilor

Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie

pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni

34

df = k-1 (k = numărul de eşantioane)

df = 3-1 = 2

Hcritic(α=005) = 599

H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie

pozitivă şi respectiv biopsie negativă

Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie

a tipului de studiu pe eşantioane perechi)

1 Definirea numărului de tratamente k

2 Obţinerea rangurilor pentru fiecare tratament

3 Sumarea rangurilor fiecărui tratament

4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)

5 Dacă Fr gt Frcritic rarr respingem H0

Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost

măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi

n = 9 k = 3 T12 = 225 T2

2 = 38025 T32 = 38025

Frcritic = 599

Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de

prostată

35

De reţinut

Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei

Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-

of-Fit

Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z

Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t

Compararea mediilor a 3 sau mai multe eşantioane ANOVA

Compararea mediilor a două populaţii (σ) testul Z

Compararea mediilor a două eşantioane (s) testul t

Compararea mediilor a două eşantioane perechi (s) testul t

ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi

cu cel pentru compararea a două eşantioane perechi

Ranguri

Distribuţia datelor nu are importanţă

Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)

Trei sau mai multe eşantioane Kruskal-Wallis

Trei sau mai multe eşantioane perechi Friedman

Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia

Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a

datelor)

Variabile nominale

Un singur eşantion sau eşantioane perechi

Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte

Eşantioane perechi testul Mc Nemar

Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2

Icircn analiza proporţiilor există teste diferite pentru

Compararea unei frecvenţe cu o frecvenţă cunoscută

Compararea a două frecvenţe

Semnificaţia statistică

Valoarea p (p value)

Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor

două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E

posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării

aleatorii

36

Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală

urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii

Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este

probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un

experiment de dimensiunea acestuia

Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că

diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii

diferite

Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca

fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă

ar fi fost adevărată

Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă

1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe

baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De

fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001

2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie

3 Se aplică testul statistic aferent pentru a calcula valoarea p

4 Se compară valoarea p cu valoarea ndash prag

5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe

semnificativă dpdv statisticrdquo

6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e

semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să

conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă

Teste de semnificaţie

Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului

populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)

Testarea ipotezelor implică posibile erori

Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile

sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui

grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul

icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005

ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există

37

nici o diferenţă

Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ

statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de

ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost

ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau

dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă

cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă

semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe

ipotetice variate icircn cazul icircn care ele există

Măsuri ale frecvenţei

Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)

Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate

Generic formula pe care se bazează toate cele trei este

unde x şi y sunt cantităţile de comparat

Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea

unei frecvenţe pe grupe de sex vacircrstă etc

Proporţia implică icircn mod necesar ca x să fie inclus icircn y

Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară

frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp

Pentru calcularea unei rate trebuie ţinut cont de trei aspecte

bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin

bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp

bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo

Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un

tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei

populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei

aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)

38

Indicatori

Rata de incidenţă

Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă

icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii

Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o

perioadă de timp

Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de

timp x

Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei

susceptibili de a dezvolta icircmbolnăvirea studiată

Numitorul poate fi

bull Numărul mediu al populaţiei icircn perioada de timp studiată

bull Mărimea populaţiei icircn mijlocul perioadei de studiu

bull Mărimea populaţiei la icircnceputul studiului

Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă

Este obligatorie menţionarea perioadei de timp

Prevalenţa

Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la

un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă

schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa

momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)

39

Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include

numai cazuri noi respectiv include cazuri noi şi vechi

Rata de atac

Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este

folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp

raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori

Rata persoană-timp

Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din

momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte

migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost

observate

Riscul relativ (RR)

Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment

legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele

prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două

grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la

bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la

bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai

mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo

Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2

Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn

cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă

(Tabelul 1)

Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR

Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la

neexpuşi

40

Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de

culegere a datelor

Odds ratio (OR)

Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin

raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general

studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)

Tabelul 2 Tabelul 2 x 2 pentru calcularea OR

Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală

Rate de mortalitate

Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp

specificată Există mai multe tipuri de rate de mortalitate

o Mortalitate specifică pe sex

o Mortalitate specifică pe rasă

o Mortalitate specifică pe boală

o Mortalitate neonatală

o Mortalitate postneonatală

o Mortalitate infantilă

o Mortalitate maternă

Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP

41

Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de

viaţă şi vacircrsta la care survine decesul dacă este prematur

Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu

Ani de viaţă pierduţi datorat dizabilităţii

Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt

utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru

cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite

grupuri

Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de

risc şi o boală se folosesc riscul relativ şi odds ratio

35 Analiza şi interpretarea datelor

După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date

trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul

Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor

colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului

studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu

plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde

prezenţa biostatisticianului este necesară

Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu

elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat

iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului

iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate

depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori

testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere

clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza

Interpretarea rezultatelor statistice

Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne

motive (număr mic de date) acceptarea ei să fie falsă

Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine

gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia

ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument

de decizie Intervalul de confidenţă

42

Interpretarea statistica ne interpretarea clinică

Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă

Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice

obţinute pe eşantionul studiat

Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare

Ce interpretăm Rezultatele

personale obţinute icircn urma studiului

care au fost prezentate icircn secţiunea bdquoRezultaterdquo

Explicăm rezultatele obţinute

Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale

Interpretarea trebuie să se realizeze icircn

lumina limitelor studiului

contextul cultural social şi educaţional al locului unde s-a realizat cercetarea

contextul a ceea ce se cunoaşte din literatura de specialitate

Interpretăm doar rezultatele personale obţinute icircn urma studiului

Interpretarea statistică nu este tot una cu interpretarea clinică

Interpretarea statistică este importantă

Interpretarea clinică este foarte importantă

Intervalul de confidenţă

Media calculată pe baza unui eşantion nu va echivala media populaţiei

Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului

Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a

populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a

populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)

pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru

orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare

dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de

confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de

date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de

5

Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel

Dacă valoarea p este mică

Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare

aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o

medie diferită Diferenţa este semnificativă dpdv statistic

43

Icircn continuare

Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa

reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică

pentru a fi interesante din punct de vedere ştiinţific

Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC

oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care

este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a

obţine o concluzie clară

Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o

diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că

datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din

punct de vedere ştiinţific

Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul

detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat

Erorile studiilor medicale

Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura

anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară

caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea

asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri

legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias

Erorile potenţiale icircn studiile epidemiologice

1 Erori icircntacircmplătoare

2 Erori sistematice

3 Confuzia

4 Validitatea

1 Erori icircntacircmplătoare

Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a

parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel

de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot

fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii

(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor

de măsură (eroarea de măsurare)

44

2 Erori sistematice

Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate

care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu

acurateţe mare Acurateţea nu este afectată de mărimea eşantionului

Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de

experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea

dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus

şi greu de cuantificat (consum de alcool personalitate etc)

Principalele tipuri de erori din această categorie sunt

bull Biasul de selecţie

bull Biasul de informaţie

Biasul de selecţie

Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul

trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion

inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale

persoanelor incluse

Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se

ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia

Biasul de informaţie

Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de

instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze

expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere

nesemnificativă sau chiar să nu şi-o amintească de loc

3 Confuzia

Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune

prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este

cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă

de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte

important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor

protector

4 Validitatea

Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă

Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte

estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional

Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă

45

conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se

demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)

Validitatea externă se poate realiza numai dacă studiul este valid intern

Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii

studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de

studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt

laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi

validă din punct de vedere intern)

3 6 Prezentarea rezultatelor

După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite

Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor

icircntr-o formă bdquodigerabilărdquo este necesară

Scopul prezentării datelor

1 Transmiterea concluziilor studiului

a Datele corecte şi importante merită comunicate

b Datele trebuie să confirme sau să infirme ipoteza studiului

c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală

2 Acordarea posibilităţii altor cercetători să aprecieze studiul

a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti

b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor

prezentate

Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru

fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie

statistică

Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de

valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras

(Tabel 3)

Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)

46

Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct

numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor

precum şi prezentarea acestora sub formă inteligibilă

Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care

convin cercetătorului

Prezentarea datelor se poate face

1 Figuri şi tabele icircn articole scrise

2 Figuri şi tabele icircn prezentări orale

3 Figuri şi tabele icircn postere

4 Text scris sau incluse icircn text

5 Site-uri de WEB

Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor

Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie

Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele

exprimacircnd exact ceea ce acestea exprimă

Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate

anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel

să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se

acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca

mai sus sugestive sunt formatele simple şi puţin icircncărcate

Dacă nu există reguli impuse se respectă

1 Mesaj simplu fără falsificarea datelor

2 De obicei este necesar atacirct tabelul cacirct şi graficul

3 Să fie simplu şi clar

Tabele

Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile

coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică

elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de

1 Se folosesc doar linii orizontale

2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn

evidenţi prin linie de separare (Tabelul 4)

Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland

Noua Zeelandă)

(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)

47

3 Numerele sunt aliniate icircn funcţie de virgulă

4 Indicii statistici sunt explicaţi sub tabel

5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană

6 Abrevierile pot fi folosite

7 Numărul de zecimale trebuie limitat la maxim două

8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel

9 Plasarea legendei este obligatorie sub tabel

10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)

Icircn cazul prezentărilor orale sau a posterelor este indicat ca

1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării

2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte

3 Folosirea de simboluri este permisă

Clasificarea tabelelor

Tabelele se clasifică după

i) conţinut

bull cu distribuţii de frecvenţe

bull de clase de frecvenţe

bull de contingenţă

ii) structura

bull cu doua coloane

bull cu subclasificări

bull ldquomasterrdquo

Tabele ce conţin distribuţii de frecvenţe

O modalitate comodă de a prezenta o mulţime de date brute este

1 Se ordonează datele in ordine crescătoare

2 Se determine frecvenţa fiecărei valori

3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane

(Tabelul 5)

Tabelul 5 Distribuţii de frecvenţă absolută

48

Tabelul claselor de frecvenţe

1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă

2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)

Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)

Tabele de contingenţă

1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a

tabelelor de contingenţă

2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a

combinaţiilor de perechi ordonate de valori

3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre

a factor de risc si

b starea sănătăţii

4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)

5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)

Tabelul 7 Tabel de contingenţă 2 x 2

49

Grafice

Există două categorii de moduri grafice sub care se pot prezenta datele

1 Ilustraţii şi fotografii

2 Grafice

1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă

pentru lucrare

2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit

Putem vorbi despre mai multe tipuri de grafice

bull Grafice pentru reprezentarea datelor cantitative

1048707 Grafic cartezian (X Y)

1048707 Histograma

1048707 Poligonul de frecvenţe

1048707 Diagrama bdquoscatterrdquo

bull Grafice pentru reprezentarea datelor calitative

1048707 Grafic cu bare

1048707 Diagrama tip bdquoboxplotrdquo

1048707 Diagrama bdquopierdquo

1048707 Cartograma

Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi

dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)

Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)

Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie

Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)

Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)

50

Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir

de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele

două variabile studiate (Figura 6)

Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2

(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2

rămacircne aproximativ constantă)

Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea

comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea

comparativă a mai multor variabile

Figura 7 Grafic calitativ cu bare

51

Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo

Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două

posibilităţi reprezentate grafic este mai frecventă (Figura 8)

Figura 8 Reprezentare tip bdquopierdquo

Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli

sau a oricărui element comparativ Se foloseşte de epidemiologi

Rezultate

Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare

Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o

manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu

explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția

bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la

ilustraţii tabele grafice

Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi

nici rezultatele care invalidează eventual ipoteza

Discuţii

Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd

cultura ştiinţifică şi inteligenţa autorilor

Acest capitol răspunde la trei obiective

Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia

calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de

selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează

rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv

52

este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn

care a fost abordată problema fără a face o revistă a literaturii

Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea

rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul

Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor

afirmaţii nesusţinute de conţinutul lucrării

Concluzii

Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate

să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie

Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de

concluzii va scădea valoarea lucrării

Bibliografia (lista referinţelor citarea icircn text)

Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn

lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente

Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli

- să conţină cele mai importante şi recente lucrări

- să includă numai lucrări publicate

- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate

Bibliografie

Elisabeta Jaba ndash Statistică Ed Economică 1998

Mihai Ţarcă ndash Statistică volI Ed UAIC 1979

Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale

Ed University Press 2009

Sorana Daniela Bolboacă ndash Metodologia cercetării curs

53

Page 14: cercetarea medicala - metodologie

1 Fiziologice Sunt colectate date despre anumite caracteristici fiziologice ale pacienţilor (TA glicemie

colesterol etc) Această metodă aduce rezultate obiective cacirct timp instrumentul de evaluare este bine calibrat

şi prezintă variaţii mici

2 Metode observaţionale Instrumentul de culegere a datelor trebuie să fie sincronizat cu protocolul conceput

de cercetător Datele culese trebuie să fie de asemenea consistente adică să fie colectate de aceeaşi manieră

conducătorul studiului trebuind să instruiască investigatorii (colectorii de date) Icircnregistrarea datelor trebuie să

fie de asemenea sistematică şi bine standardizată Observaţii de control trebuie icircn mod obligatoriu făcute

pentru a putea aprecia icircn mod corect orice deviere datorată unor factorii externi Este obligatorie luarea icircn

consideraţie a aspectelor etice

3 Interviul Poate fi structurat cu un set specific de icircntrebări sau nestructurat cu o temă generală cu care se

icircncepe interviul Interviurile pot fi icircnregistrate sau intervievatorul poate nota pur şi simplu răspunsurile Există

două tipuri generice de interviu interviul de profunzime care se referă la o discuţie icircn general structurată cu

un număr de icircntrebări prestabilite icircn icircncăperea de studiu fiind doară intervievatorul şi persoana chestionată şi

interviul de grup unde prin conversaţii pornind de la temă generală expusă şi condusă de intervievator se

obţin date despre subiecţii participanţi la studiu Ambele metode de interviu au indicaţiile lor precise Un

interviu pe teme intime nu va putea fi corect icircn ceea ce priveşte datele colectate dacă se aplică un interviu de

grup

4 Chestionarul Document scris adresat unor persoane pentru a răspunde la una sau mai multe icircntrebări

Trebuie să aducă răspunsurile la icircntrebările care motivează studiul constituind ansamblul icircntrebărilor destinate

culegerii de informaţii (date) Redactarea chestionarului trebuie să ţină cont de structura acestuia introducere

conţinut exprimarea icircntrebărilor grafica chestionarului

5 Icircnregistrări preexistente

Icircn cercetarea medicală sunt cel mai frecvent utilizate Informaţiile dorite sunt deja existente ceea ce icirci revine

cercetătorului este ca să structureze datele icircn funcţie de scopul studiului pe care icircn conduce Aceste surse sunt

bull Foi de observaţie

bull Registre de consultaţie

bull Buletine de analize

bull Registre de operaţii

Icircn cazul icircn care nici o metodă de culegere a datelor nu este pe placul celui ce conduce studiul există

posibilitatea de a construi un instrument nou de culegere a datelor

Acest proces trebuie să urmărească nişte paşi obligatorii fiind mare consumator de timp

bull Definirea structurii cu care se va face măsurarea

bull Formularea itemilor de măsură

bull Analiza validităţii instrumentului de măsură ndash măsoară acesta fenomenul corect

bull Elaborarea de instrucţiuni de utilizare pentru investigatori

14

bull Pretestarea instrumentului

bull Aprecierea validităţii interne şi externe a datelor culese

Instrumente de cercetare

Formularea clară a temei de cercetare necesită o foarte bună definire a factorilor studiaţi şi a criteriilor de

judecată Acestea din urmă sunt ultimele care vor trebui definite icircn cadrul protocolului de studiu

Alegerea unui instrument de măsură

Nu există un instrument de măsură perfect sau universal corect Alegerea sa dintre cele existente şi cele deja

utilizate depind de trei factori

bull Obiectivul studiului

bull Boala studiată

bull Populaţia icircn studiu

De aceste trei elemente trebuie ţinut cont icircn fiecare etapă a dezvoltării instrumentului

Definirea obiectivului

Studiu transversal Dacă se doreşte studierea unui simptom sau a unei caracteristici ale populaţiei se poate

icircmpărţi populaţia de studiu icircn mai multe grupuri Este practic vorba de a determina diferenţele dintre subiecţi

icircn cea ce priveşte o variabilă necesară studiată printr-un studiu transversal (utilizarea dozării de Ac HBS

pentru a evalua progresele bolnavilor de hepatită tip B)

Studiu longitudinal Icircn acest caz nu se poate icircmpărţii populaţia de studiu icircn mai multe grupuri datele obţinute

fiind de la acelaşi subiect colectate după un interval de timp

Icircn funcţie de boală şi populaţie se aleg şi instrumentele de măsură cele mai adecvate

Instrumentele cercetării reprezintă un mecanism specific sau o strategie pe care cercetătorul o utilizează pentru

colectarea prelucrarea şi inferenţa datelor Aceste instrumente sunt

1 Studiul icircn bibliotecă

2 Computerul

3 Determinările experimentale

4 Statistica

5 Mintea umană

6 Facilităţi de limbaj şi comunicare

Determinările experimentale

Măsurarea constă icircn aprecierea şi cuantificarea fenomenelor calitativ sau cantitativ Interpretarea

datelor se referă la transformarea lor icircn unităţi de descoperire a unor fenomene mai puţin cercetate

Standardele acceptate se referă la norme medii distribuţii etc Tot icircn cadrul interpretării datelor datele

obţinute sunt caracterizate pe scale de valori nominal ordinal de interval sau de raport

Validarea şi reproductibilitatea măsurătorilor sunt aspecte importante şi foarte necesare pentru o

cercetare corect fundamentată care doreşte obţinerea unor concluzii pertinente

15

Statistica Este implicată icircn condensarea şi procesarea unui volum mai mare de date astfel icircncacirct să se poată

interpreta corect valorile obţinute şi să se permită comparările Utilizarea unor teste statistice specifice permite

determinarea semnificaţiei (diferenţei) statistice astfel icircncacirct estimatorii să poată fi aplicaţi la populaţia

generală Furnizează informaţii şi privind corelarea sau relaţionarea icircntre date

Mintea umană este cea care reuşeşte să integreze şi să icircnţeleagă rezultatele obţinute Semnificaţia ştiinţifică

este stabilită icircn funcţie de rezultatele statisticii de mintea umană conform afirmaţiei bdquosemnificaţia ştiinţifică

nu este egală cu semnificaţia statisticărdquo Metodele aplicate pentru a putea ajunge la o concluzie pertinentă sunt

logica deductivă raţionamentul inductiv şi gacircndirea critică

Limbaj şi comunicare Exprimarea orală sau icircn scris permite nuanţarea unor aspecte seci cifrice ale unor

studii Icircn acest mod devine mai evidentă semnificaţia ştiinţifică a unor rezultate statistice

34 Prelucrarea datelor

Instrumentele de prelucrare

Statistica este o ştiinţă ramură a matematicii care studiază evoluţia fenomenelor şi proceselor

colective pe baza observării lor ştiinţifice a culegerii şi prelucrării detaliate a informaţiilor statistice cu scopul

de a formula şi explica legile legităţile şi regularităţile ce le guvernează

Statistica permite deci aprecierea unor parametrii populaţionali prin studiul unui număr redus de

elemente ale populaţiei icircn studiu (ţintă) O populaţie poate fi definită printr-un şir de valori care pot fi grupate

icircn funcţie de parametrul studiat (glicemie colesterol TAD TAS etc) Pentru fiecare astfel de şir se defineşte

o variabilă (care va purta nume propriu glicemie colesterol etc) Practic variabila este considerată o funcţie

ia valori posibil diferite de la un element la altul icircn funcţie de caracteristicile proprii acestora Sunt clasificate

icircn două grupe variabile cantitative (caracteristică măsurabilă) şi calitative (caracteristică ce nu poate fi

măsurată)

La racircndul lor variabilele calitative pot fi

bull Nominale ndash grupuri de elemente ce nu pot fi ordonate (culoarea părului)

bull Nominale ordonate ndash concluziile pot fi grupate (eficienţa unui tratament slabă bună foarte bună)

bull Binare ndash apar numai două posibilităţi (bolnav sănătos)

Variabilele cantitative pot fi

bull Continue ndash o variabilă măsurabilă care poate lua o infinitate de valori

bull Discrete ndash variabile care nu pot lua decacirct valori icircntregi

Statistica descriptivă

Există două ramuri ale statisticii statistica descriptivă şi statistica inferenţială

Statistica descriptivă (după cum rezultă din denumire) se ocupă cu descrierea unor valori obţinute ale unei

variabile studiate

16

Valorile pe care variabila le ia se constituie icircntr-o serie statistică Indicatorii care definesc o variabilă (serie)

sunt

1 Ale tendinţei centrale

Media aritmetică - notată de regulă cu

Mediana - este acea valoare din şirul de date care icircmparte icircn două părţi egale şirul ordonat de valori (atenţie

şirul este ordonat crescător) situacircndu-se la mijlocul seriei statistice

Dacă numărul de valori n este un număr impar atunci mediana este valoarea unde

Dacă n este par deci avem un număr par de valori mediana este definitatilde ca fiind

unde k = n2

Modul - constituie valoarea care apare cel mai des deci valoarea cu numărul cel mai mare de apariţii

2 De dispersie

Amplitudinea - este diferenţa dintre valoarea maximă şi cea minimă

A = Amax - Amin

Amplitudinea relativă - notată A este raportul dintre amplitudinea absolută şi media aritmetică a seriei de

date

Varianţa notată este un indicator de icircmprăştiere a datelor Formula de calcul este

Abaterea standard (S) sau deviaţia standard reprezintă rădăcina pătrată din varianţă (dispersie)

Coeficientul de variaţie se calculează ca un raport procentual icircntre abaterea standard şi valoarea medie a şirului

de valori

Eroarea standard intervine icircn estimarea intervalelor de confidenţă Se calculează astfel

17

3 De asimetrie (skewness) indică distribuţia datelor dacă sunt sau nu distribuite normal

4 De boltire (kurtosis) estimează boltirea sau aplatizarea curbei de distribuţie

Prezentarea descriptivă a datelor se face prin icircnregistrarea datelor culese icircn tabele care să reprezinte icircn mod

sintetic valorile măsurate

Icircn concluzie statistica descriptivă permite

bull Stabilirea comparabilităţii icircntre grupurile de studiu şi aprecierea prezenţei erorilor sau confuziei

bull Reprezentarea datelor icircn tabele permite evaluarea fiecărui pacient şi dacă a existat pierderi din studiu

Statistica inferenţială

Statistica inferenţială (inductivă) este partea de analiză a datelor care permite extrapolarea unei

concluzii trase pe baza unui eşantion spre populaţia ţintă pentru care a fost efectuat studiul

Scopul analizei statistice este de a evidenţia efectul unui tratament sau al unui factor de risc prin date obţinute

din eşantionul studiat spre populaţia ţintă Aceasta implică testarea ipotezelor statistice sau altfel spus testarea

semnificaţiei statistice Este una dintre cele mai importante momente ale studiului Cum rezultatele sunt

obţinute prin studiul unui eşantion există posibilitatea ca acestea să fie datorate icircntacircmplării Testele

statistice ne ajută să apreciem icircn ce măsură rezultatele sunt icircntacircmplătoare şi mai ales icircn ce măsură şi dacă se

pot aplica populaţiei generale Icircn acest scop se impune o valoare limită alfa 005 care reprezintă limita

superioară a probabilităţii ca rezultatul obţinut să fie greşit (datorat icircntacircmplării) Astfel icircn funcţie de tipul

variabilelor şi indicatorii descriptivi aplicaţi şi evaluaţi se aplică teste de semnificaţie statistică (Tabelul 1)

Tabelul 1 Alegerea testelor de semnificaţie statistică

Tipul datelor

18

Diferenţierea variabilelor din punctul de vedere a distribuţiei se face folosind testul de normalitate

Kolmogorov ndash Smirnov

Testul statistic reprezintă metoda de comparaţie a două sau mai multe populaţii prin intermediul unor

variabile observate ale lor

Scopul unui test statistic este de a defini realitatea

Definirea icircntrebării de cercetare (ipoteza clinică)

Tratamentul cu Nebivolol este la fel de eficient ca şi cel cu Valsartan icircn tratamentul

hipertensiunii arteriale

Transpunerea icircntrebării de cercetare icircn termeni statistici (ipoteza statistică)

Media tensiunii arteriale a pacienţilor trataţi cu Valsartan nu diferă semnificativ de media

tensiunii arteriale a pacienţilor trataţi cu Nebivolol

Etapele unui test statistic

1 Formularea problemei icircn termenii ipotezelor statistice

2 Alegerea şi calcularea parametrului statistic al testului

3 Regiunea critică

4 Concluzia testului

1 Formularea problemei icircn termenii ipotezelor statistice

Ipoteza nulă ipoteza care trebuie testată testul efectuacircndu-se sub prezumţia că ipoteza nulă ar

fi adevărată

Ipoteza alternativă acea ipoteză care icircntr-un sens sau altul contrazice ipoteza nulă Această

ipoteză se mai numeşte şi ipoteza de lucru

Ipoteza nulă tipuri

O coadă (ldquoone-tailedrdquo sau ldquoone-siderdquo)

Media este mai mare

Media este mai mică

Două cozi (ldquoone-tailedrdquo sau ldquoone-siderdquo)

Media este egală

2 Alegerea şi calcularea parametrului statistic al testului

Parametrul statistic al testului exprimă icircntr-o anumită formă diferenţa dintre elementele comparate

Ţinacircnd seama de faptul că eşantionul sau eşantioanele utilizate sunt aleator extrase din populaţiile care

fac obiectul testului parametrul statistic este o variabilă aleatoare de selecţie care urmează o anumită

lege de probabilitate

Un parametru statistic al testului bun trebuie să icircndeplinească două condiţii

19

Trebuie să se comporte diferit atunci cacircnd ipoteza nulă H0 este adevărată faţă de situaţia icircn

care ipoteza alternativă H1 este adevărată

Distribuţia de probabilitate a parametrului statistic al testului sub prezumţia că H0 este

adevărată este cunoscută

3 Regiunea critică

- Trebuie să fim capabili să decidem icircn funcţie de valoarea parametrului statistic calculat care dintre

ipoteze cea nulă sau cea alternativă este adevărată

- Dacă valoarea parametrului statistic aparţine regiunii critice ipoteza nulă H0 va fi respinsă şi va fi

acceptată ipoteza alternativă H1

- Dacă valoarea parametrului statistic nu aparţine regiunii critice ipoteza nulă H0 va fi acceptată

- Decidem mărimea regiunii critice

Pentru aceasta trebuie să specificăm mărimea riscului de eroare pe care icircl acceptăm

Pe scurt definim nivelul de semnificaţie notat cu a sau mărimea riscului pe care

suntem dispuşi să ni-l asumăm icircn respingerea ipotezei nule H0 icircn cazul icircn care aceasta

este adevărată De obicei se alege un nivel de semnificaţie icircntre 1 şi 5

Probabilitatea unei erori de tipul I

probabilitatea de respingere a ipotezei nule H0 icircn favoarea ipotezei alternative H1 icircn

condiţiile icircn care H0 este adevărată

probabilitatea unei erori de tipul I se notează cu a şi se mai numeşte nivel de

semnificaţie al testului

Probabilitatea unei erori de tipul II

probabilitatea acceptării ipotezei nule icircn condiţiile icircn care ipoteza alternativă H1 este

adevărată

această probabilitate se notează cu b

- Unilaterală la dreapta ndash valoarea parametrului statistic al testului este mai mare sau egală cu

valoarea din dreapta a intervalului critic

- Unilaterală la stacircnga ndash valoarea parametrului statistic al testului este mai mică sau egală cu

valoarea din stacircnga a intervalului critic

- Bilaterală ndash valoarea parametrului statistic al testului este mai mică sau egală cu valoarea extremă

din stacircnga regiunii critice sau mai mare sau egală cu valoarea extremă din dreapta regiunii critice

valorile extreme ale regiunii critice avacircnd nivele egale de semnificaţie

4 Concluzia testului

- Ipoteza nulă H0 este respinsă dacă valoarea parametrului statistic aparţine regiunii critice

20

- Regiunea critică trebuie astfel aleasă icircncacirct dacă ipoteza alternativă H1 este adevărată

probabilitatea de respingere a ipotezei nule H0 este mai mare decacirct icircn cazul icircn care ipoteza nulă H0

ar fi adevărată

- Acceptarea ipotezei nule H0 atunci cacircnd ipoteza alternativă H1 este adevărată este cunoscută ca şi

eroarea de tipul II

a probabilitatea ei se notează cu b

b măsoară bdquonivelul de eroarerdquo

- Icircn testarea oricărei ipoteze statistice există patru situaţii care determină dacă decizia noastră este

corectă sau nu

Cazuri

H0 este adevărată H0 este falsă

Concluzie H0 se acceptă decizie corectă eroare de tipul

II

H0 se

respinge

eroare de tipul I decizie corectă

Luarea deciziei pe baza valorii probabilităţii p de semnificaţie a testului

Icircn momentul icircn care prelucrăm statistic o serie de date dorim să ştim dacă rezultatele obţinute sunt sau

nu semnificative statistic

Răspunsul la această icircntrebare este dat de valoarea lui p calculată de orice program statistic la

prelucrarea unor date

Icircn cazul testelor statistice ipoteza nulă este respinsă dacă nivelul de semnificaţie este mai mic decacirct

005 iar programele de prelucrare statistică a datelor vor afişa o steluţă () icircn tabelul rezultatelor

21

Dacă p le 005 respingem ipoteza nulă şi acceptăm ipoteza alternativă (am obţinut semnificaţia

statistică)

Dacă p gt 005 acceptăm ipoteza nulă (nu am obţinut semnificaţia statistică)

p = 013

NU respingem ipoteza nulă

Risc de eroare de tip II

α = 005

p = 002

Respingem ipoteza nulă

Risc de eroare de tip I

Semnificaţia lui p

Criteriu de luare a deciziei cu privire la o ipoteză statistică nulă

Cuantifică şansa ca o decizie de respingere a ipotezei nule să fie greşită

Măsură a semnificaţiei statistice şi NU CLINICĂ

22

Semnificaţia lui p (reguli empirice)

001 le p lt 005 rezultatul e semnificativ statistic

0001 le p lt 001 rezultatul e icircnalt semnificativ statistic

p lt 0001 rezultatul e foarte icircnalt semnificativ statistic

p ge 005 rezultatul e considerat nesemnificativ statistic

Limite ale valorii p

Valoarea p NU ne dă informaţii despre

Şansa de beneficiu a unui pacient individual

Procentul de pacienţi care vor avea un beneficiu icircn urma instituirii procedurii medicale

Gradul de beneficiu expectat pentru un anumit pacient

Puterea unui test statistic

Este capacitatea de a detecta o diferenţă acolo unde există

Creşterea volumului eşantionului determină creşterea puterii testului statistic aplicat

Valoarea este icircn relaţie directă cu eroarea de tip II

Puterea = 1 ndash β

Cea mai utilizată modalitate de creştere a puterii unui test statistic este de a creşte volumul

eşantionului

Tipul scalei de măsură ndash testul statistic

Denumire test Interval Nominal Observaţii

Corelaţie Pearson 2 0 Există o relaţie liniară

χ2 0 2

Student 1 1 Doar 2 grupuri

ANOVA 1 1 2 sau mai multe grupuri

Student perechi 1 1 Eşantioane perechi

Măsurători repetate (ANOVA) 1 1 Mai mult de 2 grupuri date

perechi

Inferenţa statistică pe date calitativ e

Tabela de contingenţă 2times2

Riscuri şi raţii

Testul χ2 (testarea asocierii icircn tabela de contingenţă)

Testul Fisher

23

Testul z pentru proporţii

Testul McNemar

Tabela de contingenţă 2times2

Scale de tip nominal (dicotomiale tabela de contingenţă de 2times2) sau ordinal (tabela de contingenţă de

rtimesc)

Frecvenţa absolută (numărul de evenimente per categorie)

Tabela de contingenţă de 2times2 4 categorii

AP = adevărat pozitiv

FP = fals pozitiv

FN = fals negativ

AN = adevărat negativ

Ulcer deschis Ulcer vindecat Total

Recurenţă + AP = 1 FP = 5 = 1+5 = 6

Recurenţă - FN = 7 AN = 16 = 7+16 = 23

Total =1+7=8 =5+16=21 29

Riscuri şi raţii Mărimi ale asocierii

Denumire Formula Definiţie

Rata falşilor pozitivi =FP(FP+AN) Probabilitatea unui test fals + (α)

Rata falşilor negativi =FN(FN+AP) Probabilitatea unui test fals ndash (β)

Sensibilitate =AP(AP+FN) Probabilitatea unui test real + (1- β)

Specificitate =AN(AN+FP) Probabilitatea unui test real ndash (1- α)

Acurateţe =(AP+AN)n Probabilitatea generală a unei decizii corecte

Valoarea predictivă pozitivă =AP(AP+FP) Probabilitatea ca un test pozitiv să fie corect

Valoarea predictivă negativă =AN(AN+FN) Probabilitatea ca un test negativ să fie corect

Riscul relativ =AP(FP+AN)FN(AP+FP)

Rata şansei =(AP∙AN)(FN∙FP)

Riscul atribuabil =AP(AP+FP)-FN(FN+AN)

24

Denumire Formula

Rata falşilor pozitivi = 5(5+1) = 08334

Rata falşilor negativi = 7(7+16) = 03043

Sensibilitate = 1(1+7) = 01250

Specificitate = 16(16+5) = 07619

Acurateţe = (1+16)29 = 05862

Valoarea predictivă pozitivă = 1(1+5) = 01667

Valoarea predictivă negativă = 16(16+7) = 06957

Riscul relativ = 1(5+16)7(1+5) = 2142 = 050

Rata şansei = (1∙16)(7∙5) = 04571

Riscul atribuabil = 1(1+5)-7(7+16) = 01667-03043=-01376

Testarea asocierii icircn tabela de contingenţă

Testul χ2

Nu trebuie utilizat pentru eşantioane de volum mic

Testul este valid doar dacă valoarea expectată (aşteptată) pentru fiecare celulă este cel puţin

egală cu 1 şi frecvenţa absolută observată este de minim 5

Dacă aceste condiţii nu sunt icircndeplinite se aplică testul exact al lui Fisher (Fisherrsquos Exact Test)

Indică dacă cele două variabile sunt sau nu independente DAR NU cuantifică puterea asocierii

dintre ele

Problema S-a investigat icircntr-un studiu asocierea dintre obezitatea (ca factor de risc) şi bolile

cardio-vasculare la persoanele icircn etate (gt 60 ani) Din totalul de 620 persoane investigate s-au

identificat 150 persoane cu obezitate şi boală cardio-vasculară 230 persoane fără obezitate şi

fără boală cardio-vasculară şi 60 persoane fără obezitate dar cu boală cardio-vasculară Există

o asociere icircntre obezitate şi boala cardio-vasculară (df=1 α=005 χ2critic = 384)

Testul χ2 exemplu

H025

Nu există asociere icircntre obezitate şi bolile cardio-vasculare

Obezitatea şi bolile cardio-vasculare sunt independente

H1

Există asociere icircntre obezitate şi bolile cardio-vasculare

Obezitatea şi bolile cardio-vasculare sunt asociate

a = 005 pragul de semnificaţie al testului

urmează o lege cu (r-1)(c-1) grade de libertate

χ2 = parametrul testului χ2

fio = frecvenţa observată

fit = frecvenţa teoretică

Regiunea critică este [χα2 yen)

Pentru α = 005 χα2 = 384

OBSERVAT BCV+ BCV- Total

Obezitate + AP = 150 FP = 180 330

Obezitate - FN = 60 AN = 230 290

Total 210 410 620

TEORETIC BCV+ BCV- Total

Obezitate + = 330times210620 = 330times410620 330

Obezitate - = 290times210620 = 290times410620 290

Total 210 410 620

TEORETIC BCV+ BCV- Total

Obezitate + = 330times210620 = 330times410620 330

26

Obezitate - = 290times210620 = 290times410620 290

Total 210 410 620

TEORETIC BCV+ BCV-

Obezitate + = 112 = 218

Obezitate - = 98 = 192

Deoarece 4177Icirc[384 yen) se respinge H0 cu un risc de eroare de 5

Există asociere icircntre obezitate şi bolile cardio-vasculare

Testul Fisher

Corecţie a testului χ2

Valoarea p asociată parametrului ne dă probabilitatea ca valoarea observată de independenţă să fie

atribuită doar şansei

O valoare p mică indică că există alte cauze decacirct şansa influenţează rezultatul şi astfel cele două

variabile investigate nu sunt independente

Testul Fisher = dispersia corectată a factorului x dispersia corectată a factorilor reziduali

Icircn acest context regula adunării dispersiilor se poate scrie unde

este variaţia lui y pe seama variaţiei variabilei x

este variaţia lui y pe seama influenţei factorilor reziduali (neicircnregistraţi)

este variaţia totală a caracteristicii y

Testul Fisher empiric se calculează după formula

27

se compară cu Ftab pentru nx şi nz grade de libertate la un anumit prag de semnificaţie stabilit

Dacă Fc gt Ftab rezultă că variaţia factorului de grupare x este semnificativă pentru variaţia caracteristicii y

Testul z pentru proporţii

1 Compararea unei frecvenţe observate cu o frecvenţă teoretică

2 Testarea egalităţii a două frecvenţe

Testul z Compararea unei frecvenţe observate cu o frecvenţă teoretică

Scop Investigarea semnificaţiei diferenţei icircntre o frecvenţă teoretică p (icircntr-o populaţie) şi o frecvenţă

observată f pe un eşantion reprezentativ (variabilă calitativă (binare))

Condiţii de aplicare Testul este corect aplicat dacă numărul n al observaţiilor eşantionului este

suficient de mare (n∙p n∙(1-p)gt10

Parametrul

n = volumul eşantionului

Suntem interesaţi de investigarea prevalenţei hepatitei B la personalul care lucrează icircn laboratoarele

clinicilor de boli infecţioase din Transilvania Se ştie din studii anterioare că prevalenţa hepatitei B icircn

populaţia generală din Transilvania este de 9 S-a luat icircn studiu un eşantion de 100 persoane şi s-a

obţinut o prevalenţă a hepatitei B de 6 Există diferenţă semnificativă icircntre frecvenţa hepatitei B la

personalul care lucrează icircn laboratoarele spitalelor de boli infecţioase din Transilvania faţă de

populaţia generală

f = 006 p = 009 n = 100

Ipoteza nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat

faţă de frecvenţa hepatitei B icircn populaţia generală

Ipoteza alternativă test bilateral Există diferenţă semnificativă icircntre frecvenţa hepatitei B la

nivelul eşantionului şi prevalenţa hepatitei B icircn populaţia generală

f = 006 p = 009 n = 100

Pragul de semnificaţie a = 005

Regiunea critică test bilateral (-yen -196 ]Egrave[196 yen)

28

Concluzia testului

Deoarece parametrul statistic calculat al testului nu aparţine regiunii critice se acceptă ipoteza

nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat faţă de

frecvenţa hepatitei B icircn populaţia generală

Testul McNemar

Evaluarea dependenţei variabilelor calitative perechi (dorim să determinăm dacă o anumită

caracteristică este sau nu asociată cu o anumită patologie)

Identificăm n pacienţi care prezintă patologia de interes (eg Cancer bronho-pulmonar) şi n

pacienţi cu aceleaşi caracteristici ca şi primul grup dar care nu o prezintă

Martor = da Martor = nu

Caz = da a b

Caz = nu c d

Testul McNemar - exemplu fumat vs cancer

Martor = da Martor = nu

Cancer = da a = 2 b = 5

Cancer = nu c = 0 d = 3

29

χ2critic(α=005) = 384

32 lt 384 rarr acceptăm ipoteza nulă

Fumatul nu este icircn relaţie cu apariţia cancerului bronho-pulmonar

Inferenţa statistică pe date cantitative

Variabile cantitative continue

Testul z şi Student (t) (o medie sau medii perechi)

Testul z şi Student (t) (testarea a două medii)

ANOVA (ge 3 medii)

Ranguri (variabile cantitative discrete sau cantitative care nu icircndeplinesc condiţia de

normalitate)

Testul sumei rangurilor Wilcoxon

Kruskal-Wallis (ge 3 eşantioane independente)

Friedman (ge 3 eşantioane dependente)

Teste de normalitate variabile cantitative continue

Shapiro-Wilk

Kolmogorov-Smirnov

Shapiro-Wilk

Chi-Square Goodness-of-Fit

Dacă datele urmează o distribuţie normală aplicăm un test parametric

Dacă datele nu urmează o distribuţie normală aplicăm un test de comparare al rangurilor

30

Testul Z de comparare a mediei unui eşantion cu media unei populaţii

Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ

extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie

s2 care se cunoaşte

Condiţii de aplicare

1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru

compararea mediei unui eşantion cu media unei populaţii)

2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal

distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă

3 Talia eşantionului este mare ( ge 30)

Ipoteze

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media

eşantionului şi media populaţiei

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

(-yen -196 ] Egrave [196 yen)

Parametrul testului

n = volumul eşantionului

= media eşantionului

s = deviaţia standard a populaţiei

Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)

Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard

cunoscută

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi

media standard

Condiţii de aplicare

Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se

realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această

condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea

31

Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai

puternic

Numărul de grade de libertate (df) df = n-1

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

Parametrul testului

n = volumul eşantionului

micro0 = media standard

= media eşantionului

s = deviaţia standard a eşantionului

Testul ANOVA compararea mediilor a mai multe eşantioane

H0 = toate mediile sunt egale

H1 = nu toate mediile sunt egale

Condiţii de aplicare

1 Datele sunt independente unele faţă de celelalte

2 Datele fiecărui grup sunt normal distribuite

3 Deviaţia standard este aceeaşi pentru toate grupurile

Id Medicament

A B C D E F

1 5 6 7 10 5 9

2 6 8 8 11 8 8

3 7 7 9 13 6 7

4 8 9 11 12 4 5

32

5 9 10 10 9 7 6

Suma 35 40 45 55 30 35

Media 7 8 9 11 6 7

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =

= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)

Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2

F = (suma pătratelor(icircntre))(suma pătratelor(icircn))

Suma pătratelor (icircntre) = 16times5 = 80

Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60

Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn

interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare

SP df Media pătratelor F = MPicircntreMPicircn

Icircntre 80 5 = 805 = 16 = 1625 = 64

Icircn 60 24 = 6024 = 25

Total 140 29 -

Testul sumei rangurilor Wilcoxon

Aplicat pentru

Un set de observaţii provenite dintr-o valoare ipotetică comună

Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)

Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero

Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace

Suma rangurilor pentru diferenţele negative = 2+3+1 = 6

Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30

33

Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului

egal cu 8 = 0109

Icircnainte După Diferenţa Rang

64 66 -2 2

66 58 8 5

67 68 -1 3

71 65 6 4

72 75 -3 1

76 67 9 6

78 59 19 8

89 74 15 7

Testul Kruskal-Wallis (ge 3 eşantioane independente)

Test de ranguri aplicate pe mai mult de 3 eşantioane

H = parametrul testului

n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)

Tk = suma rangurilor

Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie

pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni

34

df = k-1 (k = numărul de eşantioane)

df = 3-1 = 2

Hcritic(α=005) = 599

H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie

pozitivă şi respectiv biopsie negativă

Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie

a tipului de studiu pe eşantioane perechi)

1 Definirea numărului de tratamente k

2 Obţinerea rangurilor pentru fiecare tratament

3 Sumarea rangurilor fiecărui tratament

4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)

5 Dacă Fr gt Frcritic rarr respingem H0

Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost

măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi

n = 9 k = 3 T12 = 225 T2

2 = 38025 T32 = 38025

Frcritic = 599

Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de

prostată

35

De reţinut

Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei

Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-

of-Fit

Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z

Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t

Compararea mediilor a 3 sau mai multe eşantioane ANOVA

Compararea mediilor a două populaţii (σ) testul Z

Compararea mediilor a două eşantioane (s) testul t

Compararea mediilor a două eşantioane perechi (s) testul t

ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi

cu cel pentru compararea a două eşantioane perechi

Ranguri

Distribuţia datelor nu are importanţă

Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)

Trei sau mai multe eşantioane Kruskal-Wallis

Trei sau mai multe eşantioane perechi Friedman

Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia

Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a

datelor)

Variabile nominale

Un singur eşantion sau eşantioane perechi

Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte

Eşantioane perechi testul Mc Nemar

Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2

Icircn analiza proporţiilor există teste diferite pentru

Compararea unei frecvenţe cu o frecvenţă cunoscută

Compararea a două frecvenţe

Semnificaţia statistică

Valoarea p (p value)

Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor

două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E

posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării

aleatorii

36

Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală

urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii

Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este

probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un

experiment de dimensiunea acestuia

Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că

diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii

diferite

Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca

fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă

ar fi fost adevărată

Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă

1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe

baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De

fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001

2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie

3 Se aplică testul statistic aferent pentru a calcula valoarea p

4 Se compară valoarea p cu valoarea ndash prag

5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe

semnificativă dpdv statisticrdquo

6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e

semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să

conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă

Teste de semnificaţie

Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului

populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)

Testarea ipotezelor implică posibile erori

Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile

sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui

grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul

icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005

ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există

37

nici o diferenţă

Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ

statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de

ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost

ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau

dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă

cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă

semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe

ipotetice variate icircn cazul icircn care ele există

Măsuri ale frecvenţei

Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)

Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate

Generic formula pe care se bazează toate cele trei este

unde x şi y sunt cantităţile de comparat

Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea

unei frecvenţe pe grupe de sex vacircrstă etc

Proporţia implică icircn mod necesar ca x să fie inclus icircn y

Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară

frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp

Pentru calcularea unei rate trebuie ţinut cont de trei aspecte

bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin

bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp

bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo

Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un

tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei

populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei

aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)

38

Indicatori

Rata de incidenţă

Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă

icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii

Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o

perioadă de timp

Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de

timp x

Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei

susceptibili de a dezvolta icircmbolnăvirea studiată

Numitorul poate fi

bull Numărul mediu al populaţiei icircn perioada de timp studiată

bull Mărimea populaţiei icircn mijlocul perioadei de studiu

bull Mărimea populaţiei la icircnceputul studiului

Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă

Este obligatorie menţionarea perioadei de timp

Prevalenţa

Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la

un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă

schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa

momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)

39

Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include

numai cazuri noi respectiv include cazuri noi şi vechi

Rata de atac

Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este

folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp

raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori

Rata persoană-timp

Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din

momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte

migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost

observate

Riscul relativ (RR)

Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment

legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele

prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două

grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la

bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la

bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai

mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo

Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2

Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn

cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă

(Tabelul 1)

Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR

Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la

neexpuşi

40

Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de

culegere a datelor

Odds ratio (OR)

Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin

raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general

studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)

Tabelul 2 Tabelul 2 x 2 pentru calcularea OR

Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală

Rate de mortalitate

Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp

specificată Există mai multe tipuri de rate de mortalitate

o Mortalitate specifică pe sex

o Mortalitate specifică pe rasă

o Mortalitate specifică pe boală

o Mortalitate neonatală

o Mortalitate postneonatală

o Mortalitate infantilă

o Mortalitate maternă

Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP

41

Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de

viaţă şi vacircrsta la care survine decesul dacă este prematur

Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu

Ani de viaţă pierduţi datorat dizabilităţii

Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt

utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru

cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite

grupuri

Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de

risc şi o boală se folosesc riscul relativ şi odds ratio

35 Analiza şi interpretarea datelor

După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date

trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul

Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor

colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului

studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu

plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde

prezenţa biostatisticianului este necesară

Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu

elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat

iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului

iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate

depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori

testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere

clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza

Interpretarea rezultatelor statistice

Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne

motive (număr mic de date) acceptarea ei să fie falsă

Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine

gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia

ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument

de decizie Intervalul de confidenţă

42

Interpretarea statistica ne interpretarea clinică

Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă

Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice

obţinute pe eşantionul studiat

Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare

Ce interpretăm Rezultatele

personale obţinute icircn urma studiului

care au fost prezentate icircn secţiunea bdquoRezultaterdquo

Explicăm rezultatele obţinute

Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale

Interpretarea trebuie să se realizeze icircn

lumina limitelor studiului

contextul cultural social şi educaţional al locului unde s-a realizat cercetarea

contextul a ceea ce se cunoaşte din literatura de specialitate

Interpretăm doar rezultatele personale obţinute icircn urma studiului

Interpretarea statistică nu este tot una cu interpretarea clinică

Interpretarea statistică este importantă

Interpretarea clinică este foarte importantă

Intervalul de confidenţă

Media calculată pe baza unui eşantion nu va echivala media populaţiei

Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului

Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a

populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a

populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)

pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru

orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare

dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de

confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de

date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de

5

Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel

Dacă valoarea p este mică

Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare

aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o

medie diferită Diferenţa este semnificativă dpdv statistic

43

Icircn continuare

Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa

reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică

pentru a fi interesante din punct de vedere ştiinţific

Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC

oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care

este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a

obţine o concluzie clară

Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o

diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că

datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din

punct de vedere ştiinţific

Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul

detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat

Erorile studiilor medicale

Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura

anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară

caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea

asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri

legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias

Erorile potenţiale icircn studiile epidemiologice

1 Erori icircntacircmplătoare

2 Erori sistematice

3 Confuzia

4 Validitatea

1 Erori icircntacircmplătoare

Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a

parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel

de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot

fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii

(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor

de măsură (eroarea de măsurare)

44

2 Erori sistematice

Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate

care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu

acurateţe mare Acurateţea nu este afectată de mărimea eşantionului

Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de

experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea

dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus

şi greu de cuantificat (consum de alcool personalitate etc)

Principalele tipuri de erori din această categorie sunt

bull Biasul de selecţie

bull Biasul de informaţie

Biasul de selecţie

Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul

trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion

inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale

persoanelor incluse

Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se

ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia

Biasul de informaţie

Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de

instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze

expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere

nesemnificativă sau chiar să nu şi-o amintească de loc

3 Confuzia

Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune

prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este

cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă

de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte

important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor

protector

4 Validitatea

Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă

Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte

estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional

Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă

45

conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se

demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)

Validitatea externă se poate realiza numai dacă studiul este valid intern

Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii

studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de

studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt

laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi

validă din punct de vedere intern)

3 6 Prezentarea rezultatelor

După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite

Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor

icircntr-o formă bdquodigerabilărdquo este necesară

Scopul prezentării datelor

1 Transmiterea concluziilor studiului

a Datele corecte şi importante merită comunicate

b Datele trebuie să confirme sau să infirme ipoteza studiului

c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală

2 Acordarea posibilităţii altor cercetători să aprecieze studiul

a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti

b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor

prezentate

Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru

fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie

statistică

Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de

valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras

(Tabel 3)

Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)

46

Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct

numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor

precum şi prezentarea acestora sub formă inteligibilă

Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care

convin cercetătorului

Prezentarea datelor se poate face

1 Figuri şi tabele icircn articole scrise

2 Figuri şi tabele icircn prezentări orale

3 Figuri şi tabele icircn postere

4 Text scris sau incluse icircn text

5 Site-uri de WEB

Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor

Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie

Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele

exprimacircnd exact ceea ce acestea exprimă

Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate

anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel

să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se

acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca

mai sus sugestive sunt formatele simple şi puţin icircncărcate

Dacă nu există reguli impuse se respectă

1 Mesaj simplu fără falsificarea datelor

2 De obicei este necesar atacirct tabelul cacirct şi graficul

3 Să fie simplu şi clar

Tabele

Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile

coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică

elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de

1 Se folosesc doar linii orizontale

2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn

evidenţi prin linie de separare (Tabelul 4)

Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland

Noua Zeelandă)

(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)

47

3 Numerele sunt aliniate icircn funcţie de virgulă

4 Indicii statistici sunt explicaţi sub tabel

5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană

6 Abrevierile pot fi folosite

7 Numărul de zecimale trebuie limitat la maxim două

8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel

9 Plasarea legendei este obligatorie sub tabel

10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)

Icircn cazul prezentărilor orale sau a posterelor este indicat ca

1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării

2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte

3 Folosirea de simboluri este permisă

Clasificarea tabelelor

Tabelele se clasifică după

i) conţinut

bull cu distribuţii de frecvenţe

bull de clase de frecvenţe

bull de contingenţă

ii) structura

bull cu doua coloane

bull cu subclasificări

bull ldquomasterrdquo

Tabele ce conţin distribuţii de frecvenţe

O modalitate comodă de a prezenta o mulţime de date brute este

1 Se ordonează datele in ordine crescătoare

2 Se determine frecvenţa fiecărei valori

3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane

(Tabelul 5)

Tabelul 5 Distribuţii de frecvenţă absolută

48

Tabelul claselor de frecvenţe

1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă

2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)

Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)

Tabele de contingenţă

1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a

tabelelor de contingenţă

2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a

combinaţiilor de perechi ordonate de valori

3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre

a factor de risc si

b starea sănătăţii

4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)

5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)

Tabelul 7 Tabel de contingenţă 2 x 2

49

Grafice

Există două categorii de moduri grafice sub care se pot prezenta datele

1 Ilustraţii şi fotografii

2 Grafice

1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă

pentru lucrare

2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit

Putem vorbi despre mai multe tipuri de grafice

bull Grafice pentru reprezentarea datelor cantitative

1048707 Grafic cartezian (X Y)

1048707 Histograma

1048707 Poligonul de frecvenţe

1048707 Diagrama bdquoscatterrdquo

bull Grafice pentru reprezentarea datelor calitative

1048707 Grafic cu bare

1048707 Diagrama tip bdquoboxplotrdquo

1048707 Diagrama bdquopierdquo

1048707 Cartograma

Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi

dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)

Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)

Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie

Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)

Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)

50

Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir

de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele

două variabile studiate (Figura 6)

Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2

(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2

rămacircne aproximativ constantă)

Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea

comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea

comparativă a mai multor variabile

Figura 7 Grafic calitativ cu bare

51

Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo

Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două

posibilităţi reprezentate grafic este mai frecventă (Figura 8)

Figura 8 Reprezentare tip bdquopierdquo

Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli

sau a oricărui element comparativ Se foloseşte de epidemiologi

Rezultate

Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare

Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o

manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu

explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția

bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la

ilustraţii tabele grafice

Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi

nici rezultatele care invalidează eventual ipoteza

Discuţii

Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd

cultura ştiinţifică şi inteligenţa autorilor

Acest capitol răspunde la trei obiective

Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia

calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de

selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează

rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv

52

este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn

care a fost abordată problema fără a face o revistă a literaturii

Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea

rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul

Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor

afirmaţii nesusţinute de conţinutul lucrării

Concluzii

Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate

să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie

Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de

concluzii va scădea valoarea lucrării

Bibliografia (lista referinţelor citarea icircn text)

Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn

lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente

Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli

- să conţină cele mai importante şi recente lucrări

- să includă numai lucrări publicate

- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate

Bibliografie

Elisabeta Jaba ndash Statistică Ed Economică 1998

Mihai Ţarcă ndash Statistică volI Ed UAIC 1979

Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale

Ed University Press 2009

Sorana Daniela Bolboacă ndash Metodologia cercetării curs

53

Page 15: cercetarea medicala - metodologie

bull Pretestarea instrumentului

bull Aprecierea validităţii interne şi externe a datelor culese

Instrumente de cercetare

Formularea clară a temei de cercetare necesită o foarte bună definire a factorilor studiaţi şi a criteriilor de

judecată Acestea din urmă sunt ultimele care vor trebui definite icircn cadrul protocolului de studiu

Alegerea unui instrument de măsură

Nu există un instrument de măsură perfect sau universal corect Alegerea sa dintre cele existente şi cele deja

utilizate depind de trei factori

bull Obiectivul studiului

bull Boala studiată

bull Populaţia icircn studiu

De aceste trei elemente trebuie ţinut cont icircn fiecare etapă a dezvoltării instrumentului

Definirea obiectivului

Studiu transversal Dacă se doreşte studierea unui simptom sau a unei caracteristici ale populaţiei se poate

icircmpărţi populaţia de studiu icircn mai multe grupuri Este practic vorba de a determina diferenţele dintre subiecţi

icircn cea ce priveşte o variabilă necesară studiată printr-un studiu transversal (utilizarea dozării de Ac HBS

pentru a evalua progresele bolnavilor de hepatită tip B)

Studiu longitudinal Icircn acest caz nu se poate icircmpărţii populaţia de studiu icircn mai multe grupuri datele obţinute

fiind de la acelaşi subiect colectate după un interval de timp

Icircn funcţie de boală şi populaţie se aleg şi instrumentele de măsură cele mai adecvate

Instrumentele cercetării reprezintă un mecanism specific sau o strategie pe care cercetătorul o utilizează pentru

colectarea prelucrarea şi inferenţa datelor Aceste instrumente sunt

1 Studiul icircn bibliotecă

2 Computerul

3 Determinările experimentale

4 Statistica

5 Mintea umană

6 Facilităţi de limbaj şi comunicare

Determinările experimentale

Măsurarea constă icircn aprecierea şi cuantificarea fenomenelor calitativ sau cantitativ Interpretarea

datelor se referă la transformarea lor icircn unităţi de descoperire a unor fenomene mai puţin cercetate

Standardele acceptate se referă la norme medii distribuţii etc Tot icircn cadrul interpretării datelor datele

obţinute sunt caracterizate pe scale de valori nominal ordinal de interval sau de raport

Validarea şi reproductibilitatea măsurătorilor sunt aspecte importante şi foarte necesare pentru o

cercetare corect fundamentată care doreşte obţinerea unor concluzii pertinente

15

Statistica Este implicată icircn condensarea şi procesarea unui volum mai mare de date astfel icircncacirct să se poată

interpreta corect valorile obţinute şi să se permită comparările Utilizarea unor teste statistice specifice permite

determinarea semnificaţiei (diferenţei) statistice astfel icircncacirct estimatorii să poată fi aplicaţi la populaţia

generală Furnizează informaţii şi privind corelarea sau relaţionarea icircntre date

Mintea umană este cea care reuşeşte să integreze şi să icircnţeleagă rezultatele obţinute Semnificaţia ştiinţifică

este stabilită icircn funcţie de rezultatele statisticii de mintea umană conform afirmaţiei bdquosemnificaţia ştiinţifică

nu este egală cu semnificaţia statisticărdquo Metodele aplicate pentru a putea ajunge la o concluzie pertinentă sunt

logica deductivă raţionamentul inductiv şi gacircndirea critică

Limbaj şi comunicare Exprimarea orală sau icircn scris permite nuanţarea unor aspecte seci cifrice ale unor

studii Icircn acest mod devine mai evidentă semnificaţia ştiinţifică a unor rezultate statistice

34 Prelucrarea datelor

Instrumentele de prelucrare

Statistica este o ştiinţă ramură a matematicii care studiază evoluţia fenomenelor şi proceselor

colective pe baza observării lor ştiinţifice a culegerii şi prelucrării detaliate a informaţiilor statistice cu scopul

de a formula şi explica legile legităţile şi regularităţile ce le guvernează

Statistica permite deci aprecierea unor parametrii populaţionali prin studiul unui număr redus de

elemente ale populaţiei icircn studiu (ţintă) O populaţie poate fi definită printr-un şir de valori care pot fi grupate

icircn funcţie de parametrul studiat (glicemie colesterol TAD TAS etc) Pentru fiecare astfel de şir se defineşte

o variabilă (care va purta nume propriu glicemie colesterol etc) Practic variabila este considerată o funcţie

ia valori posibil diferite de la un element la altul icircn funcţie de caracteristicile proprii acestora Sunt clasificate

icircn două grupe variabile cantitative (caracteristică măsurabilă) şi calitative (caracteristică ce nu poate fi

măsurată)

La racircndul lor variabilele calitative pot fi

bull Nominale ndash grupuri de elemente ce nu pot fi ordonate (culoarea părului)

bull Nominale ordonate ndash concluziile pot fi grupate (eficienţa unui tratament slabă bună foarte bună)

bull Binare ndash apar numai două posibilităţi (bolnav sănătos)

Variabilele cantitative pot fi

bull Continue ndash o variabilă măsurabilă care poate lua o infinitate de valori

bull Discrete ndash variabile care nu pot lua decacirct valori icircntregi

Statistica descriptivă

Există două ramuri ale statisticii statistica descriptivă şi statistica inferenţială

Statistica descriptivă (după cum rezultă din denumire) se ocupă cu descrierea unor valori obţinute ale unei

variabile studiate

16

Valorile pe care variabila le ia se constituie icircntr-o serie statistică Indicatorii care definesc o variabilă (serie)

sunt

1 Ale tendinţei centrale

Media aritmetică - notată de regulă cu

Mediana - este acea valoare din şirul de date care icircmparte icircn două părţi egale şirul ordonat de valori (atenţie

şirul este ordonat crescător) situacircndu-se la mijlocul seriei statistice

Dacă numărul de valori n este un număr impar atunci mediana este valoarea unde

Dacă n este par deci avem un număr par de valori mediana este definitatilde ca fiind

unde k = n2

Modul - constituie valoarea care apare cel mai des deci valoarea cu numărul cel mai mare de apariţii

2 De dispersie

Amplitudinea - este diferenţa dintre valoarea maximă şi cea minimă

A = Amax - Amin

Amplitudinea relativă - notată A este raportul dintre amplitudinea absolută şi media aritmetică a seriei de

date

Varianţa notată este un indicator de icircmprăştiere a datelor Formula de calcul este

Abaterea standard (S) sau deviaţia standard reprezintă rădăcina pătrată din varianţă (dispersie)

Coeficientul de variaţie se calculează ca un raport procentual icircntre abaterea standard şi valoarea medie a şirului

de valori

Eroarea standard intervine icircn estimarea intervalelor de confidenţă Se calculează astfel

17

3 De asimetrie (skewness) indică distribuţia datelor dacă sunt sau nu distribuite normal

4 De boltire (kurtosis) estimează boltirea sau aplatizarea curbei de distribuţie

Prezentarea descriptivă a datelor se face prin icircnregistrarea datelor culese icircn tabele care să reprezinte icircn mod

sintetic valorile măsurate

Icircn concluzie statistica descriptivă permite

bull Stabilirea comparabilităţii icircntre grupurile de studiu şi aprecierea prezenţei erorilor sau confuziei

bull Reprezentarea datelor icircn tabele permite evaluarea fiecărui pacient şi dacă a existat pierderi din studiu

Statistica inferenţială

Statistica inferenţială (inductivă) este partea de analiză a datelor care permite extrapolarea unei

concluzii trase pe baza unui eşantion spre populaţia ţintă pentru care a fost efectuat studiul

Scopul analizei statistice este de a evidenţia efectul unui tratament sau al unui factor de risc prin date obţinute

din eşantionul studiat spre populaţia ţintă Aceasta implică testarea ipotezelor statistice sau altfel spus testarea

semnificaţiei statistice Este una dintre cele mai importante momente ale studiului Cum rezultatele sunt

obţinute prin studiul unui eşantion există posibilitatea ca acestea să fie datorate icircntacircmplării Testele

statistice ne ajută să apreciem icircn ce măsură rezultatele sunt icircntacircmplătoare şi mai ales icircn ce măsură şi dacă se

pot aplica populaţiei generale Icircn acest scop se impune o valoare limită alfa 005 care reprezintă limita

superioară a probabilităţii ca rezultatul obţinut să fie greşit (datorat icircntacircmplării) Astfel icircn funcţie de tipul

variabilelor şi indicatorii descriptivi aplicaţi şi evaluaţi se aplică teste de semnificaţie statistică (Tabelul 1)

Tabelul 1 Alegerea testelor de semnificaţie statistică

Tipul datelor

18

Diferenţierea variabilelor din punctul de vedere a distribuţiei se face folosind testul de normalitate

Kolmogorov ndash Smirnov

Testul statistic reprezintă metoda de comparaţie a două sau mai multe populaţii prin intermediul unor

variabile observate ale lor

Scopul unui test statistic este de a defini realitatea

Definirea icircntrebării de cercetare (ipoteza clinică)

Tratamentul cu Nebivolol este la fel de eficient ca şi cel cu Valsartan icircn tratamentul

hipertensiunii arteriale

Transpunerea icircntrebării de cercetare icircn termeni statistici (ipoteza statistică)

Media tensiunii arteriale a pacienţilor trataţi cu Valsartan nu diferă semnificativ de media

tensiunii arteriale a pacienţilor trataţi cu Nebivolol

Etapele unui test statistic

1 Formularea problemei icircn termenii ipotezelor statistice

2 Alegerea şi calcularea parametrului statistic al testului

3 Regiunea critică

4 Concluzia testului

1 Formularea problemei icircn termenii ipotezelor statistice

Ipoteza nulă ipoteza care trebuie testată testul efectuacircndu-se sub prezumţia că ipoteza nulă ar

fi adevărată

Ipoteza alternativă acea ipoteză care icircntr-un sens sau altul contrazice ipoteza nulă Această

ipoteză se mai numeşte şi ipoteza de lucru

Ipoteza nulă tipuri

O coadă (ldquoone-tailedrdquo sau ldquoone-siderdquo)

Media este mai mare

Media este mai mică

Două cozi (ldquoone-tailedrdquo sau ldquoone-siderdquo)

Media este egală

2 Alegerea şi calcularea parametrului statistic al testului

Parametrul statistic al testului exprimă icircntr-o anumită formă diferenţa dintre elementele comparate

Ţinacircnd seama de faptul că eşantionul sau eşantioanele utilizate sunt aleator extrase din populaţiile care

fac obiectul testului parametrul statistic este o variabilă aleatoare de selecţie care urmează o anumită

lege de probabilitate

Un parametru statistic al testului bun trebuie să icircndeplinească două condiţii

19

Trebuie să se comporte diferit atunci cacircnd ipoteza nulă H0 este adevărată faţă de situaţia icircn

care ipoteza alternativă H1 este adevărată

Distribuţia de probabilitate a parametrului statistic al testului sub prezumţia că H0 este

adevărată este cunoscută

3 Regiunea critică

- Trebuie să fim capabili să decidem icircn funcţie de valoarea parametrului statistic calculat care dintre

ipoteze cea nulă sau cea alternativă este adevărată

- Dacă valoarea parametrului statistic aparţine regiunii critice ipoteza nulă H0 va fi respinsă şi va fi

acceptată ipoteza alternativă H1

- Dacă valoarea parametrului statistic nu aparţine regiunii critice ipoteza nulă H0 va fi acceptată

- Decidem mărimea regiunii critice

Pentru aceasta trebuie să specificăm mărimea riscului de eroare pe care icircl acceptăm

Pe scurt definim nivelul de semnificaţie notat cu a sau mărimea riscului pe care

suntem dispuşi să ni-l asumăm icircn respingerea ipotezei nule H0 icircn cazul icircn care aceasta

este adevărată De obicei se alege un nivel de semnificaţie icircntre 1 şi 5

Probabilitatea unei erori de tipul I

probabilitatea de respingere a ipotezei nule H0 icircn favoarea ipotezei alternative H1 icircn

condiţiile icircn care H0 este adevărată

probabilitatea unei erori de tipul I se notează cu a şi se mai numeşte nivel de

semnificaţie al testului

Probabilitatea unei erori de tipul II

probabilitatea acceptării ipotezei nule icircn condiţiile icircn care ipoteza alternativă H1 este

adevărată

această probabilitate se notează cu b

- Unilaterală la dreapta ndash valoarea parametrului statistic al testului este mai mare sau egală cu

valoarea din dreapta a intervalului critic

- Unilaterală la stacircnga ndash valoarea parametrului statistic al testului este mai mică sau egală cu

valoarea din stacircnga a intervalului critic

- Bilaterală ndash valoarea parametrului statistic al testului este mai mică sau egală cu valoarea extremă

din stacircnga regiunii critice sau mai mare sau egală cu valoarea extremă din dreapta regiunii critice

valorile extreme ale regiunii critice avacircnd nivele egale de semnificaţie

4 Concluzia testului

- Ipoteza nulă H0 este respinsă dacă valoarea parametrului statistic aparţine regiunii critice

20

- Regiunea critică trebuie astfel aleasă icircncacirct dacă ipoteza alternativă H1 este adevărată

probabilitatea de respingere a ipotezei nule H0 este mai mare decacirct icircn cazul icircn care ipoteza nulă H0

ar fi adevărată

- Acceptarea ipotezei nule H0 atunci cacircnd ipoteza alternativă H1 este adevărată este cunoscută ca şi

eroarea de tipul II

a probabilitatea ei se notează cu b

b măsoară bdquonivelul de eroarerdquo

- Icircn testarea oricărei ipoteze statistice există patru situaţii care determină dacă decizia noastră este

corectă sau nu

Cazuri

H0 este adevărată H0 este falsă

Concluzie H0 se acceptă decizie corectă eroare de tipul

II

H0 se

respinge

eroare de tipul I decizie corectă

Luarea deciziei pe baza valorii probabilităţii p de semnificaţie a testului

Icircn momentul icircn care prelucrăm statistic o serie de date dorim să ştim dacă rezultatele obţinute sunt sau

nu semnificative statistic

Răspunsul la această icircntrebare este dat de valoarea lui p calculată de orice program statistic la

prelucrarea unor date

Icircn cazul testelor statistice ipoteza nulă este respinsă dacă nivelul de semnificaţie este mai mic decacirct

005 iar programele de prelucrare statistică a datelor vor afişa o steluţă () icircn tabelul rezultatelor

21

Dacă p le 005 respingem ipoteza nulă şi acceptăm ipoteza alternativă (am obţinut semnificaţia

statistică)

Dacă p gt 005 acceptăm ipoteza nulă (nu am obţinut semnificaţia statistică)

p = 013

NU respingem ipoteza nulă

Risc de eroare de tip II

α = 005

p = 002

Respingem ipoteza nulă

Risc de eroare de tip I

Semnificaţia lui p

Criteriu de luare a deciziei cu privire la o ipoteză statistică nulă

Cuantifică şansa ca o decizie de respingere a ipotezei nule să fie greşită

Măsură a semnificaţiei statistice şi NU CLINICĂ

22

Semnificaţia lui p (reguli empirice)

001 le p lt 005 rezultatul e semnificativ statistic

0001 le p lt 001 rezultatul e icircnalt semnificativ statistic

p lt 0001 rezultatul e foarte icircnalt semnificativ statistic

p ge 005 rezultatul e considerat nesemnificativ statistic

Limite ale valorii p

Valoarea p NU ne dă informaţii despre

Şansa de beneficiu a unui pacient individual

Procentul de pacienţi care vor avea un beneficiu icircn urma instituirii procedurii medicale

Gradul de beneficiu expectat pentru un anumit pacient

Puterea unui test statistic

Este capacitatea de a detecta o diferenţă acolo unde există

Creşterea volumului eşantionului determină creşterea puterii testului statistic aplicat

Valoarea este icircn relaţie directă cu eroarea de tip II

Puterea = 1 ndash β

Cea mai utilizată modalitate de creştere a puterii unui test statistic este de a creşte volumul

eşantionului

Tipul scalei de măsură ndash testul statistic

Denumire test Interval Nominal Observaţii

Corelaţie Pearson 2 0 Există o relaţie liniară

χ2 0 2

Student 1 1 Doar 2 grupuri

ANOVA 1 1 2 sau mai multe grupuri

Student perechi 1 1 Eşantioane perechi

Măsurători repetate (ANOVA) 1 1 Mai mult de 2 grupuri date

perechi

Inferenţa statistică pe date calitativ e

Tabela de contingenţă 2times2

Riscuri şi raţii

Testul χ2 (testarea asocierii icircn tabela de contingenţă)

Testul Fisher

23

Testul z pentru proporţii

Testul McNemar

Tabela de contingenţă 2times2

Scale de tip nominal (dicotomiale tabela de contingenţă de 2times2) sau ordinal (tabela de contingenţă de

rtimesc)

Frecvenţa absolută (numărul de evenimente per categorie)

Tabela de contingenţă de 2times2 4 categorii

AP = adevărat pozitiv

FP = fals pozitiv

FN = fals negativ

AN = adevărat negativ

Ulcer deschis Ulcer vindecat Total

Recurenţă + AP = 1 FP = 5 = 1+5 = 6

Recurenţă - FN = 7 AN = 16 = 7+16 = 23

Total =1+7=8 =5+16=21 29

Riscuri şi raţii Mărimi ale asocierii

Denumire Formula Definiţie

Rata falşilor pozitivi =FP(FP+AN) Probabilitatea unui test fals + (α)

Rata falşilor negativi =FN(FN+AP) Probabilitatea unui test fals ndash (β)

Sensibilitate =AP(AP+FN) Probabilitatea unui test real + (1- β)

Specificitate =AN(AN+FP) Probabilitatea unui test real ndash (1- α)

Acurateţe =(AP+AN)n Probabilitatea generală a unei decizii corecte

Valoarea predictivă pozitivă =AP(AP+FP) Probabilitatea ca un test pozitiv să fie corect

Valoarea predictivă negativă =AN(AN+FN) Probabilitatea ca un test negativ să fie corect

Riscul relativ =AP(FP+AN)FN(AP+FP)

Rata şansei =(AP∙AN)(FN∙FP)

Riscul atribuabil =AP(AP+FP)-FN(FN+AN)

24

Denumire Formula

Rata falşilor pozitivi = 5(5+1) = 08334

Rata falşilor negativi = 7(7+16) = 03043

Sensibilitate = 1(1+7) = 01250

Specificitate = 16(16+5) = 07619

Acurateţe = (1+16)29 = 05862

Valoarea predictivă pozitivă = 1(1+5) = 01667

Valoarea predictivă negativă = 16(16+7) = 06957

Riscul relativ = 1(5+16)7(1+5) = 2142 = 050

Rata şansei = (1∙16)(7∙5) = 04571

Riscul atribuabil = 1(1+5)-7(7+16) = 01667-03043=-01376

Testarea asocierii icircn tabela de contingenţă

Testul χ2

Nu trebuie utilizat pentru eşantioane de volum mic

Testul este valid doar dacă valoarea expectată (aşteptată) pentru fiecare celulă este cel puţin

egală cu 1 şi frecvenţa absolută observată este de minim 5

Dacă aceste condiţii nu sunt icircndeplinite se aplică testul exact al lui Fisher (Fisherrsquos Exact Test)

Indică dacă cele două variabile sunt sau nu independente DAR NU cuantifică puterea asocierii

dintre ele

Problema S-a investigat icircntr-un studiu asocierea dintre obezitatea (ca factor de risc) şi bolile

cardio-vasculare la persoanele icircn etate (gt 60 ani) Din totalul de 620 persoane investigate s-au

identificat 150 persoane cu obezitate şi boală cardio-vasculară 230 persoane fără obezitate şi

fără boală cardio-vasculară şi 60 persoane fără obezitate dar cu boală cardio-vasculară Există

o asociere icircntre obezitate şi boala cardio-vasculară (df=1 α=005 χ2critic = 384)

Testul χ2 exemplu

H025

Nu există asociere icircntre obezitate şi bolile cardio-vasculare

Obezitatea şi bolile cardio-vasculare sunt independente

H1

Există asociere icircntre obezitate şi bolile cardio-vasculare

Obezitatea şi bolile cardio-vasculare sunt asociate

a = 005 pragul de semnificaţie al testului

urmează o lege cu (r-1)(c-1) grade de libertate

χ2 = parametrul testului χ2

fio = frecvenţa observată

fit = frecvenţa teoretică

Regiunea critică este [χα2 yen)

Pentru α = 005 χα2 = 384

OBSERVAT BCV+ BCV- Total

Obezitate + AP = 150 FP = 180 330

Obezitate - FN = 60 AN = 230 290

Total 210 410 620

TEORETIC BCV+ BCV- Total

Obezitate + = 330times210620 = 330times410620 330

Obezitate - = 290times210620 = 290times410620 290

Total 210 410 620

TEORETIC BCV+ BCV- Total

Obezitate + = 330times210620 = 330times410620 330

26

Obezitate - = 290times210620 = 290times410620 290

Total 210 410 620

TEORETIC BCV+ BCV-

Obezitate + = 112 = 218

Obezitate - = 98 = 192

Deoarece 4177Icirc[384 yen) se respinge H0 cu un risc de eroare de 5

Există asociere icircntre obezitate şi bolile cardio-vasculare

Testul Fisher

Corecţie a testului χ2

Valoarea p asociată parametrului ne dă probabilitatea ca valoarea observată de independenţă să fie

atribuită doar şansei

O valoare p mică indică că există alte cauze decacirct şansa influenţează rezultatul şi astfel cele două

variabile investigate nu sunt independente

Testul Fisher = dispersia corectată a factorului x dispersia corectată a factorilor reziduali

Icircn acest context regula adunării dispersiilor se poate scrie unde

este variaţia lui y pe seama variaţiei variabilei x

este variaţia lui y pe seama influenţei factorilor reziduali (neicircnregistraţi)

este variaţia totală a caracteristicii y

Testul Fisher empiric se calculează după formula

27

se compară cu Ftab pentru nx şi nz grade de libertate la un anumit prag de semnificaţie stabilit

Dacă Fc gt Ftab rezultă că variaţia factorului de grupare x este semnificativă pentru variaţia caracteristicii y

Testul z pentru proporţii

1 Compararea unei frecvenţe observate cu o frecvenţă teoretică

2 Testarea egalităţii a două frecvenţe

Testul z Compararea unei frecvenţe observate cu o frecvenţă teoretică

Scop Investigarea semnificaţiei diferenţei icircntre o frecvenţă teoretică p (icircntr-o populaţie) şi o frecvenţă

observată f pe un eşantion reprezentativ (variabilă calitativă (binare))

Condiţii de aplicare Testul este corect aplicat dacă numărul n al observaţiilor eşantionului este

suficient de mare (n∙p n∙(1-p)gt10

Parametrul

n = volumul eşantionului

Suntem interesaţi de investigarea prevalenţei hepatitei B la personalul care lucrează icircn laboratoarele

clinicilor de boli infecţioase din Transilvania Se ştie din studii anterioare că prevalenţa hepatitei B icircn

populaţia generală din Transilvania este de 9 S-a luat icircn studiu un eşantion de 100 persoane şi s-a

obţinut o prevalenţă a hepatitei B de 6 Există diferenţă semnificativă icircntre frecvenţa hepatitei B la

personalul care lucrează icircn laboratoarele spitalelor de boli infecţioase din Transilvania faţă de

populaţia generală

f = 006 p = 009 n = 100

Ipoteza nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat

faţă de frecvenţa hepatitei B icircn populaţia generală

Ipoteza alternativă test bilateral Există diferenţă semnificativă icircntre frecvenţa hepatitei B la

nivelul eşantionului şi prevalenţa hepatitei B icircn populaţia generală

f = 006 p = 009 n = 100

Pragul de semnificaţie a = 005

Regiunea critică test bilateral (-yen -196 ]Egrave[196 yen)

28

Concluzia testului

Deoarece parametrul statistic calculat al testului nu aparţine regiunii critice se acceptă ipoteza

nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat faţă de

frecvenţa hepatitei B icircn populaţia generală

Testul McNemar

Evaluarea dependenţei variabilelor calitative perechi (dorim să determinăm dacă o anumită

caracteristică este sau nu asociată cu o anumită patologie)

Identificăm n pacienţi care prezintă patologia de interes (eg Cancer bronho-pulmonar) şi n

pacienţi cu aceleaşi caracteristici ca şi primul grup dar care nu o prezintă

Martor = da Martor = nu

Caz = da a b

Caz = nu c d

Testul McNemar - exemplu fumat vs cancer

Martor = da Martor = nu

Cancer = da a = 2 b = 5

Cancer = nu c = 0 d = 3

29

χ2critic(α=005) = 384

32 lt 384 rarr acceptăm ipoteza nulă

Fumatul nu este icircn relaţie cu apariţia cancerului bronho-pulmonar

Inferenţa statistică pe date cantitative

Variabile cantitative continue

Testul z şi Student (t) (o medie sau medii perechi)

Testul z şi Student (t) (testarea a două medii)

ANOVA (ge 3 medii)

Ranguri (variabile cantitative discrete sau cantitative care nu icircndeplinesc condiţia de

normalitate)

Testul sumei rangurilor Wilcoxon

Kruskal-Wallis (ge 3 eşantioane independente)

Friedman (ge 3 eşantioane dependente)

Teste de normalitate variabile cantitative continue

Shapiro-Wilk

Kolmogorov-Smirnov

Shapiro-Wilk

Chi-Square Goodness-of-Fit

Dacă datele urmează o distribuţie normală aplicăm un test parametric

Dacă datele nu urmează o distribuţie normală aplicăm un test de comparare al rangurilor

30

Testul Z de comparare a mediei unui eşantion cu media unei populaţii

Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ

extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie

s2 care se cunoaşte

Condiţii de aplicare

1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru

compararea mediei unui eşantion cu media unei populaţii)

2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal

distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă

3 Talia eşantionului este mare ( ge 30)

Ipoteze

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media

eşantionului şi media populaţiei

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

(-yen -196 ] Egrave [196 yen)

Parametrul testului

n = volumul eşantionului

= media eşantionului

s = deviaţia standard a populaţiei

Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)

Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard

cunoscută

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi

media standard

Condiţii de aplicare

Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se

realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această

condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea

31

Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai

puternic

Numărul de grade de libertate (df) df = n-1

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

Parametrul testului

n = volumul eşantionului

micro0 = media standard

= media eşantionului

s = deviaţia standard a eşantionului

Testul ANOVA compararea mediilor a mai multe eşantioane

H0 = toate mediile sunt egale

H1 = nu toate mediile sunt egale

Condiţii de aplicare

1 Datele sunt independente unele faţă de celelalte

2 Datele fiecărui grup sunt normal distribuite

3 Deviaţia standard este aceeaşi pentru toate grupurile

Id Medicament

A B C D E F

1 5 6 7 10 5 9

2 6 8 8 11 8 8

3 7 7 9 13 6 7

4 8 9 11 12 4 5

32

5 9 10 10 9 7 6

Suma 35 40 45 55 30 35

Media 7 8 9 11 6 7

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =

= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)

Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2

F = (suma pătratelor(icircntre))(suma pătratelor(icircn))

Suma pătratelor (icircntre) = 16times5 = 80

Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60

Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn

interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare

SP df Media pătratelor F = MPicircntreMPicircn

Icircntre 80 5 = 805 = 16 = 1625 = 64

Icircn 60 24 = 6024 = 25

Total 140 29 -

Testul sumei rangurilor Wilcoxon

Aplicat pentru

Un set de observaţii provenite dintr-o valoare ipotetică comună

Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)

Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero

Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace

Suma rangurilor pentru diferenţele negative = 2+3+1 = 6

Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30

33

Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului

egal cu 8 = 0109

Icircnainte După Diferenţa Rang

64 66 -2 2

66 58 8 5

67 68 -1 3

71 65 6 4

72 75 -3 1

76 67 9 6

78 59 19 8

89 74 15 7

Testul Kruskal-Wallis (ge 3 eşantioane independente)

Test de ranguri aplicate pe mai mult de 3 eşantioane

H = parametrul testului

n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)

Tk = suma rangurilor

Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie

pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni

34

df = k-1 (k = numărul de eşantioane)

df = 3-1 = 2

Hcritic(α=005) = 599

H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie

pozitivă şi respectiv biopsie negativă

Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie

a tipului de studiu pe eşantioane perechi)

1 Definirea numărului de tratamente k

2 Obţinerea rangurilor pentru fiecare tratament

3 Sumarea rangurilor fiecărui tratament

4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)

5 Dacă Fr gt Frcritic rarr respingem H0

Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost

măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi

n = 9 k = 3 T12 = 225 T2

2 = 38025 T32 = 38025

Frcritic = 599

Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de

prostată

35

De reţinut

Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei

Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-

of-Fit

Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z

Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t

Compararea mediilor a 3 sau mai multe eşantioane ANOVA

Compararea mediilor a două populaţii (σ) testul Z

Compararea mediilor a două eşantioane (s) testul t

Compararea mediilor a două eşantioane perechi (s) testul t

ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi

cu cel pentru compararea a două eşantioane perechi

Ranguri

Distribuţia datelor nu are importanţă

Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)

Trei sau mai multe eşantioane Kruskal-Wallis

Trei sau mai multe eşantioane perechi Friedman

Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia

Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a

datelor)

Variabile nominale

Un singur eşantion sau eşantioane perechi

Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte

Eşantioane perechi testul Mc Nemar

Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2

Icircn analiza proporţiilor există teste diferite pentru

Compararea unei frecvenţe cu o frecvenţă cunoscută

Compararea a două frecvenţe

Semnificaţia statistică

Valoarea p (p value)

Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor

două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E

posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării

aleatorii

36

Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală

urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii

Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este

probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un

experiment de dimensiunea acestuia

Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că

diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii

diferite

Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca

fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă

ar fi fost adevărată

Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă

1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe

baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De

fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001

2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie

3 Se aplică testul statistic aferent pentru a calcula valoarea p

4 Se compară valoarea p cu valoarea ndash prag

5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe

semnificativă dpdv statisticrdquo

6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e

semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să

conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă

Teste de semnificaţie

Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului

populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)

Testarea ipotezelor implică posibile erori

Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile

sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui

grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul

icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005

ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există

37

nici o diferenţă

Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ

statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de

ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost

ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau

dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă

cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă

semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe

ipotetice variate icircn cazul icircn care ele există

Măsuri ale frecvenţei

Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)

Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate

Generic formula pe care se bazează toate cele trei este

unde x şi y sunt cantităţile de comparat

Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea

unei frecvenţe pe grupe de sex vacircrstă etc

Proporţia implică icircn mod necesar ca x să fie inclus icircn y

Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară

frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp

Pentru calcularea unei rate trebuie ţinut cont de trei aspecte

bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin

bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp

bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo

Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un

tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei

populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei

aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)

38

Indicatori

Rata de incidenţă

Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă

icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii

Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o

perioadă de timp

Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de

timp x

Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei

susceptibili de a dezvolta icircmbolnăvirea studiată

Numitorul poate fi

bull Numărul mediu al populaţiei icircn perioada de timp studiată

bull Mărimea populaţiei icircn mijlocul perioadei de studiu

bull Mărimea populaţiei la icircnceputul studiului

Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă

Este obligatorie menţionarea perioadei de timp

Prevalenţa

Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la

un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă

schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa

momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)

39

Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include

numai cazuri noi respectiv include cazuri noi şi vechi

Rata de atac

Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este

folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp

raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori

Rata persoană-timp

Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din

momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte

migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost

observate

Riscul relativ (RR)

Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment

legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele

prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două

grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la

bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la

bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai

mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo

Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2

Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn

cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă

(Tabelul 1)

Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR

Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la

neexpuşi

40

Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de

culegere a datelor

Odds ratio (OR)

Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin

raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general

studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)

Tabelul 2 Tabelul 2 x 2 pentru calcularea OR

Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală

Rate de mortalitate

Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp

specificată Există mai multe tipuri de rate de mortalitate

o Mortalitate specifică pe sex

o Mortalitate specifică pe rasă

o Mortalitate specifică pe boală

o Mortalitate neonatală

o Mortalitate postneonatală

o Mortalitate infantilă

o Mortalitate maternă

Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP

41

Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de

viaţă şi vacircrsta la care survine decesul dacă este prematur

Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu

Ani de viaţă pierduţi datorat dizabilităţii

Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt

utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru

cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite

grupuri

Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de

risc şi o boală se folosesc riscul relativ şi odds ratio

35 Analiza şi interpretarea datelor

După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date

trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul

Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor

colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului

studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu

plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde

prezenţa biostatisticianului este necesară

Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu

elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat

iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului

iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate

depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori

testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere

clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza

Interpretarea rezultatelor statistice

Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne

motive (număr mic de date) acceptarea ei să fie falsă

Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine

gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia

ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument

de decizie Intervalul de confidenţă

42

Interpretarea statistica ne interpretarea clinică

Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă

Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice

obţinute pe eşantionul studiat

Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare

Ce interpretăm Rezultatele

personale obţinute icircn urma studiului

care au fost prezentate icircn secţiunea bdquoRezultaterdquo

Explicăm rezultatele obţinute

Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale

Interpretarea trebuie să se realizeze icircn

lumina limitelor studiului

contextul cultural social şi educaţional al locului unde s-a realizat cercetarea

contextul a ceea ce se cunoaşte din literatura de specialitate

Interpretăm doar rezultatele personale obţinute icircn urma studiului

Interpretarea statistică nu este tot una cu interpretarea clinică

Interpretarea statistică este importantă

Interpretarea clinică este foarte importantă

Intervalul de confidenţă

Media calculată pe baza unui eşantion nu va echivala media populaţiei

Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului

Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a

populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a

populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)

pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru

orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare

dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de

confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de

date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de

5

Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel

Dacă valoarea p este mică

Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare

aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o

medie diferită Diferenţa este semnificativă dpdv statistic

43

Icircn continuare

Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa

reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică

pentru a fi interesante din punct de vedere ştiinţific

Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC

oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care

este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a

obţine o concluzie clară

Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o

diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că

datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din

punct de vedere ştiinţific

Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul

detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat

Erorile studiilor medicale

Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura

anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară

caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea

asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri

legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias

Erorile potenţiale icircn studiile epidemiologice

1 Erori icircntacircmplătoare

2 Erori sistematice

3 Confuzia

4 Validitatea

1 Erori icircntacircmplătoare

Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a

parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel

de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot

fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii

(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor

de măsură (eroarea de măsurare)

44

2 Erori sistematice

Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate

care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu

acurateţe mare Acurateţea nu este afectată de mărimea eşantionului

Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de

experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea

dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus

şi greu de cuantificat (consum de alcool personalitate etc)

Principalele tipuri de erori din această categorie sunt

bull Biasul de selecţie

bull Biasul de informaţie

Biasul de selecţie

Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul

trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion

inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale

persoanelor incluse

Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se

ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia

Biasul de informaţie

Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de

instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze

expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere

nesemnificativă sau chiar să nu şi-o amintească de loc

3 Confuzia

Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune

prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este

cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă

de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte

important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor

protector

4 Validitatea

Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă

Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte

estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional

Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă

45

conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se

demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)

Validitatea externă se poate realiza numai dacă studiul este valid intern

Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii

studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de

studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt

laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi

validă din punct de vedere intern)

3 6 Prezentarea rezultatelor

După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite

Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor

icircntr-o formă bdquodigerabilărdquo este necesară

Scopul prezentării datelor

1 Transmiterea concluziilor studiului

a Datele corecte şi importante merită comunicate

b Datele trebuie să confirme sau să infirme ipoteza studiului

c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală

2 Acordarea posibilităţii altor cercetători să aprecieze studiul

a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti

b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor

prezentate

Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru

fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie

statistică

Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de

valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras

(Tabel 3)

Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)

46

Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct

numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor

precum şi prezentarea acestora sub formă inteligibilă

Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care

convin cercetătorului

Prezentarea datelor se poate face

1 Figuri şi tabele icircn articole scrise

2 Figuri şi tabele icircn prezentări orale

3 Figuri şi tabele icircn postere

4 Text scris sau incluse icircn text

5 Site-uri de WEB

Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor

Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie

Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele

exprimacircnd exact ceea ce acestea exprimă

Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate

anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel

să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se

acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca

mai sus sugestive sunt formatele simple şi puţin icircncărcate

Dacă nu există reguli impuse se respectă

1 Mesaj simplu fără falsificarea datelor

2 De obicei este necesar atacirct tabelul cacirct şi graficul

3 Să fie simplu şi clar

Tabele

Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile

coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică

elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de

1 Se folosesc doar linii orizontale

2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn

evidenţi prin linie de separare (Tabelul 4)

Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland

Noua Zeelandă)

(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)

47

3 Numerele sunt aliniate icircn funcţie de virgulă

4 Indicii statistici sunt explicaţi sub tabel

5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană

6 Abrevierile pot fi folosite

7 Numărul de zecimale trebuie limitat la maxim două

8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel

9 Plasarea legendei este obligatorie sub tabel

10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)

Icircn cazul prezentărilor orale sau a posterelor este indicat ca

1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării

2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte

3 Folosirea de simboluri este permisă

Clasificarea tabelelor

Tabelele se clasifică după

i) conţinut

bull cu distribuţii de frecvenţe

bull de clase de frecvenţe

bull de contingenţă

ii) structura

bull cu doua coloane

bull cu subclasificări

bull ldquomasterrdquo

Tabele ce conţin distribuţii de frecvenţe

O modalitate comodă de a prezenta o mulţime de date brute este

1 Se ordonează datele in ordine crescătoare

2 Se determine frecvenţa fiecărei valori

3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane

(Tabelul 5)

Tabelul 5 Distribuţii de frecvenţă absolută

48

Tabelul claselor de frecvenţe

1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă

2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)

Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)

Tabele de contingenţă

1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a

tabelelor de contingenţă

2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a

combinaţiilor de perechi ordonate de valori

3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre

a factor de risc si

b starea sănătăţii

4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)

5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)

Tabelul 7 Tabel de contingenţă 2 x 2

49

Grafice

Există două categorii de moduri grafice sub care se pot prezenta datele

1 Ilustraţii şi fotografii

2 Grafice

1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă

pentru lucrare

2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit

Putem vorbi despre mai multe tipuri de grafice

bull Grafice pentru reprezentarea datelor cantitative

1048707 Grafic cartezian (X Y)

1048707 Histograma

1048707 Poligonul de frecvenţe

1048707 Diagrama bdquoscatterrdquo

bull Grafice pentru reprezentarea datelor calitative

1048707 Grafic cu bare

1048707 Diagrama tip bdquoboxplotrdquo

1048707 Diagrama bdquopierdquo

1048707 Cartograma

Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi

dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)

Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)

Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie

Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)

Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)

50

Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir

de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele

două variabile studiate (Figura 6)

Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2

(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2

rămacircne aproximativ constantă)

Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea

comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea

comparativă a mai multor variabile

Figura 7 Grafic calitativ cu bare

51

Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo

Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două

posibilităţi reprezentate grafic este mai frecventă (Figura 8)

Figura 8 Reprezentare tip bdquopierdquo

Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli

sau a oricărui element comparativ Se foloseşte de epidemiologi

Rezultate

Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare

Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o

manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu

explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția

bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la

ilustraţii tabele grafice

Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi

nici rezultatele care invalidează eventual ipoteza

Discuţii

Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd

cultura ştiinţifică şi inteligenţa autorilor

Acest capitol răspunde la trei obiective

Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia

calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de

selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează

rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv

52

este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn

care a fost abordată problema fără a face o revistă a literaturii

Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea

rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul

Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor

afirmaţii nesusţinute de conţinutul lucrării

Concluzii

Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate

să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie

Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de

concluzii va scădea valoarea lucrării

Bibliografia (lista referinţelor citarea icircn text)

Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn

lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente

Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli

- să conţină cele mai importante şi recente lucrări

- să includă numai lucrări publicate

- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate

Bibliografie

Elisabeta Jaba ndash Statistică Ed Economică 1998

Mihai Ţarcă ndash Statistică volI Ed UAIC 1979

Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale

Ed University Press 2009

Sorana Daniela Bolboacă ndash Metodologia cercetării curs

53

Page 16: cercetarea medicala - metodologie

Statistica Este implicată icircn condensarea şi procesarea unui volum mai mare de date astfel icircncacirct să se poată

interpreta corect valorile obţinute şi să se permită comparările Utilizarea unor teste statistice specifice permite

determinarea semnificaţiei (diferenţei) statistice astfel icircncacirct estimatorii să poată fi aplicaţi la populaţia

generală Furnizează informaţii şi privind corelarea sau relaţionarea icircntre date

Mintea umană este cea care reuşeşte să integreze şi să icircnţeleagă rezultatele obţinute Semnificaţia ştiinţifică

este stabilită icircn funcţie de rezultatele statisticii de mintea umană conform afirmaţiei bdquosemnificaţia ştiinţifică

nu este egală cu semnificaţia statisticărdquo Metodele aplicate pentru a putea ajunge la o concluzie pertinentă sunt

logica deductivă raţionamentul inductiv şi gacircndirea critică

Limbaj şi comunicare Exprimarea orală sau icircn scris permite nuanţarea unor aspecte seci cifrice ale unor

studii Icircn acest mod devine mai evidentă semnificaţia ştiinţifică a unor rezultate statistice

34 Prelucrarea datelor

Instrumentele de prelucrare

Statistica este o ştiinţă ramură a matematicii care studiază evoluţia fenomenelor şi proceselor

colective pe baza observării lor ştiinţifice a culegerii şi prelucrării detaliate a informaţiilor statistice cu scopul

de a formula şi explica legile legităţile şi regularităţile ce le guvernează

Statistica permite deci aprecierea unor parametrii populaţionali prin studiul unui număr redus de

elemente ale populaţiei icircn studiu (ţintă) O populaţie poate fi definită printr-un şir de valori care pot fi grupate

icircn funcţie de parametrul studiat (glicemie colesterol TAD TAS etc) Pentru fiecare astfel de şir se defineşte

o variabilă (care va purta nume propriu glicemie colesterol etc) Practic variabila este considerată o funcţie

ia valori posibil diferite de la un element la altul icircn funcţie de caracteristicile proprii acestora Sunt clasificate

icircn două grupe variabile cantitative (caracteristică măsurabilă) şi calitative (caracteristică ce nu poate fi

măsurată)

La racircndul lor variabilele calitative pot fi

bull Nominale ndash grupuri de elemente ce nu pot fi ordonate (culoarea părului)

bull Nominale ordonate ndash concluziile pot fi grupate (eficienţa unui tratament slabă bună foarte bună)

bull Binare ndash apar numai două posibilităţi (bolnav sănătos)

Variabilele cantitative pot fi

bull Continue ndash o variabilă măsurabilă care poate lua o infinitate de valori

bull Discrete ndash variabile care nu pot lua decacirct valori icircntregi

Statistica descriptivă

Există două ramuri ale statisticii statistica descriptivă şi statistica inferenţială

Statistica descriptivă (după cum rezultă din denumire) se ocupă cu descrierea unor valori obţinute ale unei

variabile studiate

16

Valorile pe care variabila le ia se constituie icircntr-o serie statistică Indicatorii care definesc o variabilă (serie)

sunt

1 Ale tendinţei centrale

Media aritmetică - notată de regulă cu

Mediana - este acea valoare din şirul de date care icircmparte icircn două părţi egale şirul ordonat de valori (atenţie

şirul este ordonat crescător) situacircndu-se la mijlocul seriei statistice

Dacă numărul de valori n este un număr impar atunci mediana este valoarea unde

Dacă n este par deci avem un număr par de valori mediana este definitatilde ca fiind

unde k = n2

Modul - constituie valoarea care apare cel mai des deci valoarea cu numărul cel mai mare de apariţii

2 De dispersie

Amplitudinea - este diferenţa dintre valoarea maximă şi cea minimă

A = Amax - Amin

Amplitudinea relativă - notată A este raportul dintre amplitudinea absolută şi media aritmetică a seriei de

date

Varianţa notată este un indicator de icircmprăştiere a datelor Formula de calcul este

Abaterea standard (S) sau deviaţia standard reprezintă rădăcina pătrată din varianţă (dispersie)

Coeficientul de variaţie se calculează ca un raport procentual icircntre abaterea standard şi valoarea medie a şirului

de valori

Eroarea standard intervine icircn estimarea intervalelor de confidenţă Se calculează astfel

17

3 De asimetrie (skewness) indică distribuţia datelor dacă sunt sau nu distribuite normal

4 De boltire (kurtosis) estimează boltirea sau aplatizarea curbei de distribuţie

Prezentarea descriptivă a datelor se face prin icircnregistrarea datelor culese icircn tabele care să reprezinte icircn mod

sintetic valorile măsurate

Icircn concluzie statistica descriptivă permite

bull Stabilirea comparabilităţii icircntre grupurile de studiu şi aprecierea prezenţei erorilor sau confuziei

bull Reprezentarea datelor icircn tabele permite evaluarea fiecărui pacient şi dacă a existat pierderi din studiu

Statistica inferenţială

Statistica inferenţială (inductivă) este partea de analiză a datelor care permite extrapolarea unei

concluzii trase pe baza unui eşantion spre populaţia ţintă pentru care a fost efectuat studiul

Scopul analizei statistice este de a evidenţia efectul unui tratament sau al unui factor de risc prin date obţinute

din eşantionul studiat spre populaţia ţintă Aceasta implică testarea ipotezelor statistice sau altfel spus testarea

semnificaţiei statistice Este una dintre cele mai importante momente ale studiului Cum rezultatele sunt

obţinute prin studiul unui eşantion există posibilitatea ca acestea să fie datorate icircntacircmplării Testele

statistice ne ajută să apreciem icircn ce măsură rezultatele sunt icircntacircmplătoare şi mai ales icircn ce măsură şi dacă se

pot aplica populaţiei generale Icircn acest scop se impune o valoare limită alfa 005 care reprezintă limita

superioară a probabilităţii ca rezultatul obţinut să fie greşit (datorat icircntacircmplării) Astfel icircn funcţie de tipul

variabilelor şi indicatorii descriptivi aplicaţi şi evaluaţi se aplică teste de semnificaţie statistică (Tabelul 1)

Tabelul 1 Alegerea testelor de semnificaţie statistică

Tipul datelor

18

Diferenţierea variabilelor din punctul de vedere a distribuţiei se face folosind testul de normalitate

Kolmogorov ndash Smirnov

Testul statistic reprezintă metoda de comparaţie a două sau mai multe populaţii prin intermediul unor

variabile observate ale lor

Scopul unui test statistic este de a defini realitatea

Definirea icircntrebării de cercetare (ipoteza clinică)

Tratamentul cu Nebivolol este la fel de eficient ca şi cel cu Valsartan icircn tratamentul

hipertensiunii arteriale

Transpunerea icircntrebării de cercetare icircn termeni statistici (ipoteza statistică)

Media tensiunii arteriale a pacienţilor trataţi cu Valsartan nu diferă semnificativ de media

tensiunii arteriale a pacienţilor trataţi cu Nebivolol

Etapele unui test statistic

1 Formularea problemei icircn termenii ipotezelor statistice

2 Alegerea şi calcularea parametrului statistic al testului

3 Regiunea critică

4 Concluzia testului

1 Formularea problemei icircn termenii ipotezelor statistice

Ipoteza nulă ipoteza care trebuie testată testul efectuacircndu-se sub prezumţia că ipoteza nulă ar

fi adevărată

Ipoteza alternativă acea ipoteză care icircntr-un sens sau altul contrazice ipoteza nulă Această

ipoteză se mai numeşte şi ipoteza de lucru

Ipoteza nulă tipuri

O coadă (ldquoone-tailedrdquo sau ldquoone-siderdquo)

Media este mai mare

Media este mai mică

Două cozi (ldquoone-tailedrdquo sau ldquoone-siderdquo)

Media este egală

2 Alegerea şi calcularea parametrului statistic al testului

Parametrul statistic al testului exprimă icircntr-o anumită formă diferenţa dintre elementele comparate

Ţinacircnd seama de faptul că eşantionul sau eşantioanele utilizate sunt aleator extrase din populaţiile care

fac obiectul testului parametrul statistic este o variabilă aleatoare de selecţie care urmează o anumită

lege de probabilitate

Un parametru statistic al testului bun trebuie să icircndeplinească două condiţii

19

Trebuie să se comporte diferit atunci cacircnd ipoteza nulă H0 este adevărată faţă de situaţia icircn

care ipoteza alternativă H1 este adevărată

Distribuţia de probabilitate a parametrului statistic al testului sub prezumţia că H0 este

adevărată este cunoscută

3 Regiunea critică

- Trebuie să fim capabili să decidem icircn funcţie de valoarea parametrului statistic calculat care dintre

ipoteze cea nulă sau cea alternativă este adevărată

- Dacă valoarea parametrului statistic aparţine regiunii critice ipoteza nulă H0 va fi respinsă şi va fi

acceptată ipoteza alternativă H1

- Dacă valoarea parametrului statistic nu aparţine regiunii critice ipoteza nulă H0 va fi acceptată

- Decidem mărimea regiunii critice

Pentru aceasta trebuie să specificăm mărimea riscului de eroare pe care icircl acceptăm

Pe scurt definim nivelul de semnificaţie notat cu a sau mărimea riscului pe care

suntem dispuşi să ni-l asumăm icircn respingerea ipotezei nule H0 icircn cazul icircn care aceasta

este adevărată De obicei se alege un nivel de semnificaţie icircntre 1 şi 5

Probabilitatea unei erori de tipul I

probabilitatea de respingere a ipotezei nule H0 icircn favoarea ipotezei alternative H1 icircn

condiţiile icircn care H0 este adevărată

probabilitatea unei erori de tipul I se notează cu a şi se mai numeşte nivel de

semnificaţie al testului

Probabilitatea unei erori de tipul II

probabilitatea acceptării ipotezei nule icircn condiţiile icircn care ipoteza alternativă H1 este

adevărată

această probabilitate se notează cu b

- Unilaterală la dreapta ndash valoarea parametrului statistic al testului este mai mare sau egală cu

valoarea din dreapta a intervalului critic

- Unilaterală la stacircnga ndash valoarea parametrului statistic al testului este mai mică sau egală cu

valoarea din stacircnga a intervalului critic

- Bilaterală ndash valoarea parametrului statistic al testului este mai mică sau egală cu valoarea extremă

din stacircnga regiunii critice sau mai mare sau egală cu valoarea extremă din dreapta regiunii critice

valorile extreme ale regiunii critice avacircnd nivele egale de semnificaţie

4 Concluzia testului

- Ipoteza nulă H0 este respinsă dacă valoarea parametrului statistic aparţine regiunii critice

20

- Regiunea critică trebuie astfel aleasă icircncacirct dacă ipoteza alternativă H1 este adevărată

probabilitatea de respingere a ipotezei nule H0 este mai mare decacirct icircn cazul icircn care ipoteza nulă H0

ar fi adevărată

- Acceptarea ipotezei nule H0 atunci cacircnd ipoteza alternativă H1 este adevărată este cunoscută ca şi

eroarea de tipul II

a probabilitatea ei se notează cu b

b măsoară bdquonivelul de eroarerdquo

- Icircn testarea oricărei ipoteze statistice există patru situaţii care determină dacă decizia noastră este

corectă sau nu

Cazuri

H0 este adevărată H0 este falsă

Concluzie H0 se acceptă decizie corectă eroare de tipul

II

H0 se

respinge

eroare de tipul I decizie corectă

Luarea deciziei pe baza valorii probabilităţii p de semnificaţie a testului

Icircn momentul icircn care prelucrăm statistic o serie de date dorim să ştim dacă rezultatele obţinute sunt sau

nu semnificative statistic

Răspunsul la această icircntrebare este dat de valoarea lui p calculată de orice program statistic la

prelucrarea unor date

Icircn cazul testelor statistice ipoteza nulă este respinsă dacă nivelul de semnificaţie este mai mic decacirct

005 iar programele de prelucrare statistică a datelor vor afişa o steluţă () icircn tabelul rezultatelor

21

Dacă p le 005 respingem ipoteza nulă şi acceptăm ipoteza alternativă (am obţinut semnificaţia

statistică)

Dacă p gt 005 acceptăm ipoteza nulă (nu am obţinut semnificaţia statistică)

p = 013

NU respingem ipoteza nulă

Risc de eroare de tip II

α = 005

p = 002

Respingem ipoteza nulă

Risc de eroare de tip I

Semnificaţia lui p

Criteriu de luare a deciziei cu privire la o ipoteză statistică nulă

Cuantifică şansa ca o decizie de respingere a ipotezei nule să fie greşită

Măsură a semnificaţiei statistice şi NU CLINICĂ

22

Semnificaţia lui p (reguli empirice)

001 le p lt 005 rezultatul e semnificativ statistic

0001 le p lt 001 rezultatul e icircnalt semnificativ statistic

p lt 0001 rezultatul e foarte icircnalt semnificativ statistic

p ge 005 rezultatul e considerat nesemnificativ statistic

Limite ale valorii p

Valoarea p NU ne dă informaţii despre

Şansa de beneficiu a unui pacient individual

Procentul de pacienţi care vor avea un beneficiu icircn urma instituirii procedurii medicale

Gradul de beneficiu expectat pentru un anumit pacient

Puterea unui test statistic

Este capacitatea de a detecta o diferenţă acolo unde există

Creşterea volumului eşantionului determină creşterea puterii testului statistic aplicat

Valoarea este icircn relaţie directă cu eroarea de tip II

Puterea = 1 ndash β

Cea mai utilizată modalitate de creştere a puterii unui test statistic este de a creşte volumul

eşantionului

Tipul scalei de măsură ndash testul statistic

Denumire test Interval Nominal Observaţii

Corelaţie Pearson 2 0 Există o relaţie liniară

χ2 0 2

Student 1 1 Doar 2 grupuri

ANOVA 1 1 2 sau mai multe grupuri

Student perechi 1 1 Eşantioane perechi

Măsurători repetate (ANOVA) 1 1 Mai mult de 2 grupuri date

perechi

Inferenţa statistică pe date calitativ e

Tabela de contingenţă 2times2

Riscuri şi raţii

Testul χ2 (testarea asocierii icircn tabela de contingenţă)

Testul Fisher

23

Testul z pentru proporţii

Testul McNemar

Tabela de contingenţă 2times2

Scale de tip nominal (dicotomiale tabela de contingenţă de 2times2) sau ordinal (tabela de contingenţă de

rtimesc)

Frecvenţa absolută (numărul de evenimente per categorie)

Tabela de contingenţă de 2times2 4 categorii

AP = adevărat pozitiv

FP = fals pozitiv

FN = fals negativ

AN = adevărat negativ

Ulcer deschis Ulcer vindecat Total

Recurenţă + AP = 1 FP = 5 = 1+5 = 6

Recurenţă - FN = 7 AN = 16 = 7+16 = 23

Total =1+7=8 =5+16=21 29

Riscuri şi raţii Mărimi ale asocierii

Denumire Formula Definiţie

Rata falşilor pozitivi =FP(FP+AN) Probabilitatea unui test fals + (α)

Rata falşilor negativi =FN(FN+AP) Probabilitatea unui test fals ndash (β)

Sensibilitate =AP(AP+FN) Probabilitatea unui test real + (1- β)

Specificitate =AN(AN+FP) Probabilitatea unui test real ndash (1- α)

Acurateţe =(AP+AN)n Probabilitatea generală a unei decizii corecte

Valoarea predictivă pozitivă =AP(AP+FP) Probabilitatea ca un test pozitiv să fie corect

Valoarea predictivă negativă =AN(AN+FN) Probabilitatea ca un test negativ să fie corect

Riscul relativ =AP(FP+AN)FN(AP+FP)

Rata şansei =(AP∙AN)(FN∙FP)

Riscul atribuabil =AP(AP+FP)-FN(FN+AN)

24

Denumire Formula

Rata falşilor pozitivi = 5(5+1) = 08334

Rata falşilor negativi = 7(7+16) = 03043

Sensibilitate = 1(1+7) = 01250

Specificitate = 16(16+5) = 07619

Acurateţe = (1+16)29 = 05862

Valoarea predictivă pozitivă = 1(1+5) = 01667

Valoarea predictivă negativă = 16(16+7) = 06957

Riscul relativ = 1(5+16)7(1+5) = 2142 = 050

Rata şansei = (1∙16)(7∙5) = 04571

Riscul atribuabil = 1(1+5)-7(7+16) = 01667-03043=-01376

Testarea asocierii icircn tabela de contingenţă

Testul χ2

Nu trebuie utilizat pentru eşantioane de volum mic

Testul este valid doar dacă valoarea expectată (aşteptată) pentru fiecare celulă este cel puţin

egală cu 1 şi frecvenţa absolută observată este de minim 5

Dacă aceste condiţii nu sunt icircndeplinite se aplică testul exact al lui Fisher (Fisherrsquos Exact Test)

Indică dacă cele două variabile sunt sau nu independente DAR NU cuantifică puterea asocierii

dintre ele

Problema S-a investigat icircntr-un studiu asocierea dintre obezitatea (ca factor de risc) şi bolile

cardio-vasculare la persoanele icircn etate (gt 60 ani) Din totalul de 620 persoane investigate s-au

identificat 150 persoane cu obezitate şi boală cardio-vasculară 230 persoane fără obezitate şi

fără boală cardio-vasculară şi 60 persoane fără obezitate dar cu boală cardio-vasculară Există

o asociere icircntre obezitate şi boala cardio-vasculară (df=1 α=005 χ2critic = 384)

Testul χ2 exemplu

H025

Nu există asociere icircntre obezitate şi bolile cardio-vasculare

Obezitatea şi bolile cardio-vasculare sunt independente

H1

Există asociere icircntre obezitate şi bolile cardio-vasculare

Obezitatea şi bolile cardio-vasculare sunt asociate

a = 005 pragul de semnificaţie al testului

urmează o lege cu (r-1)(c-1) grade de libertate

χ2 = parametrul testului χ2

fio = frecvenţa observată

fit = frecvenţa teoretică

Regiunea critică este [χα2 yen)

Pentru α = 005 χα2 = 384

OBSERVAT BCV+ BCV- Total

Obezitate + AP = 150 FP = 180 330

Obezitate - FN = 60 AN = 230 290

Total 210 410 620

TEORETIC BCV+ BCV- Total

Obezitate + = 330times210620 = 330times410620 330

Obezitate - = 290times210620 = 290times410620 290

Total 210 410 620

TEORETIC BCV+ BCV- Total

Obezitate + = 330times210620 = 330times410620 330

26

Obezitate - = 290times210620 = 290times410620 290

Total 210 410 620

TEORETIC BCV+ BCV-

Obezitate + = 112 = 218

Obezitate - = 98 = 192

Deoarece 4177Icirc[384 yen) se respinge H0 cu un risc de eroare de 5

Există asociere icircntre obezitate şi bolile cardio-vasculare

Testul Fisher

Corecţie a testului χ2

Valoarea p asociată parametrului ne dă probabilitatea ca valoarea observată de independenţă să fie

atribuită doar şansei

O valoare p mică indică că există alte cauze decacirct şansa influenţează rezultatul şi astfel cele două

variabile investigate nu sunt independente

Testul Fisher = dispersia corectată a factorului x dispersia corectată a factorilor reziduali

Icircn acest context regula adunării dispersiilor se poate scrie unde

este variaţia lui y pe seama variaţiei variabilei x

este variaţia lui y pe seama influenţei factorilor reziduali (neicircnregistraţi)

este variaţia totală a caracteristicii y

Testul Fisher empiric se calculează după formula

27

se compară cu Ftab pentru nx şi nz grade de libertate la un anumit prag de semnificaţie stabilit

Dacă Fc gt Ftab rezultă că variaţia factorului de grupare x este semnificativă pentru variaţia caracteristicii y

Testul z pentru proporţii

1 Compararea unei frecvenţe observate cu o frecvenţă teoretică

2 Testarea egalităţii a două frecvenţe

Testul z Compararea unei frecvenţe observate cu o frecvenţă teoretică

Scop Investigarea semnificaţiei diferenţei icircntre o frecvenţă teoretică p (icircntr-o populaţie) şi o frecvenţă

observată f pe un eşantion reprezentativ (variabilă calitativă (binare))

Condiţii de aplicare Testul este corect aplicat dacă numărul n al observaţiilor eşantionului este

suficient de mare (n∙p n∙(1-p)gt10

Parametrul

n = volumul eşantionului

Suntem interesaţi de investigarea prevalenţei hepatitei B la personalul care lucrează icircn laboratoarele

clinicilor de boli infecţioase din Transilvania Se ştie din studii anterioare că prevalenţa hepatitei B icircn

populaţia generală din Transilvania este de 9 S-a luat icircn studiu un eşantion de 100 persoane şi s-a

obţinut o prevalenţă a hepatitei B de 6 Există diferenţă semnificativă icircntre frecvenţa hepatitei B la

personalul care lucrează icircn laboratoarele spitalelor de boli infecţioase din Transilvania faţă de

populaţia generală

f = 006 p = 009 n = 100

Ipoteza nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat

faţă de frecvenţa hepatitei B icircn populaţia generală

Ipoteza alternativă test bilateral Există diferenţă semnificativă icircntre frecvenţa hepatitei B la

nivelul eşantionului şi prevalenţa hepatitei B icircn populaţia generală

f = 006 p = 009 n = 100

Pragul de semnificaţie a = 005

Regiunea critică test bilateral (-yen -196 ]Egrave[196 yen)

28

Concluzia testului

Deoarece parametrul statistic calculat al testului nu aparţine regiunii critice se acceptă ipoteza

nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat faţă de

frecvenţa hepatitei B icircn populaţia generală

Testul McNemar

Evaluarea dependenţei variabilelor calitative perechi (dorim să determinăm dacă o anumită

caracteristică este sau nu asociată cu o anumită patologie)

Identificăm n pacienţi care prezintă patologia de interes (eg Cancer bronho-pulmonar) şi n

pacienţi cu aceleaşi caracteristici ca şi primul grup dar care nu o prezintă

Martor = da Martor = nu

Caz = da a b

Caz = nu c d

Testul McNemar - exemplu fumat vs cancer

Martor = da Martor = nu

Cancer = da a = 2 b = 5

Cancer = nu c = 0 d = 3

29

χ2critic(α=005) = 384

32 lt 384 rarr acceptăm ipoteza nulă

Fumatul nu este icircn relaţie cu apariţia cancerului bronho-pulmonar

Inferenţa statistică pe date cantitative

Variabile cantitative continue

Testul z şi Student (t) (o medie sau medii perechi)

Testul z şi Student (t) (testarea a două medii)

ANOVA (ge 3 medii)

Ranguri (variabile cantitative discrete sau cantitative care nu icircndeplinesc condiţia de

normalitate)

Testul sumei rangurilor Wilcoxon

Kruskal-Wallis (ge 3 eşantioane independente)

Friedman (ge 3 eşantioane dependente)

Teste de normalitate variabile cantitative continue

Shapiro-Wilk

Kolmogorov-Smirnov

Shapiro-Wilk

Chi-Square Goodness-of-Fit

Dacă datele urmează o distribuţie normală aplicăm un test parametric

Dacă datele nu urmează o distribuţie normală aplicăm un test de comparare al rangurilor

30

Testul Z de comparare a mediei unui eşantion cu media unei populaţii

Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ

extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie

s2 care se cunoaşte

Condiţii de aplicare

1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru

compararea mediei unui eşantion cu media unei populaţii)

2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal

distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă

3 Talia eşantionului este mare ( ge 30)

Ipoteze

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media

eşantionului şi media populaţiei

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

(-yen -196 ] Egrave [196 yen)

Parametrul testului

n = volumul eşantionului

= media eşantionului

s = deviaţia standard a populaţiei

Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)

Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard

cunoscută

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi

media standard

Condiţii de aplicare

Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se

realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această

condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea

31

Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai

puternic

Numărul de grade de libertate (df) df = n-1

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

Parametrul testului

n = volumul eşantionului

micro0 = media standard

= media eşantionului

s = deviaţia standard a eşantionului

Testul ANOVA compararea mediilor a mai multe eşantioane

H0 = toate mediile sunt egale

H1 = nu toate mediile sunt egale

Condiţii de aplicare

1 Datele sunt independente unele faţă de celelalte

2 Datele fiecărui grup sunt normal distribuite

3 Deviaţia standard este aceeaşi pentru toate grupurile

Id Medicament

A B C D E F

1 5 6 7 10 5 9

2 6 8 8 11 8 8

3 7 7 9 13 6 7

4 8 9 11 12 4 5

32

5 9 10 10 9 7 6

Suma 35 40 45 55 30 35

Media 7 8 9 11 6 7

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =

= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)

Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2

F = (suma pătratelor(icircntre))(suma pătratelor(icircn))

Suma pătratelor (icircntre) = 16times5 = 80

Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60

Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn

interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare

SP df Media pătratelor F = MPicircntreMPicircn

Icircntre 80 5 = 805 = 16 = 1625 = 64

Icircn 60 24 = 6024 = 25

Total 140 29 -

Testul sumei rangurilor Wilcoxon

Aplicat pentru

Un set de observaţii provenite dintr-o valoare ipotetică comună

Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)

Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero

Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace

Suma rangurilor pentru diferenţele negative = 2+3+1 = 6

Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30

33

Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului

egal cu 8 = 0109

Icircnainte După Diferenţa Rang

64 66 -2 2

66 58 8 5

67 68 -1 3

71 65 6 4

72 75 -3 1

76 67 9 6

78 59 19 8

89 74 15 7

Testul Kruskal-Wallis (ge 3 eşantioane independente)

Test de ranguri aplicate pe mai mult de 3 eşantioane

H = parametrul testului

n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)

Tk = suma rangurilor

Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie

pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni

34

df = k-1 (k = numărul de eşantioane)

df = 3-1 = 2

Hcritic(α=005) = 599

H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie

pozitivă şi respectiv biopsie negativă

Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie

a tipului de studiu pe eşantioane perechi)

1 Definirea numărului de tratamente k

2 Obţinerea rangurilor pentru fiecare tratament

3 Sumarea rangurilor fiecărui tratament

4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)

5 Dacă Fr gt Frcritic rarr respingem H0

Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost

măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi

n = 9 k = 3 T12 = 225 T2

2 = 38025 T32 = 38025

Frcritic = 599

Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de

prostată

35

De reţinut

Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei

Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-

of-Fit

Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z

Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t

Compararea mediilor a 3 sau mai multe eşantioane ANOVA

Compararea mediilor a două populaţii (σ) testul Z

Compararea mediilor a două eşantioane (s) testul t

Compararea mediilor a două eşantioane perechi (s) testul t

ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi

cu cel pentru compararea a două eşantioane perechi

Ranguri

Distribuţia datelor nu are importanţă

Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)

Trei sau mai multe eşantioane Kruskal-Wallis

Trei sau mai multe eşantioane perechi Friedman

Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia

Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a

datelor)

Variabile nominale

Un singur eşantion sau eşantioane perechi

Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte

Eşantioane perechi testul Mc Nemar

Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2

Icircn analiza proporţiilor există teste diferite pentru

Compararea unei frecvenţe cu o frecvenţă cunoscută

Compararea a două frecvenţe

Semnificaţia statistică

Valoarea p (p value)

Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor

două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E

posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării

aleatorii

36

Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală

urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii

Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este

probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un

experiment de dimensiunea acestuia

Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că

diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii

diferite

Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca

fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă

ar fi fost adevărată

Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă

1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe

baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De

fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001

2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie

3 Se aplică testul statistic aferent pentru a calcula valoarea p

4 Se compară valoarea p cu valoarea ndash prag

5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe

semnificativă dpdv statisticrdquo

6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e

semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să

conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă

Teste de semnificaţie

Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului

populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)

Testarea ipotezelor implică posibile erori

Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile

sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui

grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul

icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005

ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există

37

nici o diferenţă

Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ

statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de

ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost

ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau

dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă

cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă

semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe

ipotetice variate icircn cazul icircn care ele există

Măsuri ale frecvenţei

Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)

Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate

Generic formula pe care se bazează toate cele trei este

unde x şi y sunt cantităţile de comparat

Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea

unei frecvenţe pe grupe de sex vacircrstă etc

Proporţia implică icircn mod necesar ca x să fie inclus icircn y

Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară

frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp

Pentru calcularea unei rate trebuie ţinut cont de trei aspecte

bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin

bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp

bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo

Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un

tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei

populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei

aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)

38

Indicatori

Rata de incidenţă

Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă

icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii

Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o

perioadă de timp

Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de

timp x

Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei

susceptibili de a dezvolta icircmbolnăvirea studiată

Numitorul poate fi

bull Numărul mediu al populaţiei icircn perioada de timp studiată

bull Mărimea populaţiei icircn mijlocul perioadei de studiu

bull Mărimea populaţiei la icircnceputul studiului

Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă

Este obligatorie menţionarea perioadei de timp

Prevalenţa

Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la

un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă

schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa

momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)

39

Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include

numai cazuri noi respectiv include cazuri noi şi vechi

Rata de atac

Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este

folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp

raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori

Rata persoană-timp

Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din

momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte

migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost

observate

Riscul relativ (RR)

Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment

legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele

prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două

grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la

bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la

bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai

mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo

Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2

Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn

cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă

(Tabelul 1)

Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR

Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la

neexpuşi

40

Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de

culegere a datelor

Odds ratio (OR)

Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin

raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general

studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)

Tabelul 2 Tabelul 2 x 2 pentru calcularea OR

Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală

Rate de mortalitate

Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp

specificată Există mai multe tipuri de rate de mortalitate

o Mortalitate specifică pe sex

o Mortalitate specifică pe rasă

o Mortalitate specifică pe boală

o Mortalitate neonatală

o Mortalitate postneonatală

o Mortalitate infantilă

o Mortalitate maternă

Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP

41

Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de

viaţă şi vacircrsta la care survine decesul dacă este prematur

Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu

Ani de viaţă pierduţi datorat dizabilităţii

Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt

utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru

cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite

grupuri

Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de

risc şi o boală se folosesc riscul relativ şi odds ratio

35 Analiza şi interpretarea datelor

După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date

trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul

Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor

colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului

studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu

plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde

prezenţa biostatisticianului este necesară

Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu

elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat

iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului

iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate

depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori

testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere

clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza

Interpretarea rezultatelor statistice

Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne

motive (număr mic de date) acceptarea ei să fie falsă

Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine

gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia

ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument

de decizie Intervalul de confidenţă

42

Interpretarea statistica ne interpretarea clinică

Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă

Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice

obţinute pe eşantionul studiat

Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare

Ce interpretăm Rezultatele

personale obţinute icircn urma studiului

care au fost prezentate icircn secţiunea bdquoRezultaterdquo

Explicăm rezultatele obţinute

Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale

Interpretarea trebuie să se realizeze icircn

lumina limitelor studiului

contextul cultural social şi educaţional al locului unde s-a realizat cercetarea

contextul a ceea ce se cunoaşte din literatura de specialitate

Interpretăm doar rezultatele personale obţinute icircn urma studiului

Interpretarea statistică nu este tot una cu interpretarea clinică

Interpretarea statistică este importantă

Interpretarea clinică este foarte importantă

Intervalul de confidenţă

Media calculată pe baza unui eşantion nu va echivala media populaţiei

Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului

Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a

populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a

populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)

pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru

orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare

dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de

confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de

date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de

5

Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel

Dacă valoarea p este mică

Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare

aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o

medie diferită Diferenţa este semnificativă dpdv statistic

43

Icircn continuare

Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa

reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică

pentru a fi interesante din punct de vedere ştiinţific

Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC

oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care

este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a

obţine o concluzie clară

Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o

diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că

datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din

punct de vedere ştiinţific

Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul

detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat

Erorile studiilor medicale

Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura

anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară

caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea

asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri

legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias

Erorile potenţiale icircn studiile epidemiologice

1 Erori icircntacircmplătoare

2 Erori sistematice

3 Confuzia

4 Validitatea

1 Erori icircntacircmplătoare

Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a

parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel

de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot

fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii

(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor

de măsură (eroarea de măsurare)

44

2 Erori sistematice

Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate

care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu

acurateţe mare Acurateţea nu este afectată de mărimea eşantionului

Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de

experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea

dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus

şi greu de cuantificat (consum de alcool personalitate etc)

Principalele tipuri de erori din această categorie sunt

bull Biasul de selecţie

bull Biasul de informaţie

Biasul de selecţie

Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul

trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion

inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale

persoanelor incluse

Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se

ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia

Biasul de informaţie

Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de

instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze

expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere

nesemnificativă sau chiar să nu şi-o amintească de loc

3 Confuzia

Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune

prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este

cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă

de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte

important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor

protector

4 Validitatea

Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă

Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte

estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional

Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă

45

conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se

demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)

Validitatea externă se poate realiza numai dacă studiul este valid intern

Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii

studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de

studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt

laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi

validă din punct de vedere intern)

3 6 Prezentarea rezultatelor

După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite

Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor

icircntr-o formă bdquodigerabilărdquo este necesară

Scopul prezentării datelor

1 Transmiterea concluziilor studiului

a Datele corecte şi importante merită comunicate

b Datele trebuie să confirme sau să infirme ipoteza studiului

c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală

2 Acordarea posibilităţii altor cercetători să aprecieze studiul

a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti

b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor

prezentate

Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru

fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie

statistică

Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de

valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras

(Tabel 3)

Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)

46

Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct

numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor

precum şi prezentarea acestora sub formă inteligibilă

Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care

convin cercetătorului

Prezentarea datelor se poate face

1 Figuri şi tabele icircn articole scrise

2 Figuri şi tabele icircn prezentări orale

3 Figuri şi tabele icircn postere

4 Text scris sau incluse icircn text

5 Site-uri de WEB

Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor

Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie

Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele

exprimacircnd exact ceea ce acestea exprimă

Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate

anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel

să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se

acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca

mai sus sugestive sunt formatele simple şi puţin icircncărcate

Dacă nu există reguli impuse se respectă

1 Mesaj simplu fără falsificarea datelor

2 De obicei este necesar atacirct tabelul cacirct şi graficul

3 Să fie simplu şi clar

Tabele

Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile

coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică

elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de

1 Se folosesc doar linii orizontale

2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn

evidenţi prin linie de separare (Tabelul 4)

Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland

Noua Zeelandă)

(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)

47

3 Numerele sunt aliniate icircn funcţie de virgulă

4 Indicii statistici sunt explicaţi sub tabel

5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană

6 Abrevierile pot fi folosite

7 Numărul de zecimale trebuie limitat la maxim două

8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel

9 Plasarea legendei este obligatorie sub tabel

10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)

Icircn cazul prezentărilor orale sau a posterelor este indicat ca

1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării

2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte

3 Folosirea de simboluri este permisă

Clasificarea tabelelor

Tabelele se clasifică după

i) conţinut

bull cu distribuţii de frecvenţe

bull de clase de frecvenţe

bull de contingenţă

ii) structura

bull cu doua coloane

bull cu subclasificări

bull ldquomasterrdquo

Tabele ce conţin distribuţii de frecvenţe

O modalitate comodă de a prezenta o mulţime de date brute este

1 Se ordonează datele in ordine crescătoare

2 Se determine frecvenţa fiecărei valori

3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane

(Tabelul 5)

Tabelul 5 Distribuţii de frecvenţă absolută

48

Tabelul claselor de frecvenţe

1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă

2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)

Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)

Tabele de contingenţă

1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a

tabelelor de contingenţă

2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a

combinaţiilor de perechi ordonate de valori

3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre

a factor de risc si

b starea sănătăţii

4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)

5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)

Tabelul 7 Tabel de contingenţă 2 x 2

49

Grafice

Există două categorii de moduri grafice sub care se pot prezenta datele

1 Ilustraţii şi fotografii

2 Grafice

1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă

pentru lucrare

2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit

Putem vorbi despre mai multe tipuri de grafice

bull Grafice pentru reprezentarea datelor cantitative

1048707 Grafic cartezian (X Y)

1048707 Histograma

1048707 Poligonul de frecvenţe

1048707 Diagrama bdquoscatterrdquo

bull Grafice pentru reprezentarea datelor calitative

1048707 Grafic cu bare

1048707 Diagrama tip bdquoboxplotrdquo

1048707 Diagrama bdquopierdquo

1048707 Cartograma

Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi

dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)

Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)

Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie

Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)

Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)

50

Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir

de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele

două variabile studiate (Figura 6)

Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2

(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2

rămacircne aproximativ constantă)

Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea

comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea

comparativă a mai multor variabile

Figura 7 Grafic calitativ cu bare

51

Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo

Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două

posibilităţi reprezentate grafic este mai frecventă (Figura 8)

Figura 8 Reprezentare tip bdquopierdquo

Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli

sau a oricărui element comparativ Se foloseşte de epidemiologi

Rezultate

Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare

Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o

manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu

explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția

bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la

ilustraţii tabele grafice

Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi

nici rezultatele care invalidează eventual ipoteza

Discuţii

Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd

cultura ştiinţifică şi inteligenţa autorilor

Acest capitol răspunde la trei obiective

Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia

calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de

selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează

rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv

52

este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn

care a fost abordată problema fără a face o revistă a literaturii

Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea

rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul

Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor

afirmaţii nesusţinute de conţinutul lucrării

Concluzii

Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate

să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie

Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de

concluzii va scădea valoarea lucrării

Bibliografia (lista referinţelor citarea icircn text)

Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn

lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente

Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli

- să conţină cele mai importante şi recente lucrări

- să includă numai lucrări publicate

- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate

Bibliografie

Elisabeta Jaba ndash Statistică Ed Economică 1998

Mihai Ţarcă ndash Statistică volI Ed UAIC 1979

Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale

Ed University Press 2009

Sorana Daniela Bolboacă ndash Metodologia cercetării curs

53

Page 17: cercetarea medicala - metodologie

Valorile pe care variabila le ia se constituie icircntr-o serie statistică Indicatorii care definesc o variabilă (serie)

sunt

1 Ale tendinţei centrale

Media aritmetică - notată de regulă cu

Mediana - este acea valoare din şirul de date care icircmparte icircn două părţi egale şirul ordonat de valori (atenţie

şirul este ordonat crescător) situacircndu-se la mijlocul seriei statistice

Dacă numărul de valori n este un număr impar atunci mediana este valoarea unde

Dacă n este par deci avem un număr par de valori mediana este definitatilde ca fiind

unde k = n2

Modul - constituie valoarea care apare cel mai des deci valoarea cu numărul cel mai mare de apariţii

2 De dispersie

Amplitudinea - este diferenţa dintre valoarea maximă şi cea minimă

A = Amax - Amin

Amplitudinea relativă - notată A este raportul dintre amplitudinea absolută şi media aritmetică a seriei de

date

Varianţa notată este un indicator de icircmprăştiere a datelor Formula de calcul este

Abaterea standard (S) sau deviaţia standard reprezintă rădăcina pătrată din varianţă (dispersie)

Coeficientul de variaţie se calculează ca un raport procentual icircntre abaterea standard şi valoarea medie a şirului

de valori

Eroarea standard intervine icircn estimarea intervalelor de confidenţă Se calculează astfel

17

3 De asimetrie (skewness) indică distribuţia datelor dacă sunt sau nu distribuite normal

4 De boltire (kurtosis) estimează boltirea sau aplatizarea curbei de distribuţie

Prezentarea descriptivă a datelor se face prin icircnregistrarea datelor culese icircn tabele care să reprezinte icircn mod

sintetic valorile măsurate

Icircn concluzie statistica descriptivă permite

bull Stabilirea comparabilităţii icircntre grupurile de studiu şi aprecierea prezenţei erorilor sau confuziei

bull Reprezentarea datelor icircn tabele permite evaluarea fiecărui pacient şi dacă a existat pierderi din studiu

Statistica inferenţială

Statistica inferenţială (inductivă) este partea de analiză a datelor care permite extrapolarea unei

concluzii trase pe baza unui eşantion spre populaţia ţintă pentru care a fost efectuat studiul

Scopul analizei statistice este de a evidenţia efectul unui tratament sau al unui factor de risc prin date obţinute

din eşantionul studiat spre populaţia ţintă Aceasta implică testarea ipotezelor statistice sau altfel spus testarea

semnificaţiei statistice Este una dintre cele mai importante momente ale studiului Cum rezultatele sunt

obţinute prin studiul unui eşantion există posibilitatea ca acestea să fie datorate icircntacircmplării Testele

statistice ne ajută să apreciem icircn ce măsură rezultatele sunt icircntacircmplătoare şi mai ales icircn ce măsură şi dacă se

pot aplica populaţiei generale Icircn acest scop se impune o valoare limită alfa 005 care reprezintă limita

superioară a probabilităţii ca rezultatul obţinut să fie greşit (datorat icircntacircmplării) Astfel icircn funcţie de tipul

variabilelor şi indicatorii descriptivi aplicaţi şi evaluaţi se aplică teste de semnificaţie statistică (Tabelul 1)

Tabelul 1 Alegerea testelor de semnificaţie statistică

Tipul datelor

18

Diferenţierea variabilelor din punctul de vedere a distribuţiei se face folosind testul de normalitate

Kolmogorov ndash Smirnov

Testul statistic reprezintă metoda de comparaţie a două sau mai multe populaţii prin intermediul unor

variabile observate ale lor

Scopul unui test statistic este de a defini realitatea

Definirea icircntrebării de cercetare (ipoteza clinică)

Tratamentul cu Nebivolol este la fel de eficient ca şi cel cu Valsartan icircn tratamentul

hipertensiunii arteriale

Transpunerea icircntrebării de cercetare icircn termeni statistici (ipoteza statistică)

Media tensiunii arteriale a pacienţilor trataţi cu Valsartan nu diferă semnificativ de media

tensiunii arteriale a pacienţilor trataţi cu Nebivolol

Etapele unui test statistic

1 Formularea problemei icircn termenii ipotezelor statistice

2 Alegerea şi calcularea parametrului statistic al testului

3 Regiunea critică

4 Concluzia testului

1 Formularea problemei icircn termenii ipotezelor statistice

Ipoteza nulă ipoteza care trebuie testată testul efectuacircndu-se sub prezumţia că ipoteza nulă ar

fi adevărată

Ipoteza alternativă acea ipoteză care icircntr-un sens sau altul contrazice ipoteza nulă Această

ipoteză se mai numeşte şi ipoteza de lucru

Ipoteza nulă tipuri

O coadă (ldquoone-tailedrdquo sau ldquoone-siderdquo)

Media este mai mare

Media este mai mică

Două cozi (ldquoone-tailedrdquo sau ldquoone-siderdquo)

Media este egală

2 Alegerea şi calcularea parametrului statistic al testului

Parametrul statistic al testului exprimă icircntr-o anumită formă diferenţa dintre elementele comparate

Ţinacircnd seama de faptul că eşantionul sau eşantioanele utilizate sunt aleator extrase din populaţiile care

fac obiectul testului parametrul statistic este o variabilă aleatoare de selecţie care urmează o anumită

lege de probabilitate

Un parametru statistic al testului bun trebuie să icircndeplinească două condiţii

19

Trebuie să se comporte diferit atunci cacircnd ipoteza nulă H0 este adevărată faţă de situaţia icircn

care ipoteza alternativă H1 este adevărată

Distribuţia de probabilitate a parametrului statistic al testului sub prezumţia că H0 este

adevărată este cunoscută

3 Regiunea critică

- Trebuie să fim capabili să decidem icircn funcţie de valoarea parametrului statistic calculat care dintre

ipoteze cea nulă sau cea alternativă este adevărată

- Dacă valoarea parametrului statistic aparţine regiunii critice ipoteza nulă H0 va fi respinsă şi va fi

acceptată ipoteza alternativă H1

- Dacă valoarea parametrului statistic nu aparţine regiunii critice ipoteza nulă H0 va fi acceptată

- Decidem mărimea regiunii critice

Pentru aceasta trebuie să specificăm mărimea riscului de eroare pe care icircl acceptăm

Pe scurt definim nivelul de semnificaţie notat cu a sau mărimea riscului pe care

suntem dispuşi să ni-l asumăm icircn respingerea ipotezei nule H0 icircn cazul icircn care aceasta

este adevărată De obicei se alege un nivel de semnificaţie icircntre 1 şi 5

Probabilitatea unei erori de tipul I

probabilitatea de respingere a ipotezei nule H0 icircn favoarea ipotezei alternative H1 icircn

condiţiile icircn care H0 este adevărată

probabilitatea unei erori de tipul I se notează cu a şi se mai numeşte nivel de

semnificaţie al testului

Probabilitatea unei erori de tipul II

probabilitatea acceptării ipotezei nule icircn condiţiile icircn care ipoteza alternativă H1 este

adevărată

această probabilitate se notează cu b

- Unilaterală la dreapta ndash valoarea parametrului statistic al testului este mai mare sau egală cu

valoarea din dreapta a intervalului critic

- Unilaterală la stacircnga ndash valoarea parametrului statistic al testului este mai mică sau egală cu

valoarea din stacircnga a intervalului critic

- Bilaterală ndash valoarea parametrului statistic al testului este mai mică sau egală cu valoarea extremă

din stacircnga regiunii critice sau mai mare sau egală cu valoarea extremă din dreapta regiunii critice

valorile extreme ale regiunii critice avacircnd nivele egale de semnificaţie

4 Concluzia testului

- Ipoteza nulă H0 este respinsă dacă valoarea parametrului statistic aparţine regiunii critice

20

- Regiunea critică trebuie astfel aleasă icircncacirct dacă ipoteza alternativă H1 este adevărată

probabilitatea de respingere a ipotezei nule H0 este mai mare decacirct icircn cazul icircn care ipoteza nulă H0

ar fi adevărată

- Acceptarea ipotezei nule H0 atunci cacircnd ipoteza alternativă H1 este adevărată este cunoscută ca şi

eroarea de tipul II

a probabilitatea ei se notează cu b

b măsoară bdquonivelul de eroarerdquo

- Icircn testarea oricărei ipoteze statistice există patru situaţii care determină dacă decizia noastră este

corectă sau nu

Cazuri

H0 este adevărată H0 este falsă

Concluzie H0 se acceptă decizie corectă eroare de tipul

II

H0 se

respinge

eroare de tipul I decizie corectă

Luarea deciziei pe baza valorii probabilităţii p de semnificaţie a testului

Icircn momentul icircn care prelucrăm statistic o serie de date dorim să ştim dacă rezultatele obţinute sunt sau

nu semnificative statistic

Răspunsul la această icircntrebare este dat de valoarea lui p calculată de orice program statistic la

prelucrarea unor date

Icircn cazul testelor statistice ipoteza nulă este respinsă dacă nivelul de semnificaţie este mai mic decacirct

005 iar programele de prelucrare statistică a datelor vor afişa o steluţă () icircn tabelul rezultatelor

21

Dacă p le 005 respingem ipoteza nulă şi acceptăm ipoteza alternativă (am obţinut semnificaţia

statistică)

Dacă p gt 005 acceptăm ipoteza nulă (nu am obţinut semnificaţia statistică)

p = 013

NU respingem ipoteza nulă

Risc de eroare de tip II

α = 005

p = 002

Respingem ipoteza nulă

Risc de eroare de tip I

Semnificaţia lui p

Criteriu de luare a deciziei cu privire la o ipoteză statistică nulă

Cuantifică şansa ca o decizie de respingere a ipotezei nule să fie greşită

Măsură a semnificaţiei statistice şi NU CLINICĂ

22

Semnificaţia lui p (reguli empirice)

001 le p lt 005 rezultatul e semnificativ statistic

0001 le p lt 001 rezultatul e icircnalt semnificativ statistic

p lt 0001 rezultatul e foarte icircnalt semnificativ statistic

p ge 005 rezultatul e considerat nesemnificativ statistic

Limite ale valorii p

Valoarea p NU ne dă informaţii despre

Şansa de beneficiu a unui pacient individual

Procentul de pacienţi care vor avea un beneficiu icircn urma instituirii procedurii medicale

Gradul de beneficiu expectat pentru un anumit pacient

Puterea unui test statistic

Este capacitatea de a detecta o diferenţă acolo unde există

Creşterea volumului eşantionului determină creşterea puterii testului statistic aplicat

Valoarea este icircn relaţie directă cu eroarea de tip II

Puterea = 1 ndash β

Cea mai utilizată modalitate de creştere a puterii unui test statistic este de a creşte volumul

eşantionului

Tipul scalei de măsură ndash testul statistic

Denumire test Interval Nominal Observaţii

Corelaţie Pearson 2 0 Există o relaţie liniară

χ2 0 2

Student 1 1 Doar 2 grupuri

ANOVA 1 1 2 sau mai multe grupuri

Student perechi 1 1 Eşantioane perechi

Măsurători repetate (ANOVA) 1 1 Mai mult de 2 grupuri date

perechi

Inferenţa statistică pe date calitativ e

Tabela de contingenţă 2times2

Riscuri şi raţii

Testul χ2 (testarea asocierii icircn tabela de contingenţă)

Testul Fisher

23

Testul z pentru proporţii

Testul McNemar

Tabela de contingenţă 2times2

Scale de tip nominal (dicotomiale tabela de contingenţă de 2times2) sau ordinal (tabela de contingenţă de

rtimesc)

Frecvenţa absolută (numărul de evenimente per categorie)

Tabela de contingenţă de 2times2 4 categorii

AP = adevărat pozitiv

FP = fals pozitiv

FN = fals negativ

AN = adevărat negativ

Ulcer deschis Ulcer vindecat Total

Recurenţă + AP = 1 FP = 5 = 1+5 = 6

Recurenţă - FN = 7 AN = 16 = 7+16 = 23

Total =1+7=8 =5+16=21 29

Riscuri şi raţii Mărimi ale asocierii

Denumire Formula Definiţie

Rata falşilor pozitivi =FP(FP+AN) Probabilitatea unui test fals + (α)

Rata falşilor negativi =FN(FN+AP) Probabilitatea unui test fals ndash (β)

Sensibilitate =AP(AP+FN) Probabilitatea unui test real + (1- β)

Specificitate =AN(AN+FP) Probabilitatea unui test real ndash (1- α)

Acurateţe =(AP+AN)n Probabilitatea generală a unei decizii corecte

Valoarea predictivă pozitivă =AP(AP+FP) Probabilitatea ca un test pozitiv să fie corect

Valoarea predictivă negativă =AN(AN+FN) Probabilitatea ca un test negativ să fie corect

Riscul relativ =AP(FP+AN)FN(AP+FP)

Rata şansei =(AP∙AN)(FN∙FP)

Riscul atribuabil =AP(AP+FP)-FN(FN+AN)

24

Denumire Formula

Rata falşilor pozitivi = 5(5+1) = 08334

Rata falşilor negativi = 7(7+16) = 03043

Sensibilitate = 1(1+7) = 01250

Specificitate = 16(16+5) = 07619

Acurateţe = (1+16)29 = 05862

Valoarea predictivă pozitivă = 1(1+5) = 01667

Valoarea predictivă negativă = 16(16+7) = 06957

Riscul relativ = 1(5+16)7(1+5) = 2142 = 050

Rata şansei = (1∙16)(7∙5) = 04571

Riscul atribuabil = 1(1+5)-7(7+16) = 01667-03043=-01376

Testarea asocierii icircn tabela de contingenţă

Testul χ2

Nu trebuie utilizat pentru eşantioane de volum mic

Testul este valid doar dacă valoarea expectată (aşteptată) pentru fiecare celulă este cel puţin

egală cu 1 şi frecvenţa absolută observată este de minim 5

Dacă aceste condiţii nu sunt icircndeplinite se aplică testul exact al lui Fisher (Fisherrsquos Exact Test)

Indică dacă cele două variabile sunt sau nu independente DAR NU cuantifică puterea asocierii

dintre ele

Problema S-a investigat icircntr-un studiu asocierea dintre obezitatea (ca factor de risc) şi bolile

cardio-vasculare la persoanele icircn etate (gt 60 ani) Din totalul de 620 persoane investigate s-au

identificat 150 persoane cu obezitate şi boală cardio-vasculară 230 persoane fără obezitate şi

fără boală cardio-vasculară şi 60 persoane fără obezitate dar cu boală cardio-vasculară Există

o asociere icircntre obezitate şi boala cardio-vasculară (df=1 α=005 χ2critic = 384)

Testul χ2 exemplu

H025

Nu există asociere icircntre obezitate şi bolile cardio-vasculare

Obezitatea şi bolile cardio-vasculare sunt independente

H1

Există asociere icircntre obezitate şi bolile cardio-vasculare

Obezitatea şi bolile cardio-vasculare sunt asociate

a = 005 pragul de semnificaţie al testului

urmează o lege cu (r-1)(c-1) grade de libertate

χ2 = parametrul testului χ2

fio = frecvenţa observată

fit = frecvenţa teoretică

Regiunea critică este [χα2 yen)

Pentru α = 005 χα2 = 384

OBSERVAT BCV+ BCV- Total

Obezitate + AP = 150 FP = 180 330

Obezitate - FN = 60 AN = 230 290

Total 210 410 620

TEORETIC BCV+ BCV- Total

Obezitate + = 330times210620 = 330times410620 330

Obezitate - = 290times210620 = 290times410620 290

Total 210 410 620

TEORETIC BCV+ BCV- Total

Obezitate + = 330times210620 = 330times410620 330

26

Obezitate - = 290times210620 = 290times410620 290

Total 210 410 620

TEORETIC BCV+ BCV-

Obezitate + = 112 = 218

Obezitate - = 98 = 192

Deoarece 4177Icirc[384 yen) se respinge H0 cu un risc de eroare de 5

Există asociere icircntre obezitate şi bolile cardio-vasculare

Testul Fisher

Corecţie a testului χ2

Valoarea p asociată parametrului ne dă probabilitatea ca valoarea observată de independenţă să fie

atribuită doar şansei

O valoare p mică indică că există alte cauze decacirct şansa influenţează rezultatul şi astfel cele două

variabile investigate nu sunt independente

Testul Fisher = dispersia corectată a factorului x dispersia corectată a factorilor reziduali

Icircn acest context regula adunării dispersiilor se poate scrie unde

este variaţia lui y pe seama variaţiei variabilei x

este variaţia lui y pe seama influenţei factorilor reziduali (neicircnregistraţi)

este variaţia totală a caracteristicii y

Testul Fisher empiric se calculează după formula

27

se compară cu Ftab pentru nx şi nz grade de libertate la un anumit prag de semnificaţie stabilit

Dacă Fc gt Ftab rezultă că variaţia factorului de grupare x este semnificativă pentru variaţia caracteristicii y

Testul z pentru proporţii

1 Compararea unei frecvenţe observate cu o frecvenţă teoretică

2 Testarea egalităţii a două frecvenţe

Testul z Compararea unei frecvenţe observate cu o frecvenţă teoretică

Scop Investigarea semnificaţiei diferenţei icircntre o frecvenţă teoretică p (icircntr-o populaţie) şi o frecvenţă

observată f pe un eşantion reprezentativ (variabilă calitativă (binare))

Condiţii de aplicare Testul este corect aplicat dacă numărul n al observaţiilor eşantionului este

suficient de mare (n∙p n∙(1-p)gt10

Parametrul

n = volumul eşantionului

Suntem interesaţi de investigarea prevalenţei hepatitei B la personalul care lucrează icircn laboratoarele

clinicilor de boli infecţioase din Transilvania Se ştie din studii anterioare că prevalenţa hepatitei B icircn

populaţia generală din Transilvania este de 9 S-a luat icircn studiu un eşantion de 100 persoane şi s-a

obţinut o prevalenţă a hepatitei B de 6 Există diferenţă semnificativă icircntre frecvenţa hepatitei B la

personalul care lucrează icircn laboratoarele spitalelor de boli infecţioase din Transilvania faţă de

populaţia generală

f = 006 p = 009 n = 100

Ipoteza nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat

faţă de frecvenţa hepatitei B icircn populaţia generală

Ipoteza alternativă test bilateral Există diferenţă semnificativă icircntre frecvenţa hepatitei B la

nivelul eşantionului şi prevalenţa hepatitei B icircn populaţia generală

f = 006 p = 009 n = 100

Pragul de semnificaţie a = 005

Regiunea critică test bilateral (-yen -196 ]Egrave[196 yen)

28

Concluzia testului

Deoarece parametrul statistic calculat al testului nu aparţine regiunii critice se acceptă ipoteza

nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat faţă de

frecvenţa hepatitei B icircn populaţia generală

Testul McNemar

Evaluarea dependenţei variabilelor calitative perechi (dorim să determinăm dacă o anumită

caracteristică este sau nu asociată cu o anumită patologie)

Identificăm n pacienţi care prezintă patologia de interes (eg Cancer bronho-pulmonar) şi n

pacienţi cu aceleaşi caracteristici ca şi primul grup dar care nu o prezintă

Martor = da Martor = nu

Caz = da a b

Caz = nu c d

Testul McNemar - exemplu fumat vs cancer

Martor = da Martor = nu

Cancer = da a = 2 b = 5

Cancer = nu c = 0 d = 3

29

χ2critic(α=005) = 384

32 lt 384 rarr acceptăm ipoteza nulă

Fumatul nu este icircn relaţie cu apariţia cancerului bronho-pulmonar

Inferenţa statistică pe date cantitative

Variabile cantitative continue

Testul z şi Student (t) (o medie sau medii perechi)

Testul z şi Student (t) (testarea a două medii)

ANOVA (ge 3 medii)

Ranguri (variabile cantitative discrete sau cantitative care nu icircndeplinesc condiţia de

normalitate)

Testul sumei rangurilor Wilcoxon

Kruskal-Wallis (ge 3 eşantioane independente)

Friedman (ge 3 eşantioane dependente)

Teste de normalitate variabile cantitative continue

Shapiro-Wilk

Kolmogorov-Smirnov

Shapiro-Wilk

Chi-Square Goodness-of-Fit

Dacă datele urmează o distribuţie normală aplicăm un test parametric

Dacă datele nu urmează o distribuţie normală aplicăm un test de comparare al rangurilor

30

Testul Z de comparare a mediei unui eşantion cu media unei populaţii

Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ

extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie

s2 care se cunoaşte

Condiţii de aplicare

1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru

compararea mediei unui eşantion cu media unei populaţii)

2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal

distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă

3 Talia eşantionului este mare ( ge 30)

Ipoteze

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media

eşantionului şi media populaţiei

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

(-yen -196 ] Egrave [196 yen)

Parametrul testului

n = volumul eşantionului

= media eşantionului

s = deviaţia standard a populaţiei

Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)

Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard

cunoscută

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi

media standard

Condiţii de aplicare

Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se

realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această

condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea

31

Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai

puternic

Numărul de grade de libertate (df) df = n-1

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

Parametrul testului

n = volumul eşantionului

micro0 = media standard

= media eşantionului

s = deviaţia standard a eşantionului

Testul ANOVA compararea mediilor a mai multe eşantioane

H0 = toate mediile sunt egale

H1 = nu toate mediile sunt egale

Condiţii de aplicare

1 Datele sunt independente unele faţă de celelalte

2 Datele fiecărui grup sunt normal distribuite

3 Deviaţia standard este aceeaşi pentru toate grupurile

Id Medicament

A B C D E F

1 5 6 7 10 5 9

2 6 8 8 11 8 8

3 7 7 9 13 6 7

4 8 9 11 12 4 5

32

5 9 10 10 9 7 6

Suma 35 40 45 55 30 35

Media 7 8 9 11 6 7

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =

= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)

Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2

F = (suma pătratelor(icircntre))(suma pătratelor(icircn))

Suma pătratelor (icircntre) = 16times5 = 80

Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60

Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn

interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare

SP df Media pătratelor F = MPicircntreMPicircn

Icircntre 80 5 = 805 = 16 = 1625 = 64

Icircn 60 24 = 6024 = 25

Total 140 29 -

Testul sumei rangurilor Wilcoxon

Aplicat pentru

Un set de observaţii provenite dintr-o valoare ipotetică comună

Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)

Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero

Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace

Suma rangurilor pentru diferenţele negative = 2+3+1 = 6

Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30

33

Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului

egal cu 8 = 0109

Icircnainte După Diferenţa Rang

64 66 -2 2

66 58 8 5

67 68 -1 3

71 65 6 4

72 75 -3 1

76 67 9 6

78 59 19 8

89 74 15 7

Testul Kruskal-Wallis (ge 3 eşantioane independente)

Test de ranguri aplicate pe mai mult de 3 eşantioane

H = parametrul testului

n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)

Tk = suma rangurilor

Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie

pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni

34

df = k-1 (k = numărul de eşantioane)

df = 3-1 = 2

Hcritic(α=005) = 599

H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie

pozitivă şi respectiv biopsie negativă

Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie

a tipului de studiu pe eşantioane perechi)

1 Definirea numărului de tratamente k

2 Obţinerea rangurilor pentru fiecare tratament

3 Sumarea rangurilor fiecărui tratament

4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)

5 Dacă Fr gt Frcritic rarr respingem H0

Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost

măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi

n = 9 k = 3 T12 = 225 T2

2 = 38025 T32 = 38025

Frcritic = 599

Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de

prostată

35

De reţinut

Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei

Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-

of-Fit

Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z

Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t

Compararea mediilor a 3 sau mai multe eşantioane ANOVA

Compararea mediilor a două populaţii (σ) testul Z

Compararea mediilor a două eşantioane (s) testul t

Compararea mediilor a două eşantioane perechi (s) testul t

ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi

cu cel pentru compararea a două eşantioane perechi

Ranguri

Distribuţia datelor nu are importanţă

Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)

Trei sau mai multe eşantioane Kruskal-Wallis

Trei sau mai multe eşantioane perechi Friedman

Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia

Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a

datelor)

Variabile nominale

Un singur eşantion sau eşantioane perechi

Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte

Eşantioane perechi testul Mc Nemar

Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2

Icircn analiza proporţiilor există teste diferite pentru

Compararea unei frecvenţe cu o frecvenţă cunoscută

Compararea a două frecvenţe

Semnificaţia statistică

Valoarea p (p value)

Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor

două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E

posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării

aleatorii

36

Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală

urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii

Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este

probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un

experiment de dimensiunea acestuia

Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că

diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii

diferite

Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca

fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă

ar fi fost adevărată

Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă

1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe

baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De

fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001

2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie

3 Se aplică testul statistic aferent pentru a calcula valoarea p

4 Se compară valoarea p cu valoarea ndash prag

5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe

semnificativă dpdv statisticrdquo

6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e

semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să

conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă

Teste de semnificaţie

Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului

populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)

Testarea ipotezelor implică posibile erori

Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile

sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui

grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul

icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005

ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există

37

nici o diferenţă

Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ

statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de

ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost

ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau

dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă

cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă

semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe

ipotetice variate icircn cazul icircn care ele există

Măsuri ale frecvenţei

Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)

Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate

Generic formula pe care se bazează toate cele trei este

unde x şi y sunt cantităţile de comparat

Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea

unei frecvenţe pe grupe de sex vacircrstă etc

Proporţia implică icircn mod necesar ca x să fie inclus icircn y

Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară

frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp

Pentru calcularea unei rate trebuie ţinut cont de trei aspecte

bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin

bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp

bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo

Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un

tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei

populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei

aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)

38

Indicatori

Rata de incidenţă

Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă

icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii

Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o

perioadă de timp

Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de

timp x

Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei

susceptibili de a dezvolta icircmbolnăvirea studiată

Numitorul poate fi

bull Numărul mediu al populaţiei icircn perioada de timp studiată

bull Mărimea populaţiei icircn mijlocul perioadei de studiu

bull Mărimea populaţiei la icircnceputul studiului

Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă

Este obligatorie menţionarea perioadei de timp

Prevalenţa

Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la

un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă

schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa

momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)

39

Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include

numai cazuri noi respectiv include cazuri noi şi vechi

Rata de atac

Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este

folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp

raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori

Rata persoană-timp

Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din

momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte

migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost

observate

Riscul relativ (RR)

Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment

legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele

prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două

grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la

bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la

bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai

mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo

Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2

Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn

cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă

(Tabelul 1)

Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR

Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la

neexpuşi

40

Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de

culegere a datelor

Odds ratio (OR)

Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin

raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general

studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)

Tabelul 2 Tabelul 2 x 2 pentru calcularea OR

Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală

Rate de mortalitate

Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp

specificată Există mai multe tipuri de rate de mortalitate

o Mortalitate specifică pe sex

o Mortalitate specifică pe rasă

o Mortalitate specifică pe boală

o Mortalitate neonatală

o Mortalitate postneonatală

o Mortalitate infantilă

o Mortalitate maternă

Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP

41

Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de

viaţă şi vacircrsta la care survine decesul dacă este prematur

Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu

Ani de viaţă pierduţi datorat dizabilităţii

Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt

utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru

cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite

grupuri

Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de

risc şi o boală se folosesc riscul relativ şi odds ratio

35 Analiza şi interpretarea datelor

După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date

trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul

Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor

colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului

studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu

plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde

prezenţa biostatisticianului este necesară

Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu

elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat

iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului

iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate

depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori

testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere

clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza

Interpretarea rezultatelor statistice

Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne

motive (număr mic de date) acceptarea ei să fie falsă

Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine

gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia

ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument

de decizie Intervalul de confidenţă

42

Interpretarea statistica ne interpretarea clinică

Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă

Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice

obţinute pe eşantionul studiat

Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare

Ce interpretăm Rezultatele

personale obţinute icircn urma studiului

care au fost prezentate icircn secţiunea bdquoRezultaterdquo

Explicăm rezultatele obţinute

Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale

Interpretarea trebuie să se realizeze icircn

lumina limitelor studiului

contextul cultural social şi educaţional al locului unde s-a realizat cercetarea

contextul a ceea ce se cunoaşte din literatura de specialitate

Interpretăm doar rezultatele personale obţinute icircn urma studiului

Interpretarea statistică nu este tot una cu interpretarea clinică

Interpretarea statistică este importantă

Interpretarea clinică este foarte importantă

Intervalul de confidenţă

Media calculată pe baza unui eşantion nu va echivala media populaţiei

Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului

Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a

populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a

populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)

pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru

orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare

dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de

confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de

date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de

5

Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel

Dacă valoarea p este mică

Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare

aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o

medie diferită Diferenţa este semnificativă dpdv statistic

43

Icircn continuare

Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa

reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică

pentru a fi interesante din punct de vedere ştiinţific

Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC

oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care

este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a

obţine o concluzie clară

Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o

diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că

datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din

punct de vedere ştiinţific

Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul

detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat

Erorile studiilor medicale

Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura

anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară

caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea

asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri

legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias

Erorile potenţiale icircn studiile epidemiologice

1 Erori icircntacircmplătoare

2 Erori sistematice

3 Confuzia

4 Validitatea

1 Erori icircntacircmplătoare

Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a

parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel

de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot

fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii

(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor

de măsură (eroarea de măsurare)

44

2 Erori sistematice

Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate

care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu

acurateţe mare Acurateţea nu este afectată de mărimea eşantionului

Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de

experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea

dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus

şi greu de cuantificat (consum de alcool personalitate etc)

Principalele tipuri de erori din această categorie sunt

bull Biasul de selecţie

bull Biasul de informaţie

Biasul de selecţie

Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul

trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion

inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale

persoanelor incluse

Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se

ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia

Biasul de informaţie

Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de

instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze

expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere

nesemnificativă sau chiar să nu şi-o amintească de loc

3 Confuzia

Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune

prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este

cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă

de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte

important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor

protector

4 Validitatea

Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă

Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte

estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional

Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă

45

conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se

demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)

Validitatea externă se poate realiza numai dacă studiul este valid intern

Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii

studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de

studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt

laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi

validă din punct de vedere intern)

3 6 Prezentarea rezultatelor

După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite

Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor

icircntr-o formă bdquodigerabilărdquo este necesară

Scopul prezentării datelor

1 Transmiterea concluziilor studiului

a Datele corecte şi importante merită comunicate

b Datele trebuie să confirme sau să infirme ipoteza studiului

c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală

2 Acordarea posibilităţii altor cercetători să aprecieze studiul

a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti

b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor

prezentate

Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru

fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie

statistică

Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de

valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras

(Tabel 3)

Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)

46

Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct

numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor

precum şi prezentarea acestora sub formă inteligibilă

Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care

convin cercetătorului

Prezentarea datelor se poate face

1 Figuri şi tabele icircn articole scrise

2 Figuri şi tabele icircn prezentări orale

3 Figuri şi tabele icircn postere

4 Text scris sau incluse icircn text

5 Site-uri de WEB

Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor

Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie

Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele

exprimacircnd exact ceea ce acestea exprimă

Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate

anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel

să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se

acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca

mai sus sugestive sunt formatele simple şi puţin icircncărcate

Dacă nu există reguli impuse se respectă

1 Mesaj simplu fără falsificarea datelor

2 De obicei este necesar atacirct tabelul cacirct şi graficul

3 Să fie simplu şi clar

Tabele

Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile

coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică

elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de

1 Se folosesc doar linii orizontale

2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn

evidenţi prin linie de separare (Tabelul 4)

Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland

Noua Zeelandă)

(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)

47

3 Numerele sunt aliniate icircn funcţie de virgulă

4 Indicii statistici sunt explicaţi sub tabel

5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană

6 Abrevierile pot fi folosite

7 Numărul de zecimale trebuie limitat la maxim două

8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel

9 Plasarea legendei este obligatorie sub tabel

10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)

Icircn cazul prezentărilor orale sau a posterelor este indicat ca

1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării

2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte

3 Folosirea de simboluri este permisă

Clasificarea tabelelor

Tabelele se clasifică după

i) conţinut

bull cu distribuţii de frecvenţe

bull de clase de frecvenţe

bull de contingenţă

ii) structura

bull cu doua coloane

bull cu subclasificări

bull ldquomasterrdquo

Tabele ce conţin distribuţii de frecvenţe

O modalitate comodă de a prezenta o mulţime de date brute este

1 Se ordonează datele in ordine crescătoare

2 Se determine frecvenţa fiecărei valori

3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane

(Tabelul 5)

Tabelul 5 Distribuţii de frecvenţă absolută

48

Tabelul claselor de frecvenţe

1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă

2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)

Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)

Tabele de contingenţă

1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a

tabelelor de contingenţă

2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a

combinaţiilor de perechi ordonate de valori

3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre

a factor de risc si

b starea sănătăţii

4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)

5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)

Tabelul 7 Tabel de contingenţă 2 x 2

49

Grafice

Există două categorii de moduri grafice sub care se pot prezenta datele

1 Ilustraţii şi fotografii

2 Grafice

1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă

pentru lucrare

2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit

Putem vorbi despre mai multe tipuri de grafice

bull Grafice pentru reprezentarea datelor cantitative

1048707 Grafic cartezian (X Y)

1048707 Histograma

1048707 Poligonul de frecvenţe

1048707 Diagrama bdquoscatterrdquo

bull Grafice pentru reprezentarea datelor calitative

1048707 Grafic cu bare

1048707 Diagrama tip bdquoboxplotrdquo

1048707 Diagrama bdquopierdquo

1048707 Cartograma

Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi

dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)

Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)

Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie

Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)

Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)

50

Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir

de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele

două variabile studiate (Figura 6)

Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2

(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2

rămacircne aproximativ constantă)

Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea

comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea

comparativă a mai multor variabile

Figura 7 Grafic calitativ cu bare

51

Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo

Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două

posibilităţi reprezentate grafic este mai frecventă (Figura 8)

Figura 8 Reprezentare tip bdquopierdquo

Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli

sau a oricărui element comparativ Se foloseşte de epidemiologi

Rezultate

Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare

Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o

manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu

explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția

bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la

ilustraţii tabele grafice

Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi

nici rezultatele care invalidează eventual ipoteza

Discuţii

Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd

cultura ştiinţifică şi inteligenţa autorilor

Acest capitol răspunde la trei obiective

Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia

calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de

selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează

rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv

52

este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn

care a fost abordată problema fără a face o revistă a literaturii

Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea

rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul

Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor

afirmaţii nesusţinute de conţinutul lucrării

Concluzii

Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate

să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie

Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de

concluzii va scădea valoarea lucrării

Bibliografia (lista referinţelor citarea icircn text)

Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn

lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente

Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli

- să conţină cele mai importante şi recente lucrări

- să includă numai lucrări publicate

- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate

Bibliografie

Elisabeta Jaba ndash Statistică Ed Economică 1998

Mihai Ţarcă ndash Statistică volI Ed UAIC 1979

Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale

Ed University Press 2009

Sorana Daniela Bolboacă ndash Metodologia cercetării curs

53

Page 18: cercetarea medicala - metodologie

3 De asimetrie (skewness) indică distribuţia datelor dacă sunt sau nu distribuite normal

4 De boltire (kurtosis) estimează boltirea sau aplatizarea curbei de distribuţie

Prezentarea descriptivă a datelor se face prin icircnregistrarea datelor culese icircn tabele care să reprezinte icircn mod

sintetic valorile măsurate

Icircn concluzie statistica descriptivă permite

bull Stabilirea comparabilităţii icircntre grupurile de studiu şi aprecierea prezenţei erorilor sau confuziei

bull Reprezentarea datelor icircn tabele permite evaluarea fiecărui pacient şi dacă a existat pierderi din studiu

Statistica inferenţială

Statistica inferenţială (inductivă) este partea de analiză a datelor care permite extrapolarea unei

concluzii trase pe baza unui eşantion spre populaţia ţintă pentru care a fost efectuat studiul

Scopul analizei statistice este de a evidenţia efectul unui tratament sau al unui factor de risc prin date obţinute

din eşantionul studiat spre populaţia ţintă Aceasta implică testarea ipotezelor statistice sau altfel spus testarea

semnificaţiei statistice Este una dintre cele mai importante momente ale studiului Cum rezultatele sunt

obţinute prin studiul unui eşantion există posibilitatea ca acestea să fie datorate icircntacircmplării Testele

statistice ne ajută să apreciem icircn ce măsură rezultatele sunt icircntacircmplătoare şi mai ales icircn ce măsură şi dacă se

pot aplica populaţiei generale Icircn acest scop se impune o valoare limită alfa 005 care reprezintă limita

superioară a probabilităţii ca rezultatul obţinut să fie greşit (datorat icircntacircmplării) Astfel icircn funcţie de tipul

variabilelor şi indicatorii descriptivi aplicaţi şi evaluaţi se aplică teste de semnificaţie statistică (Tabelul 1)

Tabelul 1 Alegerea testelor de semnificaţie statistică

Tipul datelor

18

Diferenţierea variabilelor din punctul de vedere a distribuţiei se face folosind testul de normalitate

Kolmogorov ndash Smirnov

Testul statistic reprezintă metoda de comparaţie a două sau mai multe populaţii prin intermediul unor

variabile observate ale lor

Scopul unui test statistic este de a defini realitatea

Definirea icircntrebării de cercetare (ipoteza clinică)

Tratamentul cu Nebivolol este la fel de eficient ca şi cel cu Valsartan icircn tratamentul

hipertensiunii arteriale

Transpunerea icircntrebării de cercetare icircn termeni statistici (ipoteza statistică)

Media tensiunii arteriale a pacienţilor trataţi cu Valsartan nu diferă semnificativ de media

tensiunii arteriale a pacienţilor trataţi cu Nebivolol

Etapele unui test statistic

1 Formularea problemei icircn termenii ipotezelor statistice

2 Alegerea şi calcularea parametrului statistic al testului

3 Regiunea critică

4 Concluzia testului

1 Formularea problemei icircn termenii ipotezelor statistice

Ipoteza nulă ipoteza care trebuie testată testul efectuacircndu-se sub prezumţia că ipoteza nulă ar

fi adevărată

Ipoteza alternativă acea ipoteză care icircntr-un sens sau altul contrazice ipoteza nulă Această

ipoteză se mai numeşte şi ipoteza de lucru

Ipoteza nulă tipuri

O coadă (ldquoone-tailedrdquo sau ldquoone-siderdquo)

Media este mai mare

Media este mai mică

Două cozi (ldquoone-tailedrdquo sau ldquoone-siderdquo)

Media este egală

2 Alegerea şi calcularea parametrului statistic al testului

Parametrul statistic al testului exprimă icircntr-o anumită formă diferenţa dintre elementele comparate

Ţinacircnd seama de faptul că eşantionul sau eşantioanele utilizate sunt aleator extrase din populaţiile care

fac obiectul testului parametrul statistic este o variabilă aleatoare de selecţie care urmează o anumită

lege de probabilitate

Un parametru statistic al testului bun trebuie să icircndeplinească două condiţii

19

Trebuie să se comporte diferit atunci cacircnd ipoteza nulă H0 este adevărată faţă de situaţia icircn

care ipoteza alternativă H1 este adevărată

Distribuţia de probabilitate a parametrului statistic al testului sub prezumţia că H0 este

adevărată este cunoscută

3 Regiunea critică

- Trebuie să fim capabili să decidem icircn funcţie de valoarea parametrului statistic calculat care dintre

ipoteze cea nulă sau cea alternativă este adevărată

- Dacă valoarea parametrului statistic aparţine regiunii critice ipoteza nulă H0 va fi respinsă şi va fi

acceptată ipoteza alternativă H1

- Dacă valoarea parametrului statistic nu aparţine regiunii critice ipoteza nulă H0 va fi acceptată

- Decidem mărimea regiunii critice

Pentru aceasta trebuie să specificăm mărimea riscului de eroare pe care icircl acceptăm

Pe scurt definim nivelul de semnificaţie notat cu a sau mărimea riscului pe care

suntem dispuşi să ni-l asumăm icircn respingerea ipotezei nule H0 icircn cazul icircn care aceasta

este adevărată De obicei se alege un nivel de semnificaţie icircntre 1 şi 5

Probabilitatea unei erori de tipul I

probabilitatea de respingere a ipotezei nule H0 icircn favoarea ipotezei alternative H1 icircn

condiţiile icircn care H0 este adevărată

probabilitatea unei erori de tipul I se notează cu a şi se mai numeşte nivel de

semnificaţie al testului

Probabilitatea unei erori de tipul II

probabilitatea acceptării ipotezei nule icircn condiţiile icircn care ipoteza alternativă H1 este

adevărată

această probabilitate se notează cu b

- Unilaterală la dreapta ndash valoarea parametrului statistic al testului este mai mare sau egală cu

valoarea din dreapta a intervalului critic

- Unilaterală la stacircnga ndash valoarea parametrului statistic al testului este mai mică sau egală cu

valoarea din stacircnga a intervalului critic

- Bilaterală ndash valoarea parametrului statistic al testului este mai mică sau egală cu valoarea extremă

din stacircnga regiunii critice sau mai mare sau egală cu valoarea extremă din dreapta regiunii critice

valorile extreme ale regiunii critice avacircnd nivele egale de semnificaţie

4 Concluzia testului

- Ipoteza nulă H0 este respinsă dacă valoarea parametrului statistic aparţine regiunii critice

20

- Regiunea critică trebuie astfel aleasă icircncacirct dacă ipoteza alternativă H1 este adevărată

probabilitatea de respingere a ipotezei nule H0 este mai mare decacirct icircn cazul icircn care ipoteza nulă H0

ar fi adevărată

- Acceptarea ipotezei nule H0 atunci cacircnd ipoteza alternativă H1 este adevărată este cunoscută ca şi

eroarea de tipul II

a probabilitatea ei se notează cu b

b măsoară bdquonivelul de eroarerdquo

- Icircn testarea oricărei ipoteze statistice există patru situaţii care determină dacă decizia noastră este

corectă sau nu

Cazuri

H0 este adevărată H0 este falsă

Concluzie H0 se acceptă decizie corectă eroare de tipul

II

H0 se

respinge

eroare de tipul I decizie corectă

Luarea deciziei pe baza valorii probabilităţii p de semnificaţie a testului

Icircn momentul icircn care prelucrăm statistic o serie de date dorim să ştim dacă rezultatele obţinute sunt sau

nu semnificative statistic

Răspunsul la această icircntrebare este dat de valoarea lui p calculată de orice program statistic la

prelucrarea unor date

Icircn cazul testelor statistice ipoteza nulă este respinsă dacă nivelul de semnificaţie este mai mic decacirct

005 iar programele de prelucrare statistică a datelor vor afişa o steluţă () icircn tabelul rezultatelor

21

Dacă p le 005 respingem ipoteza nulă şi acceptăm ipoteza alternativă (am obţinut semnificaţia

statistică)

Dacă p gt 005 acceptăm ipoteza nulă (nu am obţinut semnificaţia statistică)

p = 013

NU respingem ipoteza nulă

Risc de eroare de tip II

α = 005

p = 002

Respingem ipoteza nulă

Risc de eroare de tip I

Semnificaţia lui p

Criteriu de luare a deciziei cu privire la o ipoteză statistică nulă

Cuantifică şansa ca o decizie de respingere a ipotezei nule să fie greşită

Măsură a semnificaţiei statistice şi NU CLINICĂ

22

Semnificaţia lui p (reguli empirice)

001 le p lt 005 rezultatul e semnificativ statistic

0001 le p lt 001 rezultatul e icircnalt semnificativ statistic

p lt 0001 rezultatul e foarte icircnalt semnificativ statistic

p ge 005 rezultatul e considerat nesemnificativ statistic

Limite ale valorii p

Valoarea p NU ne dă informaţii despre

Şansa de beneficiu a unui pacient individual

Procentul de pacienţi care vor avea un beneficiu icircn urma instituirii procedurii medicale

Gradul de beneficiu expectat pentru un anumit pacient

Puterea unui test statistic

Este capacitatea de a detecta o diferenţă acolo unde există

Creşterea volumului eşantionului determină creşterea puterii testului statistic aplicat

Valoarea este icircn relaţie directă cu eroarea de tip II

Puterea = 1 ndash β

Cea mai utilizată modalitate de creştere a puterii unui test statistic este de a creşte volumul

eşantionului

Tipul scalei de măsură ndash testul statistic

Denumire test Interval Nominal Observaţii

Corelaţie Pearson 2 0 Există o relaţie liniară

χ2 0 2

Student 1 1 Doar 2 grupuri

ANOVA 1 1 2 sau mai multe grupuri

Student perechi 1 1 Eşantioane perechi

Măsurători repetate (ANOVA) 1 1 Mai mult de 2 grupuri date

perechi

Inferenţa statistică pe date calitativ e

Tabela de contingenţă 2times2

Riscuri şi raţii

Testul χ2 (testarea asocierii icircn tabela de contingenţă)

Testul Fisher

23

Testul z pentru proporţii

Testul McNemar

Tabela de contingenţă 2times2

Scale de tip nominal (dicotomiale tabela de contingenţă de 2times2) sau ordinal (tabela de contingenţă de

rtimesc)

Frecvenţa absolută (numărul de evenimente per categorie)

Tabela de contingenţă de 2times2 4 categorii

AP = adevărat pozitiv

FP = fals pozitiv

FN = fals negativ

AN = adevărat negativ

Ulcer deschis Ulcer vindecat Total

Recurenţă + AP = 1 FP = 5 = 1+5 = 6

Recurenţă - FN = 7 AN = 16 = 7+16 = 23

Total =1+7=8 =5+16=21 29

Riscuri şi raţii Mărimi ale asocierii

Denumire Formula Definiţie

Rata falşilor pozitivi =FP(FP+AN) Probabilitatea unui test fals + (α)

Rata falşilor negativi =FN(FN+AP) Probabilitatea unui test fals ndash (β)

Sensibilitate =AP(AP+FN) Probabilitatea unui test real + (1- β)

Specificitate =AN(AN+FP) Probabilitatea unui test real ndash (1- α)

Acurateţe =(AP+AN)n Probabilitatea generală a unei decizii corecte

Valoarea predictivă pozitivă =AP(AP+FP) Probabilitatea ca un test pozitiv să fie corect

Valoarea predictivă negativă =AN(AN+FN) Probabilitatea ca un test negativ să fie corect

Riscul relativ =AP(FP+AN)FN(AP+FP)

Rata şansei =(AP∙AN)(FN∙FP)

Riscul atribuabil =AP(AP+FP)-FN(FN+AN)

24

Denumire Formula

Rata falşilor pozitivi = 5(5+1) = 08334

Rata falşilor negativi = 7(7+16) = 03043

Sensibilitate = 1(1+7) = 01250

Specificitate = 16(16+5) = 07619

Acurateţe = (1+16)29 = 05862

Valoarea predictivă pozitivă = 1(1+5) = 01667

Valoarea predictivă negativă = 16(16+7) = 06957

Riscul relativ = 1(5+16)7(1+5) = 2142 = 050

Rata şansei = (1∙16)(7∙5) = 04571

Riscul atribuabil = 1(1+5)-7(7+16) = 01667-03043=-01376

Testarea asocierii icircn tabela de contingenţă

Testul χ2

Nu trebuie utilizat pentru eşantioane de volum mic

Testul este valid doar dacă valoarea expectată (aşteptată) pentru fiecare celulă este cel puţin

egală cu 1 şi frecvenţa absolută observată este de minim 5

Dacă aceste condiţii nu sunt icircndeplinite se aplică testul exact al lui Fisher (Fisherrsquos Exact Test)

Indică dacă cele două variabile sunt sau nu independente DAR NU cuantifică puterea asocierii

dintre ele

Problema S-a investigat icircntr-un studiu asocierea dintre obezitatea (ca factor de risc) şi bolile

cardio-vasculare la persoanele icircn etate (gt 60 ani) Din totalul de 620 persoane investigate s-au

identificat 150 persoane cu obezitate şi boală cardio-vasculară 230 persoane fără obezitate şi

fără boală cardio-vasculară şi 60 persoane fără obezitate dar cu boală cardio-vasculară Există

o asociere icircntre obezitate şi boala cardio-vasculară (df=1 α=005 χ2critic = 384)

Testul χ2 exemplu

H025

Nu există asociere icircntre obezitate şi bolile cardio-vasculare

Obezitatea şi bolile cardio-vasculare sunt independente

H1

Există asociere icircntre obezitate şi bolile cardio-vasculare

Obezitatea şi bolile cardio-vasculare sunt asociate

a = 005 pragul de semnificaţie al testului

urmează o lege cu (r-1)(c-1) grade de libertate

χ2 = parametrul testului χ2

fio = frecvenţa observată

fit = frecvenţa teoretică

Regiunea critică este [χα2 yen)

Pentru α = 005 χα2 = 384

OBSERVAT BCV+ BCV- Total

Obezitate + AP = 150 FP = 180 330

Obezitate - FN = 60 AN = 230 290

Total 210 410 620

TEORETIC BCV+ BCV- Total

Obezitate + = 330times210620 = 330times410620 330

Obezitate - = 290times210620 = 290times410620 290

Total 210 410 620

TEORETIC BCV+ BCV- Total

Obezitate + = 330times210620 = 330times410620 330

26

Obezitate - = 290times210620 = 290times410620 290

Total 210 410 620

TEORETIC BCV+ BCV-

Obezitate + = 112 = 218

Obezitate - = 98 = 192

Deoarece 4177Icirc[384 yen) se respinge H0 cu un risc de eroare de 5

Există asociere icircntre obezitate şi bolile cardio-vasculare

Testul Fisher

Corecţie a testului χ2

Valoarea p asociată parametrului ne dă probabilitatea ca valoarea observată de independenţă să fie

atribuită doar şansei

O valoare p mică indică că există alte cauze decacirct şansa influenţează rezultatul şi astfel cele două

variabile investigate nu sunt independente

Testul Fisher = dispersia corectată a factorului x dispersia corectată a factorilor reziduali

Icircn acest context regula adunării dispersiilor se poate scrie unde

este variaţia lui y pe seama variaţiei variabilei x

este variaţia lui y pe seama influenţei factorilor reziduali (neicircnregistraţi)

este variaţia totală a caracteristicii y

Testul Fisher empiric se calculează după formula

27

se compară cu Ftab pentru nx şi nz grade de libertate la un anumit prag de semnificaţie stabilit

Dacă Fc gt Ftab rezultă că variaţia factorului de grupare x este semnificativă pentru variaţia caracteristicii y

Testul z pentru proporţii

1 Compararea unei frecvenţe observate cu o frecvenţă teoretică

2 Testarea egalităţii a două frecvenţe

Testul z Compararea unei frecvenţe observate cu o frecvenţă teoretică

Scop Investigarea semnificaţiei diferenţei icircntre o frecvenţă teoretică p (icircntr-o populaţie) şi o frecvenţă

observată f pe un eşantion reprezentativ (variabilă calitativă (binare))

Condiţii de aplicare Testul este corect aplicat dacă numărul n al observaţiilor eşantionului este

suficient de mare (n∙p n∙(1-p)gt10

Parametrul

n = volumul eşantionului

Suntem interesaţi de investigarea prevalenţei hepatitei B la personalul care lucrează icircn laboratoarele

clinicilor de boli infecţioase din Transilvania Se ştie din studii anterioare că prevalenţa hepatitei B icircn

populaţia generală din Transilvania este de 9 S-a luat icircn studiu un eşantion de 100 persoane şi s-a

obţinut o prevalenţă a hepatitei B de 6 Există diferenţă semnificativă icircntre frecvenţa hepatitei B la

personalul care lucrează icircn laboratoarele spitalelor de boli infecţioase din Transilvania faţă de

populaţia generală

f = 006 p = 009 n = 100

Ipoteza nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat

faţă de frecvenţa hepatitei B icircn populaţia generală

Ipoteza alternativă test bilateral Există diferenţă semnificativă icircntre frecvenţa hepatitei B la

nivelul eşantionului şi prevalenţa hepatitei B icircn populaţia generală

f = 006 p = 009 n = 100

Pragul de semnificaţie a = 005

Regiunea critică test bilateral (-yen -196 ]Egrave[196 yen)

28

Concluzia testului

Deoarece parametrul statistic calculat al testului nu aparţine regiunii critice se acceptă ipoteza

nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat faţă de

frecvenţa hepatitei B icircn populaţia generală

Testul McNemar

Evaluarea dependenţei variabilelor calitative perechi (dorim să determinăm dacă o anumită

caracteristică este sau nu asociată cu o anumită patologie)

Identificăm n pacienţi care prezintă patologia de interes (eg Cancer bronho-pulmonar) şi n

pacienţi cu aceleaşi caracteristici ca şi primul grup dar care nu o prezintă

Martor = da Martor = nu

Caz = da a b

Caz = nu c d

Testul McNemar - exemplu fumat vs cancer

Martor = da Martor = nu

Cancer = da a = 2 b = 5

Cancer = nu c = 0 d = 3

29

χ2critic(α=005) = 384

32 lt 384 rarr acceptăm ipoteza nulă

Fumatul nu este icircn relaţie cu apariţia cancerului bronho-pulmonar

Inferenţa statistică pe date cantitative

Variabile cantitative continue

Testul z şi Student (t) (o medie sau medii perechi)

Testul z şi Student (t) (testarea a două medii)

ANOVA (ge 3 medii)

Ranguri (variabile cantitative discrete sau cantitative care nu icircndeplinesc condiţia de

normalitate)

Testul sumei rangurilor Wilcoxon

Kruskal-Wallis (ge 3 eşantioane independente)

Friedman (ge 3 eşantioane dependente)

Teste de normalitate variabile cantitative continue

Shapiro-Wilk

Kolmogorov-Smirnov

Shapiro-Wilk

Chi-Square Goodness-of-Fit

Dacă datele urmează o distribuţie normală aplicăm un test parametric

Dacă datele nu urmează o distribuţie normală aplicăm un test de comparare al rangurilor

30

Testul Z de comparare a mediei unui eşantion cu media unei populaţii

Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ

extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie

s2 care se cunoaşte

Condiţii de aplicare

1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru

compararea mediei unui eşantion cu media unei populaţii)

2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal

distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă

3 Talia eşantionului este mare ( ge 30)

Ipoteze

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media

eşantionului şi media populaţiei

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

(-yen -196 ] Egrave [196 yen)

Parametrul testului

n = volumul eşantionului

= media eşantionului

s = deviaţia standard a populaţiei

Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)

Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard

cunoscută

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi

media standard

Condiţii de aplicare

Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se

realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această

condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea

31

Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai

puternic

Numărul de grade de libertate (df) df = n-1

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

Parametrul testului

n = volumul eşantionului

micro0 = media standard

= media eşantionului

s = deviaţia standard a eşantionului

Testul ANOVA compararea mediilor a mai multe eşantioane

H0 = toate mediile sunt egale

H1 = nu toate mediile sunt egale

Condiţii de aplicare

1 Datele sunt independente unele faţă de celelalte

2 Datele fiecărui grup sunt normal distribuite

3 Deviaţia standard este aceeaşi pentru toate grupurile

Id Medicament

A B C D E F

1 5 6 7 10 5 9

2 6 8 8 11 8 8

3 7 7 9 13 6 7

4 8 9 11 12 4 5

32

5 9 10 10 9 7 6

Suma 35 40 45 55 30 35

Media 7 8 9 11 6 7

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =

= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)

Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2

F = (suma pătratelor(icircntre))(suma pătratelor(icircn))

Suma pătratelor (icircntre) = 16times5 = 80

Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60

Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn

interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare

SP df Media pătratelor F = MPicircntreMPicircn

Icircntre 80 5 = 805 = 16 = 1625 = 64

Icircn 60 24 = 6024 = 25

Total 140 29 -

Testul sumei rangurilor Wilcoxon

Aplicat pentru

Un set de observaţii provenite dintr-o valoare ipotetică comună

Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)

Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero

Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace

Suma rangurilor pentru diferenţele negative = 2+3+1 = 6

Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30

33

Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului

egal cu 8 = 0109

Icircnainte După Diferenţa Rang

64 66 -2 2

66 58 8 5

67 68 -1 3

71 65 6 4

72 75 -3 1

76 67 9 6

78 59 19 8

89 74 15 7

Testul Kruskal-Wallis (ge 3 eşantioane independente)

Test de ranguri aplicate pe mai mult de 3 eşantioane

H = parametrul testului

n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)

Tk = suma rangurilor

Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie

pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni

34

df = k-1 (k = numărul de eşantioane)

df = 3-1 = 2

Hcritic(α=005) = 599

H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie

pozitivă şi respectiv biopsie negativă

Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie

a tipului de studiu pe eşantioane perechi)

1 Definirea numărului de tratamente k

2 Obţinerea rangurilor pentru fiecare tratament

3 Sumarea rangurilor fiecărui tratament

4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)

5 Dacă Fr gt Frcritic rarr respingem H0

Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost

măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi

n = 9 k = 3 T12 = 225 T2

2 = 38025 T32 = 38025

Frcritic = 599

Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de

prostată

35

De reţinut

Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei

Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-

of-Fit

Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z

Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t

Compararea mediilor a 3 sau mai multe eşantioane ANOVA

Compararea mediilor a două populaţii (σ) testul Z

Compararea mediilor a două eşantioane (s) testul t

Compararea mediilor a două eşantioane perechi (s) testul t

ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi

cu cel pentru compararea a două eşantioane perechi

Ranguri

Distribuţia datelor nu are importanţă

Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)

Trei sau mai multe eşantioane Kruskal-Wallis

Trei sau mai multe eşantioane perechi Friedman

Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia

Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a

datelor)

Variabile nominale

Un singur eşantion sau eşantioane perechi

Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte

Eşantioane perechi testul Mc Nemar

Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2

Icircn analiza proporţiilor există teste diferite pentru

Compararea unei frecvenţe cu o frecvenţă cunoscută

Compararea a două frecvenţe

Semnificaţia statistică

Valoarea p (p value)

Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor

două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E

posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării

aleatorii

36

Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală

urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii

Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este

probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un

experiment de dimensiunea acestuia

Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că

diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii

diferite

Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca

fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă

ar fi fost adevărată

Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă

1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe

baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De

fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001

2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie

3 Se aplică testul statistic aferent pentru a calcula valoarea p

4 Se compară valoarea p cu valoarea ndash prag

5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe

semnificativă dpdv statisticrdquo

6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e

semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să

conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă

Teste de semnificaţie

Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului

populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)

Testarea ipotezelor implică posibile erori

Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile

sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui

grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul

icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005

ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există

37

nici o diferenţă

Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ

statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de

ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost

ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau

dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă

cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă

semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe

ipotetice variate icircn cazul icircn care ele există

Măsuri ale frecvenţei

Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)

Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate

Generic formula pe care se bazează toate cele trei este

unde x şi y sunt cantităţile de comparat

Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea

unei frecvenţe pe grupe de sex vacircrstă etc

Proporţia implică icircn mod necesar ca x să fie inclus icircn y

Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară

frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp

Pentru calcularea unei rate trebuie ţinut cont de trei aspecte

bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin

bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp

bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo

Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un

tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei

populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei

aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)

38

Indicatori

Rata de incidenţă

Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă

icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii

Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o

perioadă de timp

Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de

timp x

Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei

susceptibili de a dezvolta icircmbolnăvirea studiată

Numitorul poate fi

bull Numărul mediu al populaţiei icircn perioada de timp studiată

bull Mărimea populaţiei icircn mijlocul perioadei de studiu

bull Mărimea populaţiei la icircnceputul studiului

Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă

Este obligatorie menţionarea perioadei de timp

Prevalenţa

Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la

un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă

schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa

momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)

39

Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include

numai cazuri noi respectiv include cazuri noi şi vechi

Rata de atac

Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este

folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp

raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori

Rata persoană-timp

Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din

momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte

migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost

observate

Riscul relativ (RR)

Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment

legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele

prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două

grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la

bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la

bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai

mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo

Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2

Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn

cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă

(Tabelul 1)

Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR

Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la

neexpuşi

40

Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de

culegere a datelor

Odds ratio (OR)

Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin

raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general

studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)

Tabelul 2 Tabelul 2 x 2 pentru calcularea OR

Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală

Rate de mortalitate

Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp

specificată Există mai multe tipuri de rate de mortalitate

o Mortalitate specifică pe sex

o Mortalitate specifică pe rasă

o Mortalitate specifică pe boală

o Mortalitate neonatală

o Mortalitate postneonatală

o Mortalitate infantilă

o Mortalitate maternă

Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP

41

Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de

viaţă şi vacircrsta la care survine decesul dacă este prematur

Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu

Ani de viaţă pierduţi datorat dizabilităţii

Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt

utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru

cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite

grupuri

Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de

risc şi o boală se folosesc riscul relativ şi odds ratio

35 Analiza şi interpretarea datelor

După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date

trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul

Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor

colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului

studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu

plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde

prezenţa biostatisticianului este necesară

Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu

elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat

iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului

iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate

depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori

testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere

clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza

Interpretarea rezultatelor statistice

Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne

motive (număr mic de date) acceptarea ei să fie falsă

Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine

gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia

ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument

de decizie Intervalul de confidenţă

42

Interpretarea statistica ne interpretarea clinică

Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă

Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice

obţinute pe eşantionul studiat

Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare

Ce interpretăm Rezultatele

personale obţinute icircn urma studiului

care au fost prezentate icircn secţiunea bdquoRezultaterdquo

Explicăm rezultatele obţinute

Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale

Interpretarea trebuie să se realizeze icircn

lumina limitelor studiului

contextul cultural social şi educaţional al locului unde s-a realizat cercetarea

contextul a ceea ce se cunoaşte din literatura de specialitate

Interpretăm doar rezultatele personale obţinute icircn urma studiului

Interpretarea statistică nu este tot una cu interpretarea clinică

Interpretarea statistică este importantă

Interpretarea clinică este foarte importantă

Intervalul de confidenţă

Media calculată pe baza unui eşantion nu va echivala media populaţiei

Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului

Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a

populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a

populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)

pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru

orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare

dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de

confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de

date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de

5

Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel

Dacă valoarea p este mică

Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare

aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o

medie diferită Diferenţa este semnificativă dpdv statistic

43

Icircn continuare

Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa

reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică

pentru a fi interesante din punct de vedere ştiinţific

Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC

oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care

este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a

obţine o concluzie clară

Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o

diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că

datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din

punct de vedere ştiinţific

Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul

detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat

Erorile studiilor medicale

Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura

anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară

caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea

asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri

legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias

Erorile potenţiale icircn studiile epidemiologice

1 Erori icircntacircmplătoare

2 Erori sistematice

3 Confuzia

4 Validitatea

1 Erori icircntacircmplătoare

Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a

parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel

de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot

fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii

(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor

de măsură (eroarea de măsurare)

44

2 Erori sistematice

Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate

care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu

acurateţe mare Acurateţea nu este afectată de mărimea eşantionului

Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de

experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea

dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus

şi greu de cuantificat (consum de alcool personalitate etc)

Principalele tipuri de erori din această categorie sunt

bull Biasul de selecţie

bull Biasul de informaţie

Biasul de selecţie

Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul

trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion

inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale

persoanelor incluse

Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se

ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia

Biasul de informaţie

Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de

instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze

expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere

nesemnificativă sau chiar să nu şi-o amintească de loc

3 Confuzia

Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune

prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este

cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă

de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte

important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor

protector

4 Validitatea

Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă

Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte

estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional

Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă

45

conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se

demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)

Validitatea externă se poate realiza numai dacă studiul este valid intern

Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii

studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de

studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt

laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi

validă din punct de vedere intern)

3 6 Prezentarea rezultatelor

După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite

Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor

icircntr-o formă bdquodigerabilărdquo este necesară

Scopul prezentării datelor

1 Transmiterea concluziilor studiului

a Datele corecte şi importante merită comunicate

b Datele trebuie să confirme sau să infirme ipoteza studiului

c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală

2 Acordarea posibilităţii altor cercetători să aprecieze studiul

a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti

b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor

prezentate

Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru

fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie

statistică

Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de

valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras

(Tabel 3)

Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)

46

Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct

numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor

precum şi prezentarea acestora sub formă inteligibilă

Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care

convin cercetătorului

Prezentarea datelor se poate face

1 Figuri şi tabele icircn articole scrise

2 Figuri şi tabele icircn prezentări orale

3 Figuri şi tabele icircn postere

4 Text scris sau incluse icircn text

5 Site-uri de WEB

Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor

Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie

Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele

exprimacircnd exact ceea ce acestea exprimă

Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate

anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel

să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se

acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca

mai sus sugestive sunt formatele simple şi puţin icircncărcate

Dacă nu există reguli impuse se respectă

1 Mesaj simplu fără falsificarea datelor

2 De obicei este necesar atacirct tabelul cacirct şi graficul

3 Să fie simplu şi clar

Tabele

Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile

coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică

elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de

1 Se folosesc doar linii orizontale

2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn

evidenţi prin linie de separare (Tabelul 4)

Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland

Noua Zeelandă)

(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)

47

3 Numerele sunt aliniate icircn funcţie de virgulă

4 Indicii statistici sunt explicaţi sub tabel

5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană

6 Abrevierile pot fi folosite

7 Numărul de zecimale trebuie limitat la maxim două

8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel

9 Plasarea legendei este obligatorie sub tabel

10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)

Icircn cazul prezentărilor orale sau a posterelor este indicat ca

1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării

2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte

3 Folosirea de simboluri este permisă

Clasificarea tabelelor

Tabelele se clasifică după

i) conţinut

bull cu distribuţii de frecvenţe

bull de clase de frecvenţe

bull de contingenţă

ii) structura

bull cu doua coloane

bull cu subclasificări

bull ldquomasterrdquo

Tabele ce conţin distribuţii de frecvenţe

O modalitate comodă de a prezenta o mulţime de date brute este

1 Se ordonează datele in ordine crescătoare

2 Se determine frecvenţa fiecărei valori

3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane

(Tabelul 5)

Tabelul 5 Distribuţii de frecvenţă absolută

48

Tabelul claselor de frecvenţe

1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă

2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)

Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)

Tabele de contingenţă

1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a

tabelelor de contingenţă

2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a

combinaţiilor de perechi ordonate de valori

3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre

a factor de risc si

b starea sănătăţii

4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)

5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)

Tabelul 7 Tabel de contingenţă 2 x 2

49

Grafice

Există două categorii de moduri grafice sub care se pot prezenta datele

1 Ilustraţii şi fotografii

2 Grafice

1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă

pentru lucrare

2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit

Putem vorbi despre mai multe tipuri de grafice

bull Grafice pentru reprezentarea datelor cantitative

1048707 Grafic cartezian (X Y)

1048707 Histograma

1048707 Poligonul de frecvenţe

1048707 Diagrama bdquoscatterrdquo

bull Grafice pentru reprezentarea datelor calitative

1048707 Grafic cu bare

1048707 Diagrama tip bdquoboxplotrdquo

1048707 Diagrama bdquopierdquo

1048707 Cartograma

Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi

dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)

Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)

Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie

Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)

Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)

50

Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir

de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele

două variabile studiate (Figura 6)

Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2

(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2

rămacircne aproximativ constantă)

Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea

comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea

comparativă a mai multor variabile

Figura 7 Grafic calitativ cu bare

51

Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo

Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două

posibilităţi reprezentate grafic este mai frecventă (Figura 8)

Figura 8 Reprezentare tip bdquopierdquo

Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli

sau a oricărui element comparativ Se foloseşte de epidemiologi

Rezultate

Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare

Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o

manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu

explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția

bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la

ilustraţii tabele grafice

Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi

nici rezultatele care invalidează eventual ipoteza

Discuţii

Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd

cultura ştiinţifică şi inteligenţa autorilor

Acest capitol răspunde la trei obiective

Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia

calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de

selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează

rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv

52

este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn

care a fost abordată problema fără a face o revistă a literaturii

Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea

rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul

Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor

afirmaţii nesusţinute de conţinutul lucrării

Concluzii

Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate

să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie

Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de

concluzii va scădea valoarea lucrării

Bibliografia (lista referinţelor citarea icircn text)

Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn

lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente

Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli

- să conţină cele mai importante şi recente lucrări

- să includă numai lucrări publicate

- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate

Bibliografie

Elisabeta Jaba ndash Statistică Ed Economică 1998

Mihai Ţarcă ndash Statistică volI Ed UAIC 1979

Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale

Ed University Press 2009

Sorana Daniela Bolboacă ndash Metodologia cercetării curs

53

Page 19: cercetarea medicala - metodologie

Diferenţierea variabilelor din punctul de vedere a distribuţiei se face folosind testul de normalitate

Kolmogorov ndash Smirnov

Testul statistic reprezintă metoda de comparaţie a două sau mai multe populaţii prin intermediul unor

variabile observate ale lor

Scopul unui test statistic este de a defini realitatea

Definirea icircntrebării de cercetare (ipoteza clinică)

Tratamentul cu Nebivolol este la fel de eficient ca şi cel cu Valsartan icircn tratamentul

hipertensiunii arteriale

Transpunerea icircntrebării de cercetare icircn termeni statistici (ipoteza statistică)

Media tensiunii arteriale a pacienţilor trataţi cu Valsartan nu diferă semnificativ de media

tensiunii arteriale a pacienţilor trataţi cu Nebivolol

Etapele unui test statistic

1 Formularea problemei icircn termenii ipotezelor statistice

2 Alegerea şi calcularea parametrului statistic al testului

3 Regiunea critică

4 Concluzia testului

1 Formularea problemei icircn termenii ipotezelor statistice

Ipoteza nulă ipoteza care trebuie testată testul efectuacircndu-se sub prezumţia că ipoteza nulă ar

fi adevărată

Ipoteza alternativă acea ipoteză care icircntr-un sens sau altul contrazice ipoteza nulă Această

ipoteză se mai numeşte şi ipoteza de lucru

Ipoteza nulă tipuri

O coadă (ldquoone-tailedrdquo sau ldquoone-siderdquo)

Media este mai mare

Media este mai mică

Două cozi (ldquoone-tailedrdquo sau ldquoone-siderdquo)

Media este egală

2 Alegerea şi calcularea parametrului statistic al testului

Parametrul statistic al testului exprimă icircntr-o anumită formă diferenţa dintre elementele comparate

Ţinacircnd seama de faptul că eşantionul sau eşantioanele utilizate sunt aleator extrase din populaţiile care

fac obiectul testului parametrul statistic este o variabilă aleatoare de selecţie care urmează o anumită

lege de probabilitate

Un parametru statistic al testului bun trebuie să icircndeplinească două condiţii

19

Trebuie să se comporte diferit atunci cacircnd ipoteza nulă H0 este adevărată faţă de situaţia icircn

care ipoteza alternativă H1 este adevărată

Distribuţia de probabilitate a parametrului statistic al testului sub prezumţia că H0 este

adevărată este cunoscută

3 Regiunea critică

- Trebuie să fim capabili să decidem icircn funcţie de valoarea parametrului statistic calculat care dintre

ipoteze cea nulă sau cea alternativă este adevărată

- Dacă valoarea parametrului statistic aparţine regiunii critice ipoteza nulă H0 va fi respinsă şi va fi

acceptată ipoteza alternativă H1

- Dacă valoarea parametrului statistic nu aparţine regiunii critice ipoteza nulă H0 va fi acceptată

- Decidem mărimea regiunii critice

Pentru aceasta trebuie să specificăm mărimea riscului de eroare pe care icircl acceptăm

Pe scurt definim nivelul de semnificaţie notat cu a sau mărimea riscului pe care

suntem dispuşi să ni-l asumăm icircn respingerea ipotezei nule H0 icircn cazul icircn care aceasta

este adevărată De obicei se alege un nivel de semnificaţie icircntre 1 şi 5

Probabilitatea unei erori de tipul I

probabilitatea de respingere a ipotezei nule H0 icircn favoarea ipotezei alternative H1 icircn

condiţiile icircn care H0 este adevărată

probabilitatea unei erori de tipul I se notează cu a şi se mai numeşte nivel de

semnificaţie al testului

Probabilitatea unei erori de tipul II

probabilitatea acceptării ipotezei nule icircn condiţiile icircn care ipoteza alternativă H1 este

adevărată

această probabilitate se notează cu b

- Unilaterală la dreapta ndash valoarea parametrului statistic al testului este mai mare sau egală cu

valoarea din dreapta a intervalului critic

- Unilaterală la stacircnga ndash valoarea parametrului statistic al testului este mai mică sau egală cu

valoarea din stacircnga a intervalului critic

- Bilaterală ndash valoarea parametrului statistic al testului este mai mică sau egală cu valoarea extremă

din stacircnga regiunii critice sau mai mare sau egală cu valoarea extremă din dreapta regiunii critice

valorile extreme ale regiunii critice avacircnd nivele egale de semnificaţie

4 Concluzia testului

- Ipoteza nulă H0 este respinsă dacă valoarea parametrului statistic aparţine regiunii critice

20

- Regiunea critică trebuie astfel aleasă icircncacirct dacă ipoteza alternativă H1 este adevărată

probabilitatea de respingere a ipotezei nule H0 este mai mare decacirct icircn cazul icircn care ipoteza nulă H0

ar fi adevărată

- Acceptarea ipotezei nule H0 atunci cacircnd ipoteza alternativă H1 este adevărată este cunoscută ca şi

eroarea de tipul II

a probabilitatea ei se notează cu b

b măsoară bdquonivelul de eroarerdquo

- Icircn testarea oricărei ipoteze statistice există patru situaţii care determină dacă decizia noastră este

corectă sau nu

Cazuri

H0 este adevărată H0 este falsă

Concluzie H0 se acceptă decizie corectă eroare de tipul

II

H0 se

respinge

eroare de tipul I decizie corectă

Luarea deciziei pe baza valorii probabilităţii p de semnificaţie a testului

Icircn momentul icircn care prelucrăm statistic o serie de date dorim să ştim dacă rezultatele obţinute sunt sau

nu semnificative statistic

Răspunsul la această icircntrebare este dat de valoarea lui p calculată de orice program statistic la

prelucrarea unor date

Icircn cazul testelor statistice ipoteza nulă este respinsă dacă nivelul de semnificaţie este mai mic decacirct

005 iar programele de prelucrare statistică a datelor vor afişa o steluţă () icircn tabelul rezultatelor

21

Dacă p le 005 respingem ipoteza nulă şi acceptăm ipoteza alternativă (am obţinut semnificaţia

statistică)

Dacă p gt 005 acceptăm ipoteza nulă (nu am obţinut semnificaţia statistică)

p = 013

NU respingem ipoteza nulă

Risc de eroare de tip II

α = 005

p = 002

Respingem ipoteza nulă

Risc de eroare de tip I

Semnificaţia lui p

Criteriu de luare a deciziei cu privire la o ipoteză statistică nulă

Cuantifică şansa ca o decizie de respingere a ipotezei nule să fie greşită

Măsură a semnificaţiei statistice şi NU CLINICĂ

22

Semnificaţia lui p (reguli empirice)

001 le p lt 005 rezultatul e semnificativ statistic

0001 le p lt 001 rezultatul e icircnalt semnificativ statistic

p lt 0001 rezultatul e foarte icircnalt semnificativ statistic

p ge 005 rezultatul e considerat nesemnificativ statistic

Limite ale valorii p

Valoarea p NU ne dă informaţii despre

Şansa de beneficiu a unui pacient individual

Procentul de pacienţi care vor avea un beneficiu icircn urma instituirii procedurii medicale

Gradul de beneficiu expectat pentru un anumit pacient

Puterea unui test statistic

Este capacitatea de a detecta o diferenţă acolo unde există

Creşterea volumului eşantionului determină creşterea puterii testului statistic aplicat

Valoarea este icircn relaţie directă cu eroarea de tip II

Puterea = 1 ndash β

Cea mai utilizată modalitate de creştere a puterii unui test statistic este de a creşte volumul

eşantionului

Tipul scalei de măsură ndash testul statistic

Denumire test Interval Nominal Observaţii

Corelaţie Pearson 2 0 Există o relaţie liniară

χ2 0 2

Student 1 1 Doar 2 grupuri

ANOVA 1 1 2 sau mai multe grupuri

Student perechi 1 1 Eşantioane perechi

Măsurători repetate (ANOVA) 1 1 Mai mult de 2 grupuri date

perechi

Inferenţa statistică pe date calitativ e

Tabela de contingenţă 2times2

Riscuri şi raţii

Testul χ2 (testarea asocierii icircn tabela de contingenţă)

Testul Fisher

23

Testul z pentru proporţii

Testul McNemar

Tabela de contingenţă 2times2

Scale de tip nominal (dicotomiale tabela de contingenţă de 2times2) sau ordinal (tabela de contingenţă de

rtimesc)

Frecvenţa absolută (numărul de evenimente per categorie)

Tabela de contingenţă de 2times2 4 categorii

AP = adevărat pozitiv

FP = fals pozitiv

FN = fals negativ

AN = adevărat negativ

Ulcer deschis Ulcer vindecat Total

Recurenţă + AP = 1 FP = 5 = 1+5 = 6

Recurenţă - FN = 7 AN = 16 = 7+16 = 23

Total =1+7=8 =5+16=21 29

Riscuri şi raţii Mărimi ale asocierii

Denumire Formula Definiţie

Rata falşilor pozitivi =FP(FP+AN) Probabilitatea unui test fals + (α)

Rata falşilor negativi =FN(FN+AP) Probabilitatea unui test fals ndash (β)

Sensibilitate =AP(AP+FN) Probabilitatea unui test real + (1- β)

Specificitate =AN(AN+FP) Probabilitatea unui test real ndash (1- α)

Acurateţe =(AP+AN)n Probabilitatea generală a unei decizii corecte

Valoarea predictivă pozitivă =AP(AP+FP) Probabilitatea ca un test pozitiv să fie corect

Valoarea predictivă negativă =AN(AN+FN) Probabilitatea ca un test negativ să fie corect

Riscul relativ =AP(FP+AN)FN(AP+FP)

Rata şansei =(AP∙AN)(FN∙FP)

Riscul atribuabil =AP(AP+FP)-FN(FN+AN)

24

Denumire Formula

Rata falşilor pozitivi = 5(5+1) = 08334

Rata falşilor negativi = 7(7+16) = 03043

Sensibilitate = 1(1+7) = 01250

Specificitate = 16(16+5) = 07619

Acurateţe = (1+16)29 = 05862

Valoarea predictivă pozitivă = 1(1+5) = 01667

Valoarea predictivă negativă = 16(16+7) = 06957

Riscul relativ = 1(5+16)7(1+5) = 2142 = 050

Rata şansei = (1∙16)(7∙5) = 04571

Riscul atribuabil = 1(1+5)-7(7+16) = 01667-03043=-01376

Testarea asocierii icircn tabela de contingenţă

Testul χ2

Nu trebuie utilizat pentru eşantioane de volum mic

Testul este valid doar dacă valoarea expectată (aşteptată) pentru fiecare celulă este cel puţin

egală cu 1 şi frecvenţa absolută observată este de minim 5

Dacă aceste condiţii nu sunt icircndeplinite se aplică testul exact al lui Fisher (Fisherrsquos Exact Test)

Indică dacă cele două variabile sunt sau nu independente DAR NU cuantifică puterea asocierii

dintre ele

Problema S-a investigat icircntr-un studiu asocierea dintre obezitatea (ca factor de risc) şi bolile

cardio-vasculare la persoanele icircn etate (gt 60 ani) Din totalul de 620 persoane investigate s-au

identificat 150 persoane cu obezitate şi boală cardio-vasculară 230 persoane fără obezitate şi

fără boală cardio-vasculară şi 60 persoane fără obezitate dar cu boală cardio-vasculară Există

o asociere icircntre obezitate şi boala cardio-vasculară (df=1 α=005 χ2critic = 384)

Testul χ2 exemplu

H025

Nu există asociere icircntre obezitate şi bolile cardio-vasculare

Obezitatea şi bolile cardio-vasculare sunt independente

H1

Există asociere icircntre obezitate şi bolile cardio-vasculare

Obezitatea şi bolile cardio-vasculare sunt asociate

a = 005 pragul de semnificaţie al testului

urmează o lege cu (r-1)(c-1) grade de libertate

χ2 = parametrul testului χ2

fio = frecvenţa observată

fit = frecvenţa teoretică

Regiunea critică este [χα2 yen)

Pentru α = 005 χα2 = 384

OBSERVAT BCV+ BCV- Total

Obezitate + AP = 150 FP = 180 330

Obezitate - FN = 60 AN = 230 290

Total 210 410 620

TEORETIC BCV+ BCV- Total

Obezitate + = 330times210620 = 330times410620 330

Obezitate - = 290times210620 = 290times410620 290

Total 210 410 620

TEORETIC BCV+ BCV- Total

Obezitate + = 330times210620 = 330times410620 330

26

Obezitate - = 290times210620 = 290times410620 290

Total 210 410 620

TEORETIC BCV+ BCV-

Obezitate + = 112 = 218

Obezitate - = 98 = 192

Deoarece 4177Icirc[384 yen) se respinge H0 cu un risc de eroare de 5

Există asociere icircntre obezitate şi bolile cardio-vasculare

Testul Fisher

Corecţie a testului χ2

Valoarea p asociată parametrului ne dă probabilitatea ca valoarea observată de independenţă să fie

atribuită doar şansei

O valoare p mică indică că există alte cauze decacirct şansa influenţează rezultatul şi astfel cele două

variabile investigate nu sunt independente

Testul Fisher = dispersia corectată a factorului x dispersia corectată a factorilor reziduali

Icircn acest context regula adunării dispersiilor se poate scrie unde

este variaţia lui y pe seama variaţiei variabilei x

este variaţia lui y pe seama influenţei factorilor reziduali (neicircnregistraţi)

este variaţia totală a caracteristicii y

Testul Fisher empiric se calculează după formula

27

se compară cu Ftab pentru nx şi nz grade de libertate la un anumit prag de semnificaţie stabilit

Dacă Fc gt Ftab rezultă că variaţia factorului de grupare x este semnificativă pentru variaţia caracteristicii y

Testul z pentru proporţii

1 Compararea unei frecvenţe observate cu o frecvenţă teoretică

2 Testarea egalităţii a două frecvenţe

Testul z Compararea unei frecvenţe observate cu o frecvenţă teoretică

Scop Investigarea semnificaţiei diferenţei icircntre o frecvenţă teoretică p (icircntr-o populaţie) şi o frecvenţă

observată f pe un eşantion reprezentativ (variabilă calitativă (binare))

Condiţii de aplicare Testul este corect aplicat dacă numărul n al observaţiilor eşantionului este

suficient de mare (n∙p n∙(1-p)gt10

Parametrul

n = volumul eşantionului

Suntem interesaţi de investigarea prevalenţei hepatitei B la personalul care lucrează icircn laboratoarele

clinicilor de boli infecţioase din Transilvania Se ştie din studii anterioare că prevalenţa hepatitei B icircn

populaţia generală din Transilvania este de 9 S-a luat icircn studiu un eşantion de 100 persoane şi s-a

obţinut o prevalenţă a hepatitei B de 6 Există diferenţă semnificativă icircntre frecvenţa hepatitei B la

personalul care lucrează icircn laboratoarele spitalelor de boli infecţioase din Transilvania faţă de

populaţia generală

f = 006 p = 009 n = 100

Ipoteza nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat

faţă de frecvenţa hepatitei B icircn populaţia generală

Ipoteza alternativă test bilateral Există diferenţă semnificativă icircntre frecvenţa hepatitei B la

nivelul eşantionului şi prevalenţa hepatitei B icircn populaţia generală

f = 006 p = 009 n = 100

Pragul de semnificaţie a = 005

Regiunea critică test bilateral (-yen -196 ]Egrave[196 yen)

28

Concluzia testului

Deoarece parametrul statistic calculat al testului nu aparţine regiunii critice se acceptă ipoteza

nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat faţă de

frecvenţa hepatitei B icircn populaţia generală

Testul McNemar

Evaluarea dependenţei variabilelor calitative perechi (dorim să determinăm dacă o anumită

caracteristică este sau nu asociată cu o anumită patologie)

Identificăm n pacienţi care prezintă patologia de interes (eg Cancer bronho-pulmonar) şi n

pacienţi cu aceleaşi caracteristici ca şi primul grup dar care nu o prezintă

Martor = da Martor = nu

Caz = da a b

Caz = nu c d

Testul McNemar - exemplu fumat vs cancer

Martor = da Martor = nu

Cancer = da a = 2 b = 5

Cancer = nu c = 0 d = 3

29

χ2critic(α=005) = 384

32 lt 384 rarr acceptăm ipoteza nulă

Fumatul nu este icircn relaţie cu apariţia cancerului bronho-pulmonar

Inferenţa statistică pe date cantitative

Variabile cantitative continue

Testul z şi Student (t) (o medie sau medii perechi)

Testul z şi Student (t) (testarea a două medii)

ANOVA (ge 3 medii)

Ranguri (variabile cantitative discrete sau cantitative care nu icircndeplinesc condiţia de

normalitate)

Testul sumei rangurilor Wilcoxon

Kruskal-Wallis (ge 3 eşantioane independente)

Friedman (ge 3 eşantioane dependente)

Teste de normalitate variabile cantitative continue

Shapiro-Wilk

Kolmogorov-Smirnov

Shapiro-Wilk

Chi-Square Goodness-of-Fit

Dacă datele urmează o distribuţie normală aplicăm un test parametric

Dacă datele nu urmează o distribuţie normală aplicăm un test de comparare al rangurilor

30

Testul Z de comparare a mediei unui eşantion cu media unei populaţii

Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ

extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie

s2 care se cunoaşte

Condiţii de aplicare

1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru

compararea mediei unui eşantion cu media unei populaţii)

2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal

distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă

3 Talia eşantionului este mare ( ge 30)

Ipoteze

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media

eşantionului şi media populaţiei

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

(-yen -196 ] Egrave [196 yen)

Parametrul testului

n = volumul eşantionului

= media eşantionului

s = deviaţia standard a populaţiei

Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)

Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard

cunoscută

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi

media standard

Condiţii de aplicare

Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se

realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această

condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea

31

Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai

puternic

Numărul de grade de libertate (df) df = n-1

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

Parametrul testului

n = volumul eşantionului

micro0 = media standard

= media eşantionului

s = deviaţia standard a eşantionului

Testul ANOVA compararea mediilor a mai multe eşantioane

H0 = toate mediile sunt egale

H1 = nu toate mediile sunt egale

Condiţii de aplicare

1 Datele sunt independente unele faţă de celelalte

2 Datele fiecărui grup sunt normal distribuite

3 Deviaţia standard este aceeaşi pentru toate grupurile

Id Medicament

A B C D E F

1 5 6 7 10 5 9

2 6 8 8 11 8 8

3 7 7 9 13 6 7

4 8 9 11 12 4 5

32

5 9 10 10 9 7 6

Suma 35 40 45 55 30 35

Media 7 8 9 11 6 7

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =

= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)

Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2

F = (suma pătratelor(icircntre))(suma pătratelor(icircn))

Suma pătratelor (icircntre) = 16times5 = 80

Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60

Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn

interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare

SP df Media pătratelor F = MPicircntreMPicircn

Icircntre 80 5 = 805 = 16 = 1625 = 64

Icircn 60 24 = 6024 = 25

Total 140 29 -

Testul sumei rangurilor Wilcoxon

Aplicat pentru

Un set de observaţii provenite dintr-o valoare ipotetică comună

Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)

Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero

Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace

Suma rangurilor pentru diferenţele negative = 2+3+1 = 6

Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30

33

Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului

egal cu 8 = 0109

Icircnainte După Diferenţa Rang

64 66 -2 2

66 58 8 5

67 68 -1 3

71 65 6 4

72 75 -3 1

76 67 9 6

78 59 19 8

89 74 15 7

Testul Kruskal-Wallis (ge 3 eşantioane independente)

Test de ranguri aplicate pe mai mult de 3 eşantioane

H = parametrul testului

n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)

Tk = suma rangurilor

Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie

pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni

34

df = k-1 (k = numărul de eşantioane)

df = 3-1 = 2

Hcritic(α=005) = 599

H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie

pozitivă şi respectiv biopsie negativă

Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie

a tipului de studiu pe eşantioane perechi)

1 Definirea numărului de tratamente k

2 Obţinerea rangurilor pentru fiecare tratament

3 Sumarea rangurilor fiecărui tratament

4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)

5 Dacă Fr gt Frcritic rarr respingem H0

Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost

măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi

n = 9 k = 3 T12 = 225 T2

2 = 38025 T32 = 38025

Frcritic = 599

Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de

prostată

35

De reţinut

Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei

Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-

of-Fit

Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z

Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t

Compararea mediilor a 3 sau mai multe eşantioane ANOVA

Compararea mediilor a două populaţii (σ) testul Z

Compararea mediilor a două eşantioane (s) testul t

Compararea mediilor a două eşantioane perechi (s) testul t

ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi

cu cel pentru compararea a două eşantioane perechi

Ranguri

Distribuţia datelor nu are importanţă

Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)

Trei sau mai multe eşantioane Kruskal-Wallis

Trei sau mai multe eşantioane perechi Friedman

Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia

Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a

datelor)

Variabile nominale

Un singur eşantion sau eşantioane perechi

Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte

Eşantioane perechi testul Mc Nemar

Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2

Icircn analiza proporţiilor există teste diferite pentru

Compararea unei frecvenţe cu o frecvenţă cunoscută

Compararea a două frecvenţe

Semnificaţia statistică

Valoarea p (p value)

Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor

două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E

posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării

aleatorii

36

Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală

urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii

Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este

probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un

experiment de dimensiunea acestuia

Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că

diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii

diferite

Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca

fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă

ar fi fost adevărată

Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă

1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe

baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De

fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001

2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie

3 Se aplică testul statistic aferent pentru a calcula valoarea p

4 Se compară valoarea p cu valoarea ndash prag

5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe

semnificativă dpdv statisticrdquo

6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e

semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să

conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă

Teste de semnificaţie

Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului

populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)

Testarea ipotezelor implică posibile erori

Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile

sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui

grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul

icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005

ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există

37

nici o diferenţă

Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ

statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de

ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost

ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau

dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă

cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă

semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe

ipotetice variate icircn cazul icircn care ele există

Măsuri ale frecvenţei

Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)

Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate

Generic formula pe care se bazează toate cele trei este

unde x şi y sunt cantităţile de comparat

Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea

unei frecvenţe pe grupe de sex vacircrstă etc

Proporţia implică icircn mod necesar ca x să fie inclus icircn y

Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară

frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp

Pentru calcularea unei rate trebuie ţinut cont de trei aspecte

bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin

bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp

bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo

Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un

tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei

populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei

aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)

38

Indicatori

Rata de incidenţă

Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă

icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii

Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o

perioadă de timp

Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de

timp x

Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei

susceptibili de a dezvolta icircmbolnăvirea studiată

Numitorul poate fi

bull Numărul mediu al populaţiei icircn perioada de timp studiată

bull Mărimea populaţiei icircn mijlocul perioadei de studiu

bull Mărimea populaţiei la icircnceputul studiului

Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă

Este obligatorie menţionarea perioadei de timp

Prevalenţa

Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la

un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă

schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa

momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)

39

Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include

numai cazuri noi respectiv include cazuri noi şi vechi

Rata de atac

Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este

folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp

raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori

Rata persoană-timp

Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din

momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte

migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost

observate

Riscul relativ (RR)

Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment

legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele

prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două

grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la

bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la

bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai

mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo

Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2

Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn

cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă

(Tabelul 1)

Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR

Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la

neexpuşi

40

Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de

culegere a datelor

Odds ratio (OR)

Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin

raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general

studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)

Tabelul 2 Tabelul 2 x 2 pentru calcularea OR

Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală

Rate de mortalitate

Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp

specificată Există mai multe tipuri de rate de mortalitate

o Mortalitate specifică pe sex

o Mortalitate specifică pe rasă

o Mortalitate specifică pe boală

o Mortalitate neonatală

o Mortalitate postneonatală

o Mortalitate infantilă

o Mortalitate maternă

Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP

41

Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de

viaţă şi vacircrsta la care survine decesul dacă este prematur

Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu

Ani de viaţă pierduţi datorat dizabilităţii

Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt

utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru

cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite

grupuri

Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de

risc şi o boală se folosesc riscul relativ şi odds ratio

35 Analiza şi interpretarea datelor

După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date

trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul

Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor

colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului

studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu

plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde

prezenţa biostatisticianului este necesară

Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu

elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat

iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului

iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate

depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori

testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere

clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza

Interpretarea rezultatelor statistice

Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne

motive (număr mic de date) acceptarea ei să fie falsă

Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine

gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia

ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument

de decizie Intervalul de confidenţă

42

Interpretarea statistica ne interpretarea clinică

Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă

Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice

obţinute pe eşantionul studiat

Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare

Ce interpretăm Rezultatele

personale obţinute icircn urma studiului

care au fost prezentate icircn secţiunea bdquoRezultaterdquo

Explicăm rezultatele obţinute

Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale

Interpretarea trebuie să se realizeze icircn

lumina limitelor studiului

contextul cultural social şi educaţional al locului unde s-a realizat cercetarea

contextul a ceea ce se cunoaşte din literatura de specialitate

Interpretăm doar rezultatele personale obţinute icircn urma studiului

Interpretarea statistică nu este tot una cu interpretarea clinică

Interpretarea statistică este importantă

Interpretarea clinică este foarte importantă

Intervalul de confidenţă

Media calculată pe baza unui eşantion nu va echivala media populaţiei

Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului

Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a

populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a

populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)

pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru

orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare

dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de

confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de

date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de

5

Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel

Dacă valoarea p este mică

Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare

aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o

medie diferită Diferenţa este semnificativă dpdv statistic

43

Icircn continuare

Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa

reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică

pentru a fi interesante din punct de vedere ştiinţific

Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC

oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care

este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a

obţine o concluzie clară

Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o

diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că

datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din

punct de vedere ştiinţific

Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul

detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat

Erorile studiilor medicale

Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura

anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară

caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea

asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri

legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias

Erorile potenţiale icircn studiile epidemiologice

1 Erori icircntacircmplătoare

2 Erori sistematice

3 Confuzia

4 Validitatea

1 Erori icircntacircmplătoare

Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a

parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel

de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot

fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii

(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor

de măsură (eroarea de măsurare)

44

2 Erori sistematice

Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate

care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu

acurateţe mare Acurateţea nu este afectată de mărimea eşantionului

Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de

experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea

dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus

şi greu de cuantificat (consum de alcool personalitate etc)

Principalele tipuri de erori din această categorie sunt

bull Biasul de selecţie

bull Biasul de informaţie

Biasul de selecţie

Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul

trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion

inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale

persoanelor incluse

Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se

ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia

Biasul de informaţie

Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de

instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze

expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere

nesemnificativă sau chiar să nu şi-o amintească de loc

3 Confuzia

Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune

prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este

cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă

de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte

important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor

protector

4 Validitatea

Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă

Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte

estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional

Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă

45

conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se

demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)

Validitatea externă se poate realiza numai dacă studiul este valid intern

Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii

studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de

studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt

laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi

validă din punct de vedere intern)

3 6 Prezentarea rezultatelor

După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite

Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor

icircntr-o formă bdquodigerabilărdquo este necesară

Scopul prezentării datelor

1 Transmiterea concluziilor studiului

a Datele corecte şi importante merită comunicate

b Datele trebuie să confirme sau să infirme ipoteza studiului

c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală

2 Acordarea posibilităţii altor cercetători să aprecieze studiul

a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti

b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor

prezentate

Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru

fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie

statistică

Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de

valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras

(Tabel 3)

Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)

46

Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct

numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor

precum şi prezentarea acestora sub formă inteligibilă

Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care

convin cercetătorului

Prezentarea datelor se poate face

1 Figuri şi tabele icircn articole scrise

2 Figuri şi tabele icircn prezentări orale

3 Figuri şi tabele icircn postere

4 Text scris sau incluse icircn text

5 Site-uri de WEB

Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor

Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie

Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele

exprimacircnd exact ceea ce acestea exprimă

Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate

anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel

să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se

acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca

mai sus sugestive sunt formatele simple şi puţin icircncărcate

Dacă nu există reguli impuse se respectă

1 Mesaj simplu fără falsificarea datelor

2 De obicei este necesar atacirct tabelul cacirct şi graficul

3 Să fie simplu şi clar

Tabele

Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile

coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică

elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de

1 Se folosesc doar linii orizontale

2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn

evidenţi prin linie de separare (Tabelul 4)

Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland

Noua Zeelandă)

(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)

47

3 Numerele sunt aliniate icircn funcţie de virgulă

4 Indicii statistici sunt explicaţi sub tabel

5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană

6 Abrevierile pot fi folosite

7 Numărul de zecimale trebuie limitat la maxim două

8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel

9 Plasarea legendei este obligatorie sub tabel

10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)

Icircn cazul prezentărilor orale sau a posterelor este indicat ca

1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării

2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte

3 Folosirea de simboluri este permisă

Clasificarea tabelelor

Tabelele se clasifică după

i) conţinut

bull cu distribuţii de frecvenţe

bull de clase de frecvenţe

bull de contingenţă

ii) structura

bull cu doua coloane

bull cu subclasificări

bull ldquomasterrdquo

Tabele ce conţin distribuţii de frecvenţe

O modalitate comodă de a prezenta o mulţime de date brute este

1 Se ordonează datele in ordine crescătoare

2 Se determine frecvenţa fiecărei valori

3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane

(Tabelul 5)

Tabelul 5 Distribuţii de frecvenţă absolută

48

Tabelul claselor de frecvenţe

1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă

2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)

Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)

Tabele de contingenţă

1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a

tabelelor de contingenţă

2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a

combinaţiilor de perechi ordonate de valori

3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre

a factor de risc si

b starea sănătăţii

4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)

5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)

Tabelul 7 Tabel de contingenţă 2 x 2

49

Grafice

Există două categorii de moduri grafice sub care se pot prezenta datele

1 Ilustraţii şi fotografii

2 Grafice

1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă

pentru lucrare

2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit

Putem vorbi despre mai multe tipuri de grafice

bull Grafice pentru reprezentarea datelor cantitative

1048707 Grafic cartezian (X Y)

1048707 Histograma

1048707 Poligonul de frecvenţe

1048707 Diagrama bdquoscatterrdquo

bull Grafice pentru reprezentarea datelor calitative

1048707 Grafic cu bare

1048707 Diagrama tip bdquoboxplotrdquo

1048707 Diagrama bdquopierdquo

1048707 Cartograma

Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi

dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)

Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)

Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie

Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)

Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)

50

Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir

de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele

două variabile studiate (Figura 6)

Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2

(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2

rămacircne aproximativ constantă)

Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea

comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea

comparativă a mai multor variabile

Figura 7 Grafic calitativ cu bare

51

Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo

Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două

posibilităţi reprezentate grafic este mai frecventă (Figura 8)

Figura 8 Reprezentare tip bdquopierdquo

Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli

sau a oricărui element comparativ Se foloseşte de epidemiologi

Rezultate

Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare

Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o

manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu

explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția

bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la

ilustraţii tabele grafice

Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi

nici rezultatele care invalidează eventual ipoteza

Discuţii

Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd

cultura ştiinţifică şi inteligenţa autorilor

Acest capitol răspunde la trei obiective

Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia

calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de

selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează

rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv

52

este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn

care a fost abordată problema fără a face o revistă a literaturii

Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea

rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul

Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor

afirmaţii nesusţinute de conţinutul lucrării

Concluzii

Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate

să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie

Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de

concluzii va scădea valoarea lucrării

Bibliografia (lista referinţelor citarea icircn text)

Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn

lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente

Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli

- să conţină cele mai importante şi recente lucrări

- să includă numai lucrări publicate

- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate

Bibliografie

Elisabeta Jaba ndash Statistică Ed Economică 1998

Mihai Ţarcă ndash Statistică volI Ed UAIC 1979

Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale

Ed University Press 2009

Sorana Daniela Bolboacă ndash Metodologia cercetării curs

53

Page 20: cercetarea medicala - metodologie

Trebuie să se comporte diferit atunci cacircnd ipoteza nulă H0 este adevărată faţă de situaţia icircn

care ipoteza alternativă H1 este adevărată

Distribuţia de probabilitate a parametrului statistic al testului sub prezumţia că H0 este

adevărată este cunoscută

3 Regiunea critică

- Trebuie să fim capabili să decidem icircn funcţie de valoarea parametrului statistic calculat care dintre

ipoteze cea nulă sau cea alternativă este adevărată

- Dacă valoarea parametrului statistic aparţine regiunii critice ipoteza nulă H0 va fi respinsă şi va fi

acceptată ipoteza alternativă H1

- Dacă valoarea parametrului statistic nu aparţine regiunii critice ipoteza nulă H0 va fi acceptată

- Decidem mărimea regiunii critice

Pentru aceasta trebuie să specificăm mărimea riscului de eroare pe care icircl acceptăm

Pe scurt definim nivelul de semnificaţie notat cu a sau mărimea riscului pe care

suntem dispuşi să ni-l asumăm icircn respingerea ipotezei nule H0 icircn cazul icircn care aceasta

este adevărată De obicei se alege un nivel de semnificaţie icircntre 1 şi 5

Probabilitatea unei erori de tipul I

probabilitatea de respingere a ipotezei nule H0 icircn favoarea ipotezei alternative H1 icircn

condiţiile icircn care H0 este adevărată

probabilitatea unei erori de tipul I se notează cu a şi se mai numeşte nivel de

semnificaţie al testului

Probabilitatea unei erori de tipul II

probabilitatea acceptării ipotezei nule icircn condiţiile icircn care ipoteza alternativă H1 este

adevărată

această probabilitate se notează cu b

- Unilaterală la dreapta ndash valoarea parametrului statistic al testului este mai mare sau egală cu

valoarea din dreapta a intervalului critic

- Unilaterală la stacircnga ndash valoarea parametrului statistic al testului este mai mică sau egală cu

valoarea din stacircnga a intervalului critic

- Bilaterală ndash valoarea parametrului statistic al testului este mai mică sau egală cu valoarea extremă

din stacircnga regiunii critice sau mai mare sau egală cu valoarea extremă din dreapta regiunii critice

valorile extreme ale regiunii critice avacircnd nivele egale de semnificaţie

4 Concluzia testului

- Ipoteza nulă H0 este respinsă dacă valoarea parametrului statistic aparţine regiunii critice

20

- Regiunea critică trebuie astfel aleasă icircncacirct dacă ipoteza alternativă H1 este adevărată

probabilitatea de respingere a ipotezei nule H0 este mai mare decacirct icircn cazul icircn care ipoteza nulă H0

ar fi adevărată

- Acceptarea ipotezei nule H0 atunci cacircnd ipoteza alternativă H1 este adevărată este cunoscută ca şi

eroarea de tipul II

a probabilitatea ei se notează cu b

b măsoară bdquonivelul de eroarerdquo

- Icircn testarea oricărei ipoteze statistice există patru situaţii care determină dacă decizia noastră este

corectă sau nu

Cazuri

H0 este adevărată H0 este falsă

Concluzie H0 se acceptă decizie corectă eroare de tipul

II

H0 se

respinge

eroare de tipul I decizie corectă

Luarea deciziei pe baza valorii probabilităţii p de semnificaţie a testului

Icircn momentul icircn care prelucrăm statistic o serie de date dorim să ştim dacă rezultatele obţinute sunt sau

nu semnificative statistic

Răspunsul la această icircntrebare este dat de valoarea lui p calculată de orice program statistic la

prelucrarea unor date

Icircn cazul testelor statistice ipoteza nulă este respinsă dacă nivelul de semnificaţie este mai mic decacirct

005 iar programele de prelucrare statistică a datelor vor afişa o steluţă () icircn tabelul rezultatelor

21

Dacă p le 005 respingem ipoteza nulă şi acceptăm ipoteza alternativă (am obţinut semnificaţia

statistică)

Dacă p gt 005 acceptăm ipoteza nulă (nu am obţinut semnificaţia statistică)

p = 013

NU respingem ipoteza nulă

Risc de eroare de tip II

α = 005

p = 002

Respingem ipoteza nulă

Risc de eroare de tip I

Semnificaţia lui p

Criteriu de luare a deciziei cu privire la o ipoteză statistică nulă

Cuantifică şansa ca o decizie de respingere a ipotezei nule să fie greşită

Măsură a semnificaţiei statistice şi NU CLINICĂ

22

Semnificaţia lui p (reguli empirice)

001 le p lt 005 rezultatul e semnificativ statistic

0001 le p lt 001 rezultatul e icircnalt semnificativ statistic

p lt 0001 rezultatul e foarte icircnalt semnificativ statistic

p ge 005 rezultatul e considerat nesemnificativ statistic

Limite ale valorii p

Valoarea p NU ne dă informaţii despre

Şansa de beneficiu a unui pacient individual

Procentul de pacienţi care vor avea un beneficiu icircn urma instituirii procedurii medicale

Gradul de beneficiu expectat pentru un anumit pacient

Puterea unui test statistic

Este capacitatea de a detecta o diferenţă acolo unde există

Creşterea volumului eşantionului determină creşterea puterii testului statistic aplicat

Valoarea este icircn relaţie directă cu eroarea de tip II

Puterea = 1 ndash β

Cea mai utilizată modalitate de creştere a puterii unui test statistic este de a creşte volumul

eşantionului

Tipul scalei de măsură ndash testul statistic

Denumire test Interval Nominal Observaţii

Corelaţie Pearson 2 0 Există o relaţie liniară

χ2 0 2

Student 1 1 Doar 2 grupuri

ANOVA 1 1 2 sau mai multe grupuri

Student perechi 1 1 Eşantioane perechi

Măsurători repetate (ANOVA) 1 1 Mai mult de 2 grupuri date

perechi

Inferenţa statistică pe date calitativ e

Tabela de contingenţă 2times2

Riscuri şi raţii

Testul χ2 (testarea asocierii icircn tabela de contingenţă)

Testul Fisher

23

Testul z pentru proporţii

Testul McNemar

Tabela de contingenţă 2times2

Scale de tip nominal (dicotomiale tabela de contingenţă de 2times2) sau ordinal (tabela de contingenţă de

rtimesc)

Frecvenţa absolută (numărul de evenimente per categorie)

Tabela de contingenţă de 2times2 4 categorii

AP = adevărat pozitiv

FP = fals pozitiv

FN = fals negativ

AN = adevărat negativ

Ulcer deschis Ulcer vindecat Total

Recurenţă + AP = 1 FP = 5 = 1+5 = 6

Recurenţă - FN = 7 AN = 16 = 7+16 = 23

Total =1+7=8 =5+16=21 29

Riscuri şi raţii Mărimi ale asocierii

Denumire Formula Definiţie

Rata falşilor pozitivi =FP(FP+AN) Probabilitatea unui test fals + (α)

Rata falşilor negativi =FN(FN+AP) Probabilitatea unui test fals ndash (β)

Sensibilitate =AP(AP+FN) Probabilitatea unui test real + (1- β)

Specificitate =AN(AN+FP) Probabilitatea unui test real ndash (1- α)

Acurateţe =(AP+AN)n Probabilitatea generală a unei decizii corecte

Valoarea predictivă pozitivă =AP(AP+FP) Probabilitatea ca un test pozitiv să fie corect

Valoarea predictivă negativă =AN(AN+FN) Probabilitatea ca un test negativ să fie corect

Riscul relativ =AP(FP+AN)FN(AP+FP)

Rata şansei =(AP∙AN)(FN∙FP)

Riscul atribuabil =AP(AP+FP)-FN(FN+AN)

24

Denumire Formula

Rata falşilor pozitivi = 5(5+1) = 08334

Rata falşilor negativi = 7(7+16) = 03043

Sensibilitate = 1(1+7) = 01250

Specificitate = 16(16+5) = 07619

Acurateţe = (1+16)29 = 05862

Valoarea predictivă pozitivă = 1(1+5) = 01667

Valoarea predictivă negativă = 16(16+7) = 06957

Riscul relativ = 1(5+16)7(1+5) = 2142 = 050

Rata şansei = (1∙16)(7∙5) = 04571

Riscul atribuabil = 1(1+5)-7(7+16) = 01667-03043=-01376

Testarea asocierii icircn tabela de contingenţă

Testul χ2

Nu trebuie utilizat pentru eşantioane de volum mic

Testul este valid doar dacă valoarea expectată (aşteptată) pentru fiecare celulă este cel puţin

egală cu 1 şi frecvenţa absolută observată este de minim 5

Dacă aceste condiţii nu sunt icircndeplinite se aplică testul exact al lui Fisher (Fisherrsquos Exact Test)

Indică dacă cele două variabile sunt sau nu independente DAR NU cuantifică puterea asocierii

dintre ele

Problema S-a investigat icircntr-un studiu asocierea dintre obezitatea (ca factor de risc) şi bolile

cardio-vasculare la persoanele icircn etate (gt 60 ani) Din totalul de 620 persoane investigate s-au

identificat 150 persoane cu obezitate şi boală cardio-vasculară 230 persoane fără obezitate şi

fără boală cardio-vasculară şi 60 persoane fără obezitate dar cu boală cardio-vasculară Există

o asociere icircntre obezitate şi boala cardio-vasculară (df=1 α=005 χ2critic = 384)

Testul χ2 exemplu

H025

Nu există asociere icircntre obezitate şi bolile cardio-vasculare

Obezitatea şi bolile cardio-vasculare sunt independente

H1

Există asociere icircntre obezitate şi bolile cardio-vasculare

Obezitatea şi bolile cardio-vasculare sunt asociate

a = 005 pragul de semnificaţie al testului

urmează o lege cu (r-1)(c-1) grade de libertate

χ2 = parametrul testului χ2

fio = frecvenţa observată

fit = frecvenţa teoretică

Regiunea critică este [χα2 yen)

Pentru α = 005 χα2 = 384

OBSERVAT BCV+ BCV- Total

Obezitate + AP = 150 FP = 180 330

Obezitate - FN = 60 AN = 230 290

Total 210 410 620

TEORETIC BCV+ BCV- Total

Obezitate + = 330times210620 = 330times410620 330

Obezitate - = 290times210620 = 290times410620 290

Total 210 410 620

TEORETIC BCV+ BCV- Total

Obezitate + = 330times210620 = 330times410620 330

26

Obezitate - = 290times210620 = 290times410620 290

Total 210 410 620

TEORETIC BCV+ BCV-

Obezitate + = 112 = 218

Obezitate - = 98 = 192

Deoarece 4177Icirc[384 yen) se respinge H0 cu un risc de eroare de 5

Există asociere icircntre obezitate şi bolile cardio-vasculare

Testul Fisher

Corecţie a testului χ2

Valoarea p asociată parametrului ne dă probabilitatea ca valoarea observată de independenţă să fie

atribuită doar şansei

O valoare p mică indică că există alte cauze decacirct şansa influenţează rezultatul şi astfel cele două

variabile investigate nu sunt independente

Testul Fisher = dispersia corectată a factorului x dispersia corectată a factorilor reziduali

Icircn acest context regula adunării dispersiilor se poate scrie unde

este variaţia lui y pe seama variaţiei variabilei x

este variaţia lui y pe seama influenţei factorilor reziduali (neicircnregistraţi)

este variaţia totală a caracteristicii y

Testul Fisher empiric se calculează după formula

27

se compară cu Ftab pentru nx şi nz grade de libertate la un anumit prag de semnificaţie stabilit

Dacă Fc gt Ftab rezultă că variaţia factorului de grupare x este semnificativă pentru variaţia caracteristicii y

Testul z pentru proporţii

1 Compararea unei frecvenţe observate cu o frecvenţă teoretică

2 Testarea egalităţii a două frecvenţe

Testul z Compararea unei frecvenţe observate cu o frecvenţă teoretică

Scop Investigarea semnificaţiei diferenţei icircntre o frecvenţă teoretică p (icircntr-o populaţie) şi o frecvenţă

observată f pe un eşantion reprezentativ (variabilă calitativă (binare))

Condiţii de aplicare Testul este corect aplicat dacă numărul n al observaţiilor eşantionului este

suficient de mare (n∙p n∙(1-p)gt10

Parametrul

n = volumul eşantionului

Suntem interesaţi de investigarea prevalenţei hepatitei B la personalul care lucrează icircn laboratoarele

clinicilor de boli infecţioase din Transilvania Se ştie din studii anterioare că prevalenţa hepatitei B icircn

populaţia generală din Transilvania este de 9 S-a luat icircn studiu un eşantion de 100 persoane şi s-a

obţinut o prevalenţă a hepatitei B de 6 Există diferenţă semnificativă icircntre frecvenţa hepatitei B la

personalul care lucrează icircn laboratoarele spitalelor de boli infecţioase din Transilvania faţă de

populaţia generală

f = 006 p = 009 n = 100

Ipoteza nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat

faţă de frecvenţa hepatitei B icircn populaţia generală

Ipoteza alternativă test bilateral Există diferenţă semnificativă icircntre frecvenţa hepatitei B la

nivelul eşantionului şi prevalenţa hepatitei B icircn populaţia generală

f = 006 p = 009 n = 100

Pragul de semnificaţie a = 005

Regiunea critică test bilateral (-yen -196 ]Egrave[196 yen)

28

Concluzia testului

Deoarece parametrul statistic calculat al testului nu aparţine regiunii critice se acceptă ipoteza

nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat faţă de

frecvenţa hepatitei B icircn populaţia generală

Testul McNemar

Evaluarea dependenţei variabilelor calitative perechi (dorim să determinăm dacă o anumită

caracteristică este sau nu asociată cu o anumită patologie)

Identificăm n pacienţi care prezintă patologia de interes (eg Cancer bronho-pulmonar) şi n

pacienţi cu aceleaşi caracteristici ca şi primul grup dar care nu o prezintă

Martor = da Martor = nu

Caz = da a b

Caz = nu c d

Testul McNemar - exemplu fumat vs cancer

Martor = da Martor = nu

Cancer = da a = 2 b = 5

Cancer = nu c = 0 d = 3

29

χ2critic(α=005) = 384

32 lt 384 rarr acceptăm ipoteza nulă

Fumatul nu este icircn relaţie cu apariţia cancerului bronho-pulmonar

Inferenţa statistică pe date cantitative

Variabile cantitative continue

Testul z şi Student (t) (o medie sau medii perechi)

Testul z şi Student (t) (testarea a două medii)

ANOVA (ge 3 medii)

Ranguri (variabile cantitative discrete sau cantitative care nu icircndeplinesc condiţia de

normalitate)

Testul sumei rangurilor Wilcoxon

Kruskal-Wallis (ge 3 eşantioane independente)

Friedman (ge 3 eşantioane dependente)

Teste de normalitate variabile cantitative continue

Shapiro-Wilk

Kolmogorov-Smirnov

Shapiro-Wilk

Chi-Square Goodness-of-Fit

Dacă datele urmează o distribuţie normală aplicăm un test parametric

Dacă datele nu urmează o distribuţie normală aplicăm un test de comparare al rangurilor

30

Testul Z de comparare a mediei unui eşantion cu media unei populaţii

Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ

extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie

s2 care se cunoaşte

Condiţii de aplicare

1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru

compararea mediei unui eşantion cu media unei populaţii)

2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal

distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă

3 Talia eşantionului este mare ( ge 30)

Ipoteze

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media

eşantionului şi media populaţiei

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

(-yen -196 ] Egrave [196 yen)

Parametrul testului

n = volumul eşantionului

= media eşantionului

s = deviaţia standard a populaţiei

Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)

Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard

cunoscută

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi

media standard

Condiţii de aplicare

Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se

realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această

condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea

31

Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai

puternic

Numărul de grade de libertate (df) df = n-1

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

Parametrul testului

n = volumul eşantionului

micro0 = media standard

= media eşantionului

s = deviaţia standard a eşantionului

Testul ANOVA compararea mediilor a mai multe eşantioane

H0 = toate mediile sunt egale

H1 = nu toate mediile sunt egale

Condiţii de aplicare

1 Datele sunt independente unele faţă de celelalte

2 Datele fiecărui grup sunt normal distribuite

3 Deviaţia standard este aceeaşi pentru toate grupurile

Id Medicament

A B C D E F

1 5 6 7 10 5 9

2 6 8 8 11 8 8

3 7 7 9 13 6 7

4 8 9 11 12 4 5

32

5 9 10 10 9 7 6

Suma 35 40 45 55 30 35

Media 7 8 9 11 6 7

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =

= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)

Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2

F = (suma pătratelor(icircntre))(suma pătratelor(icircn))

Suma pătratelor (icircntre) = 16times5 = 80

Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60

Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn

interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare

SP df Media pătratelor F = MPicircntreMPicircn

Icircntre 80 5 = 805 = 16 = 1625 = 64

Icircn 60 24 = 6024 = 25

Total 140 29 -

Testul sumei rangurilor Wilcoxon

Aplicat pentru

Un set de observaţii provenite dintr-o valoare ipotetică comună

Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)

Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero

Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace

Suma rangurilor pentru diferenţele negative = 2+3+1 = 6

Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30

33

Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului

egal cu 8 = 0109

Icircnainte După Diferenţa Rang

64 66 -2 2

66 58 8 5

67 68 -1 3

71 65 6 4

72 75 -3 1

76 67 9 6

78 59 19 8

89 74 15 7

Testul Kruskal-Wallis (ge 3 eşantioane independente)

Test de ranguri aplicate pe mai mult de 3 eşantioane

H = parametrul testului

n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)

Tk = suma rangurilor

Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie

pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni

34

df = k-1 (k = numărul de eşantioane)

df = 3-1 = 2

Hcritic(α=005) = 599

H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie

pozitivă şi respectiv biopsie negativă

Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie

a tipului de studiu pe eşantioane perechi)

1 Definirea numărului de tratamente k

2 Obţinerea rangurilor pentru fiecare tratament

3 Sumarea rangurilor fiecărui tratament

4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)

5 Dacă Fr gt Frcritic rarr respingem H0

Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost

măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi

n = 9 k = 3 T12 = 225 T2

2 = 38025 T32 = 38025

Frcritic = 599

Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de

prostată

35

De reţinut

Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei

Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-

of-Fit

Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z

Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t

Compararea mediilor a 3 sau mai multe eşantioane ANOVA

Compararea mediilor a două populaţii (σ) testul Z

Compararea mediilor a două eşantioane (s) testul t

Compararea mediilor a două eşantioane perechi (s) testul t

ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi

cu cel pentru compararea a două eşantioane perechi

Ranguri

Distribuţia datelor nu are importanţă

Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)

Trei sau mai multe eşantioane Kruskal-Wallis

Trei sau mai multe eşantioane perechi Friedman

Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia

Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a

datelor)

Variabile nominale

Un singur eşantion sau eşantioane perechi

Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte

Eşantioane perechi testul Mc Nemar

Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2

Icircn analiza proporţiilor există teste diferite pentru

Compararea unei frecvenţe cu o frecvenţă cunoscută

Compararea a două frecvenţe

Semnificaţia statistică

Valoarea p (p value)

Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor

două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E

posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării

aleatorii

36

Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală

urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii

Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este

probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un

experiment de dimensiunea acestuia

Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că

diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii

diferite

Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca

fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă

ar fi fost adevărată

Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă

1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe

baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De

fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001

2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie

3 Se aplică testul statistic aferent pentru a calcula valoarea p

4 Se compară valoarea p cu valoarea ndash prag

5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe

semnificativă dpdv statisticrdquo

6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e

semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să

conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă

Teste de semnificaţie

Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului

populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)

Testarea ipotezelor implică posibile erori

Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile

sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui

grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul

icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005

ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există

37

nici o diferenţă

Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ

statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de

ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost

ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau

dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă

cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă

semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe

ipotetice variate icircn cazul icircn care ele există

Măsuri ale frecvenţei

Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)

Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate

Generic formula pe care se bazează toate cele trei este

unde x şi y sunt cantităţile de comparat

Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea

unei frecvenţe pe grupe de sex vacircrstă etc

Proporţia implică icircn mod necesar ca x să fie inclus icircn y

Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară

frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp

Pentru calcularea unei rate trebuie ţinut cont de trei aspecte

bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin

bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp

bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo

Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un

tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei

populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei

aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)

38

Indicatori

Rata de incidenţă

Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă

icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii

Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o

perioadă de timp

Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de

timp x

Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei

susceptibili de a dezvolta icircmbolnăvirea studiată

Numitorul poate fi

bull Numărul mediu al populaţiei icircn perioada de timp studiată

bull Mărimea populaţiei icircn mijlocul perioadei de studiu

bull Mărimea populaţiei la icircnceputul studiului

Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă

Este obligatorie menţionarea perioadei de timp

Prevalenţa

Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la

un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă

schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa

momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)

39

Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include

numai cazuri noi respectiv include cazuri noi şi vechi

Rata de atac

Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este

folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp

raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori

Rata persoană-timp

Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din

momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte

migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost

observate

Riscul relativ (RR)

Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment

legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele

prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două

grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la

bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la

bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai

mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo

Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2

Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn

cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă

(Tabelul 1)

Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR

Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la

neexpuşi

40

Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de

culegere a datelor

Odds ratio (OR)

Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin

raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general

studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)

Tabelul 2 Tabelul 2 x 2 pentru calcularea OR

Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală

Rate de mortalitate

Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp

specificată Există mai multe tipuri de rate de mortalitate

o Mortalitate specifică pe sex

o Mortalitate specifică pe rasă

o Mortalitate specifică pe boală

o Mortalitate neonatală

o Mortalitate postneonatală

o Mortalitate infantilă

o Mortalitate maternă

Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP

41

Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de

viaţă şi vacircrsta la care survine decesul dacă este prematur

Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu

Ani de viaţă pierduţi datorat dizabilităţii

Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt

utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru

cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite

grupuri

Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de

risc şi o boală se folosesc riscul relativ şi odds ratio

35 Analiza şi interpretarea datelor

După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date

trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul

Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor

colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului

studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu

plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde

prezenţa biostatisticianului este necesară

Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu

elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat

iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului

iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate

depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori

testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere

clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza

Interpretarea rezultatelor statistice

Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne

motive (număr mic de date) acceptarea ei să fie falsă

Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine

gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia

ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument

de decizie Intervalul de confidenţă

42

Interpretarea statistica ne interpretarea clinică

Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă

Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice

obţinute pe eşantionul studiat

Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare

Ce interpretăm Rezultatele

personale obţinute icircn urma studiului

care au fost prezentate icircn secţiunea bdquoRezultaterdquo

Explicăm rezultatele obţinute

Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale

Interpretarea trebuie să se realizeze icircn

lumina limitelor studiului

contextul cultural social şi educaţional al locului unde s-a realizat cercetarea

contextul a ceea ce se cunoaşte din literatura de specialitate

Interpretăm doar rezultatele personale obţinute icircn urma studiului

Interpretarea statistică nu este tot una cu interpretarea clinică

Interpretarea statistică este importantă

Interpretarea clinică este foarte importantă

Intervalul de confidenţă

Media calculată pe baza unui eşantion nu va echivala media populaţiei

Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului

Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a

populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a

populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)

pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru

orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare

dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de

confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de

date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de

5

Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel

Dacă valoarea p este mică

Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare

aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o

medie diferită Diferenţa este semnificativă dpdv statistic

43

Icircn continuare

Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa

reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică

pentru a fi interesante din punct de vedere ştiinţific

Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC

oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care

este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a

obţine o concluzie clară

Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o

diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că

datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din

punct de vedere ştiinţific

Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul

detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat

Erorile studiilor medicale

Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura

anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară

caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea

asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri

legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias

Erorile potenţiale icircn studiile epidemiologice

1 Erori icircntacircmplătoare

2 Erori sistematice

3 Confuzia

4 Validitatea

1 Erori icircntacircmplătoare

Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a

parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel

de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot

fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii

(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor

de măsură (eroarea de măsurare)

44

2 Erori sistematice

Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate

care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu

acurateţe mare Acurateţea nu este afectată de mărimea eşantionului

Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de

experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea

dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus

şi greu de cuantificat (consum de alcool personalitate etc)

Principalele tipuri de erori din această categorie sunt

bull Biasul de selecţie

bull Biasul de informaţie

Biasul de selecţie

Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul

trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion

inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale

persoanelor incluse

Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se

ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia

Biasul de informaţie

Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de

instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze

expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere

nesemnificativă sau chiar să nu şi-o amintească de loc

3 Confuzia

Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune

prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este

cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă

de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte

important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor

protector

4 Validitatea

Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă

Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte

estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional

Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă

45

conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se

demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)

Validitatea externă se poate realiza numai dacă studiul este valid intern

Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii

studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de

studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt

laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi

validă din punct de vedere intern)

3 6 Prezentarea rezultatelor

După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite

Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor

icircntr-o formă bdquodigerabilărdquo este necesară

Scopul prezentării datelor

1 Transmiterea concluziilor studiului

a Datele corecte şi importante merită comunicate

b Datele trebuie să confirme sau să infirme ipoteza studiului

c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală

2 Acordarea posibilităţii altor cercetători să aprecieze studiul

a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti

b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor

prezentate

Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru

fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie

statistică

Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de

valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras

(Tabel 3)

Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)

46

Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct

numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor

precum şi prezentarea acestora sub formă inteligibilă

Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care

convin cercetătorului

Prezentarea datelor se poate face

1 Figuri şi tabele icircn articole scrise

2 Figuri şi tabele icircn prezentări orale

3 Figuri şi tabele icircn postere

4 Text scris sau incluse icircn text

5 Site-uri de WEB

Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor

Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie

Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele

exprimacircnd exact ceea ce acestea exprimă

Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate

anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel

să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se

acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca

mai sus sugestive sunt formatele simple şi puţin icircncărcate

Dacă nu există reguli impuse se respectă

1 Mesaj simplu fără falsificarea datelor

2 De obicei este necesar atacirct tabelul cacirct şi graficul

3 Să fie simplu şi clar

Tabele

Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile

coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică

elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de

1 Se folosesc doar linii orizontale

2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn

evidenţi prin linie de separare (Tabelul 4)

Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland

Noua Zeelandă)

(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)

47

3 Numerele sunt aliniate icircn funcţie de virgulă

4 Indicii statistici sunt explicaţi sub tabel

5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană

6 Abrevierile pot fi folosite

7 Numărul de zecimale trebuie limitat la maxim două

8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel

9 Plasarea legendei este obligatorie sub tabel

10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)

Icircn cazul prezentărilor orale sau a posterelor este indicat ca

1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării

2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte

3 Folosirea de simboluri este permisă

Clasificarea tabelelor

Tabelele se clasifică după

i) conţinut

bull cu distribuţii de frecvenţe

bull de clase de frecvenţe

bull de contingenţă

ii) structura

bull cu doua coloane

bull cu subclasificări

bull ldquomasterrdquo

Tabele ce conţin distribuţii de frecvenţe

O modalitate comodă de a prezenta o mulţime de date brute este

1 Se ordonează datele in ordine crescătoare

2 Se determine frecvenţa fiecărei valori

3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane

(Tabelul 5)

Tabelul 5 Distribuţii de frecvenţă absolută

48

Tabelul claselor de frecvenţe

1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă

2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)

Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)

Tabele de contingenţă

1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a

tabelelor de contingenţă

2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a

combinaţiilor de perechi ordonate de valori

3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre

a factor de risc si

b starea sănătăţii

4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)

5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)

Tabelul 7 Tabel de contingenţă 2 x 2

49

Grafice

Există două categorii de moduri grafice sub care se pot prezenta datele

1 Ilustraţii şi fotografii

2 Grafice

1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă

pentru lucrare

2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit

Putem vorbi despre mai multe tipuri de grafice

bull Grafice pentru reprezentarea datelor cantitative

1048707 Grafic cartezian (X Y)

1048707 Histograma

1048707 Poligonul de frecvenţe

1048707 Diagrama bdquoscatterrdquo

bull Grafice pentru reprezentarea datelor calitative

1048707 Grafic cu bare

1048707 Diagrama tip bdquoboxplotrdquo

1048707 Diagrama bdquopierdquo

1048707 Cartograma

Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi

dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)

Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)

Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie

Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)

Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)

50

Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir

de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele

două variabile studiate (Figura 6)

Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2

(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2

rămacircne aproximativ constantă)

Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea

comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea

comparativă a mai multor variabile

Figura 7 Grafic calitativ cu bare

51

Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo

Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două

posibilităţi reprezentate grafic este mai frecventă (Figura 8)

Figura 8 Reprezentare tip bdquopierdquo

Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli

sau a oricărui element comparativ Se foloseşte de epidemiologi

Rezultate

Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare

Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o

manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu

explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția

bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la

ilustraţii tabele grafice

Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi

nici rezultatele care invalidează eventual ipoteza

Discuţii

Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd

cultura ştiinţifică şi inteligenţa autorilor

Acest capitol răspunde la trei obiective

Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia

calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de

selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează

rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv

52

este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn

care a fost abordată problema fără a face o revistă a literaturii

Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea

rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul

Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor

afirmaţii nesusţinute de conţinutul lucrării

Concluzii

Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate

să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie

Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de

concluzii va scădea valoarea lucrării

Bibliografia (lista referinţelor citarea icircn text)

Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn

lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente

Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli

- să conţină cele mai importante şi recente lucrări

- să includă numai lucrări publicate

- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate

Bibliografie

Elisabeta Jaba ndash Statistică Ed Economică 1998

Mihai Ţarcă ndash Statistică volI Ed UAIC 1979

Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale

Ed University Press 2009

Sorana Daniela Bolboacă ndash Metodologia cercetării curs

53

Page 21: cercetarea medicala - metodologie

- Regiunea critică trebuie astfel aleasă icircncacirct dacă ipoteza alternativă H1 este adevărată

probabilitatea de respingere a ipotezei nule H0 este mai mare decacirct icircn cazul icircn care ipoteza nulă H0

ar fi adevărată

- Acceptarea ipotezei nule H0 atunci cacircnd ipoteza alternativă H1 este adevărată este cunoscută ca şi

eroarea de tipul II

a probabilitatea ei se notează cu b

b măsoară bdquonivelul de eroarerdquo

- Icircn testarea oricărei ipoteze statistice există patru situaţii care determină dacă decizia noastră este

corectă sau nu

Cazuri

H0 este adevărată H0 este falsă

Concluzie H0 se acceptă decizie corectă eroare de tipul

II

H0 se

respinge

eroare de tipul I decizie corectă

Luarea deciziei pe baza valorii probabilităţii p de semnificaţie a testului

Icircn momentul icircn care prelucrăm statistic o serie de date dorim să ştim dacă rezultatele obţinute sunt sau

nu semnificative statistic

Răspunsul la această icircntrebare este dat de valoarea lui p calculată de orice program statistic la

prelucrarea unor date

Icircn cazul testelor statistice ipoteza nulă este respinsă dacă nivelul de semnificaţie este mai mic decacirct

005 iar programele de prelucrare statistică a datelor vor afişa o steluţă () icircn tabelul rezultatelor

21

Dacă p le 005 respingem ipoteza nulă şi acceptăm ipoteza alternativă (am obţinut semnificaţia

statistică)

Dacă p gt 005 acceptăm ipoteza nulă (nu am obţinut semnificaţia statistică)

p = 013

NU respingem ipoteza nulă

Risc de eroare de tip II

α = 005

p = 002

Respingem ipoteza nulă

Risc de eroare de tip I

Semnificaţia lui p

Criteriu de luare a deciziei cu privire la o ipoteză statistică nulă

Cuantifică şansa ca o decizie de respingere a ipotezei nule să fie greşită

Măsură a semnificaţiei statistice şi NU CLINICĂ

22

Semnificaţia lui p (reguli empirice)

001 le p lt 005 rezultatul e semnificativ statistic

0001 le p lt 001 rezultatul e icircnalt semnificativ statistic

p lt 0001 rezultatul e foarte icircnalt semnificativ statistic

p ge 005 rezultatul e considerat nesemnificativ statistic

Limite ale valorii p

Valoarea p NU ne dă informaţii despre

Şansa de beneficiu a unui pacient individual

Procentul de pacienţi care vor avea un beneficiu icircn urma instituirii procedurii medicale

Gradul de beneficiu expectat pentru un anumit pacient

Puterea unui test statistic

Este capacitatea de a detecta o diferenţă acolo unde există

Creşterea volumului eşantionului determină creşterea puterii testului statistic aplicat

Valoarea este icircn relaţie directă cu eroarea de tip II

Puterea = 1 ndash β

Cea mai utilizată modalitate de creştere a puterii unui test statistic este de a creşte volumul

eşantionului

Tipul scalei de măsură ndash testul statistic

Denumire test Interval Nominal Observaţii

Corelaţie Pearson 2 0 Există o relaţie liniară

χ2 0 2

Student 1 1 Doar 2 grupuri

ANOVA 1 1 2 sau mai multe grupuri

Student perechi 1 1 Eşantioane perechi

Măsurători repetate (ANOVA) 1 1 Mai mult de 2 grupuri date

perechi

Inferenţa statistică pe date calitativ e

Tabela de contingenţă 2times2

Riscuri şi raţii

Testul χ2 (testarea asocierii icircn tabela de contingenţă)

Testul Fisher

23

Testul z pentru proporţii

Testul McNemar

Tabela de contingenţă 2times2

Scale de tip nominal (dicotomiale tabela de contingenţă de 2times2) sau ordinal (tabela de contingenţă de

rtimesc)

Frecvenţa absolută (numărul de evenimente per categorie)

Tabela de contingenţă de 2times2 4 categorii

AP = adevărat pozitiv

FP = fals pozitiv

FN = fals negativ

AN = adevărat negativ

Ulcer deschis Ulcer vindecat Total

Recurenţă + AP = 1 FP = 5 = 1+5 = 6

Recurenţă - FN = 7 AN = 16 = 7+16 = 23

Total =1+7=8 =5+16=21 29

Riscuri şi raţii Mărimi ale asocierii

Denumire Formula Definiţie

Rata falşilor pozitivi =FP(FP+AN) Probabilitatea unui test fals + (α)

Rata falşilor negativi =FN(FN+AP) Probabilitatea unui test fals ndash (β)

Sensibilitate =AP(AP+FN) Probabilitatea unui test real + (1- β)

Specificitate =AN(AN+FP) Probabilitatea unui test real ndash (1- α)

Acurateţe =(AP+AN)n Probabilitatea generală a unei decizii corecte

Valoarea predictivă pozitivă =AP(AP+FP) Probabilitatea ca un test pozitiv să fie corect

Valoarea predictivă negativă =AN(AN+FN) Probabilitatea ca un test negativ să fie corect

Riscul relativ =AP(FP+AN)FN(AP+FP)

Rata şansei =(AP∙AN)(FN∙FP)

Riscul atribuabil =AP(AP+FP)-FN(FN+AN)

24

Denumire Formula

Rata falşilor pozitivi = 5(5+1) = 08334

Rata falşilor negativi = 7(7+16) = 03043

Sensibilitate = 1(1+7) = 01250

Specificitate = 16(16+5) = 07619

Acurateţe = (1+16)29 = 05862

Valoarea predictivă pozitivă = 1(1+5) = 01667

Valoarea predictivă negativă = 16(16+7) = 06957

Riscul relativ = 1(5+16)7(1+5) = 2142 = 050

Rata şansei = (1∙16)(7∙5) = 04571

Riscul atribuabil = 1(1+5)-7(7+16) = 01667-03043=-01376

Testarea asocierii icircn tabela de contingenţă

Testul χ2

Nu trebuie utilizat pentru eşantioane de volum mic

Testul este valid doar dacă valoarea expectată (aşteptată) pentru fiecare celulă este cel puţin

egală cu 1 şi frecvenţa absolută observată este de minim 5

Dacă aceste condiţii nu sunt icircndeplinite se aplică testul exact al lui Fisher (Fisherrsquos Exact Test)

Indică dacă cele două variabile sunt sau nu independente DAR NU cuantifică puterea asocierii

dintre ele

Problema S-a investigat icircntr-un studiu asocierea dintre obezitatea (ca factor de risc) şi bolile

cardio-vasculare la persoanele icircn etate (gt 60 ani) Din totalul de 620 persoane investigate s-au

identificat 150 persoane cu obezitate şi boală cardio-vasculară 230 persoane fără obezitate şi

fără boală cardio-vasculară şi 60 persoane fără obezitate dar cu boală cardio-vasculară Există

o asociere icircntre obezitate şi boala cardio-vasculară (df=1 α=005 χ2critic = 384)

Testul χ2 exemplu

H025

Nu există asociere icircntre obezitate şi bolile cardio-vasculare

Obezitatea şi bolile cardio-vasculare sunt independente

H1

Există asociere icircntre obezitate şi bolile cardio-vasculare

Obezitatea şi bolile cardio-vasculare sunt asociate

a = 005 pragul de semnificaţie al testului

urmează o lege cu (r-1)(c-1) grade de libertate

χ2 = parametrul testului χ2

fio = frecvenţa observată

fit = frecvenţa teoretică

Regiunea critică este [χα2 yen)

Pentru α = 005 χα2 = 384

OBSERVAT BCV+ BCV- Total

Obezitate + AP = 150 FP = 180 330

Obezitate - FN = 60 AN = 230 290

Total 210 410 620

TEORETIC BCV+ BCV- Total

Obezitate + = 330times210620 = 330times410620 330

Obezitate - = 290times210620 = 290times410620 290

Total 210 410 620

TEORETIC BCV+ BCV- Total

Obezitate + = 330times210620 = 330times410620 330

26

Obezitate - = 290times210620 = 290times410620 290

Total 210 410 620

TEORETIC BCV+ BCV-

Obezitate + = 112 = 218

Obezitate - = 98 = 192

Deoarece 4177Icirc[384 yen) se respinge H0 cu un risc de eroare de 5

Există asociere icircntre obezitate şi bolile cardio-vasculare

Testul Fisher

Corecţie a testului χ2

Valoarea p asociată parametrului ne dă probabilitatea ca valoarea observată de independenţă să fie

atribuită doar şansei

O valoare p mică indică că există alte cauze decacirct şansa influenţează rezultatul şi astfel cele două

variabile investigate nu sunt independente

Testul Fisher = dispersia corectată a factorului x dispersia corectată a factorilor reziduali

Icircn acest context regula adunării dispersiilor se poate scrie unde

este variaţia lui y pe seama variaţiei variabilei x

este variaţia lui y pe seama influenţei factorilor reziduali (neicircnregistraţi)

este variaţia totală a caracteristicii y

Testul Fisher empiric se calculează după formula

27

se compară cu Ftab pentru nx şi nz grade de libertate la un anumit prag de semnificaţie stabilit

Dacă Fc gt Ftab rezultă că variaţia factorului de grupare x este semnificativă pentru variaţia caracteristicii y

Testul z pentru proporţii

1 Compararea unei frecvenţe observate cu o frecvenţă teoretică

2 Testarea egalităţii a două frecvenţe

Testul z Compararea unei frecvenţe observate cu o frecvenţă teoretică

Scop Investigarea semnificaţiei diferenţei icircntre o frecvenţă teoretică p (icircntr-o populaţie) şi o frecvenţă

observată f pe un eşantion reprezentativ (variabilă calitativă (binare))

Condiţii de aplicare Testul este corect aplicat dacă numărul n al observaţiilor eşantionului este

suficient de mare (n∙p n∙(1-p)gt10

Parametrul

n = volumul eşantionului

Suntem interesaţi de investigarea prevalenţei hepatitei B la personalul care lucrează icircn laboratoarele

clinicilor de boli infecţioase din Transilvania Se ştie din studii anterioare că prevalenţa hepatitei B icircn

populaţia generală din Transilvania este de 9 S-a luat icircn studiu un eşantion de 100 persoane şi s-a

obţinut o prevalenţă a hepatitei B de 6 Există diferenţă semnificativă icircntre frecvenţa hepatitei B la

personalul care lucrează icircn laboratoarele spitalelor de boli infecţioase din Transilvania faţă de

populaţia generală

f = 006 p = 009 n = 100

Ipoteza nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat

faţă de frecvenţa hepatitei B icircn populaţia generală

Ipoteza alternativă test bilateral Există diferenţă semnificativă icircntre frecvenţa hepatitei B la

nivelul eşantionului şi prevalenţa hepatitei B icircn populaţia generală

f = 006 p = 009 n = 100

Pragul de semnificaţie a = 005

Regiunea critică test bilateral (-yen -196 ]Egrave[196 yen)

28

Concluzia testului

Deoarece parametrul statistic calculat al testului nu aparţine regiunii critice se acceptă ipoteza

nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat faţă de

frecvenţa hepatitei B icircn populaţia generală

Testul McNemar

Evaluarea dependenţei variabilelor calitative perechi (dorim să determinăm dacă o anumită

caracteristică este sau nu asociată cu o anumită patologie)

Identificăm n pacienţi care prezintă patologia de interes (eg Cancer bronho-pulmonar) şi n

pacienţi cu aceleaşi caracteristici ca şi primul grup dar care nu o prezintă

Martor = da Martor = nu

Caz = da a b

Caz = nu c d

Testul McNemar - exemplu fumat vs cancer

Martor = da Martor = nu

Cancer = da a = 2 b = 5

Cancer = nu c = 0 d = 3

29

χ2critic(α=005) = 384

32 lt 384 rarr acceptăm ipoteza nulă

Fumatul nu este icircn relaţie cu apariţia cancerului bronho-pulmonar

Inferenţa statistică pe date cantitative

Variabile cantitative continue

Testul z şi Student (t) (o medie sau medii perechi)

Testul z şi Student (t) (testarea a două medii)

ANOVA (ge 3 medii)

Ranguri (variabile cantitative discrete sau cantitative care nu icircndeplinesc condiţia de

normalitate)

Testul sumei rangurilor Wilcoxon

Kruskal-Wallis (ge 3 eşantioane independente)

Friedman (ge 3 eşantioane dependente)

Teste de normalitate variabile cantitative continue

Shapiro-Wilk

Kolmogorov-Smirnov

Shapiro-Wilk

Chi-Square Goodness-of-Fit

Dacă datele urmează o distribuţie normală aplicăm un test parametric

Dacă datele nu urmează o distribuţie normală aplicăm un test de comparare al rangurilor

30

Testul Z de comparare a mediei unui eşantion cu media unei populaţii

Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ

extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie

s2 care se cunoaşte

Condiţii de aplicare

1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru

compararea mediei unui eşantion cu media unei populaţii)

2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal

distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă

3 Talia eşantionului este mare ( ge 30)

Ipoteze

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media

eşantionului şi media populaţiei

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

(-yen -196 ] Egrave [196 yen)

Parametrul testului

n = volumul eşantionului

= media eşantionului

s = deviaţia standard a populaţiei

Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)

Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard

cunoscută

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi

media standard

Condiţii de aplicare

Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se

realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această

condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea

31

Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai

puternic

Numărul de grade de libertate (df) df = n-1

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

Parametrul testului

n = volumul eşantionului

micro0 = media standard

= media eşantionului

s = deviaţia standard a eşantionului

Testul ANOVA compararea mediilor a mai multe eşantioane

H0 = toate mediile sunt egale

H1 = nu toate mediile sunt egale

Condiţii de aplicare

1 Datele sunt independente unele faţă de celelalte

2 Datele fiecărui grup sunt normal distribuite

3 Deviaţia standard este aceeaşi pentru toate grupurile

Id Medicament

A B C D E F

1 5 6 7 10 5 9

2 6 8 8 11 8 8

3 7 7 9 13 6 7

4 8 9 11 12 4 5

32

5 9 10 10 9 7 6

Suma 35 40 45 55 30 35

Media 7 8 9 11 6 7

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =

= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)

Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2

F = (suma pătratelor(icircntre))(suma pătratelor(icircn))

Suma pătratelor (icircntre) = 16times5 = 80

Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60

Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn

interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare

SP df Media pătratelor F = MPicircntreMPicircn

Icircntre 80 5 = 805 = 16 = 1625 = 64

Icircn 60 24 = 6024 = 25

Total 140 29 -

Testul sumei rangurilor Wilcoxon

Aplicat pentru

Un set de observaţii provenite dintr-o valoare ipotetică comună

Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)

Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero

Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace

Suma rangurilor pentru diferenţele negative = 2+3+1 = 6

Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30

33

Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului

egal cu 8 = 0109

Icircnainte După Diferenţa Rang

64 66 -2 2

66 58 8 5

67 68 -1 3

71 65 6 4

72 75 -3 1

76 67 9 6

78 59 19 8

89 74 15 7

Testul Kruskal-Wallis (ge 3 eşantioane independente)

Test de ranguri aplicate pe mai mult de 3 eşantioane

H = parametrul testului

n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)

Tk = suma rangurilor

Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie

pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni

34

df = k-1 (k = numărul de eşantioane)

df = 3-1 = 2

Hcritic(α=005) = 599

H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie

pozitivă şi respectiv biopsie negativă

Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie

a tipului de studiu pe eşantioane perechi)

1 Definirea numărului de tratamente k

2 Obţinerea rangurilor pentru fiecare tratament

3 Sumarea rangurilor fiecărui tratament

4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)

5 Dacă Fr gt Frcritic rarr respingem H0

Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost

măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi

n = 9 k = 3 T12 = 225 T2

2 = 38025 T32 = 38025

Frcritic = 599

Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de

prostată

35

De reţinut

Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei

Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-

of-Fit

Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z

Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t

Compararea mediilor a 3 sau mai multe eşantioane ANOVA

Compararea mediilor a două populaţii (σ) testul Z

Compararea mediilor a două eşantioane (s) testul t

Compararea mediilor a două eşantioane perechi (s) testul t

ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi

cu cel pentru compararea a două eşantioane perechi

Ranguri

Distribuţia datelor nu are importanţă

Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)

Trei sau mai multe eşantioane Kruskal-Wallis

Trei sau mai multe eşantioane perechi Friedman

Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia

Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a

datelor)

Variabile nominale

Un singur eşantion sau eşantioane perechi

Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte

Eşantioane perechi testul Mc Nemar

Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2

Icircn analiza proporţiilor există teste diferite pentru

Compararea unei frecvenţe cu o frecvenţă cunoscută

Compararea a două frecvenţe

Semnificaţia statistică

Valoarea p (p value)

Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor

două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E

posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării

aleatorii

36

Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală

urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii

Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este

probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un

experiment de dimensiunea acestuia

Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că

diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii

diferite

Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca

fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă

ar fi fost adevărată

Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă

1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe

baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De

fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001

2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie

3 Se aplică testul statistic aferent pentru a calcula valoarea p

4 Se compară valoarea p cu valoarea ndash prag

5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe

semnificativă dpdv statisticrdquo

6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e

semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să

conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă

Teste de semnificaţie

Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului

populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)

Testarea ipotezelor implică posibile erori

Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile

sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui

grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul

icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005

ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există

37

nici o diferenţă

Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ

statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de

ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost

ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau

dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă

cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă

semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe

ipotetice variate icircn cazul icircn care ele există

Măsuri ale frecvenţei

Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)

Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate

Generic formula pe care se bazează toate cele trei este

unde x şi y sunt cantităţile de comparat

Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea

unei frecvenţe pe grupe de sex vacircrstă etc

Proporţia implică icircn mod necesar ca x să fie inclus icircn y

Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară

frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp

Pentru calcularea unei rate trebuie ţinut cont de trei aspecte

bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin

bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp

bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo

Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un

tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei

populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei

aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)

38

Indicatori

Rata de incidenţă

Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă

icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii

Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o

perioadă de timp

Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de

timp x

Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei

susceptibili de a dezvolta icircmbolnăvirea studiată

Numitorul poate fi

bull Numărul mediu al populaţiei icircn perioada de timp studiată

bull Mărimea populaţiei icircn mijlocul perioadei de studiu

bull Mărimea populaţiei la icircnceputul studiului

Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă

Este obligatorie menţionarea perioadei de timp

Prevalenţa

Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la

un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă

schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa

momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)

39

Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include

numai cazuri noi respectiv include cazuri noi şi vechi

Rata de atac

Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este

folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp

raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori

Rata persoană-timp

Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din

momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte

migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost

observate

Riscul relativ (RR)

Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment

legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele

prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două

grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la

bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la

bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai

mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo

Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2

Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn

cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă

(Tabelul 1)

Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR

Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la

neexpuşi

40

Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de

culegere a datelor

Odds ratio (OR)

Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin

raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general

studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)

Tabelul 2 Tabelul 2 x 2 pentru calcularea OR

Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală

Rate de mortalitate

Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp

specificată Există mai multe tipuri de rate de mortalitate

o Mortalitate specifică pe sex

o Mortalitate specifică pe rasă

o Mortalitate specifică pe boală

o Mortalitate neonatală

o Mortalitate postneonatală

o Mortalitate infantilă

o Mortalitate maternă

Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP

41

Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de

viaţă şi vacircrsta la care survine decesul dacă este prematur

Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu

Ani de viaţă pierduţi datorat dizabilităţii

Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt

utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru

cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite

grupuri

Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de

risc şi o boală se folosesc riscul relativ şi odds ratio

35 Analiza şi interpretarea datelor

După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date

trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul

Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor

colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului

studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu

plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde

prezenţa biostatisticianului este necesară

Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu

elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat

iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului

iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate

depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori

testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere

clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza

Interpretarea rezultatelor statistice

Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne

motive (număr mic de date) acceptarea ei să fie falsă

Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine

gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia

ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument

de decizie Intervalul de confidenţă

42

Interpretarea statistica ne interpretarea clinică

Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă

Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice

obţinute pe eşantionul studiat

Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare

Ce interpretăm Rezultatele

personale obţinute icircn urma studiului

care au fost prezentate icircn secţiunea bdquoRezultaterdquo

Explicăm rezultatele obţinute

Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale

Interpretarea trebuie să se realizeze icircn

lumina limitelor studiului

contextul cultural social şi educaţional al locului unde s-a realizat cercetarea

contextul a ceea ce se cunoaşte din literatura de specialitate

Interpretăm doar rezultatele personale obţinute icircn urma studiului

Interpretarea statistică nu este tot una cu interpretarea clinică

Interpretarea statistică este importantă

Interpretarea clinică este foarte importantă

Intervalul de confidenţă

Media calculată pe baza unui eşantion nu va echivala media populaţiei

Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului

Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a

populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a

populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)

pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru

orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare

dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de

confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de

date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de

5

Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel

Dacă valoarea p este mică

Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare

aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o

medie diferită Diferenţa este semnificativă dpdv statistic

43

Icircn continuare

Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa

reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică

pentru a fi interesante din punct de vedere ştiinţific

Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC

oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care

este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a

obţine o concluzie clară

Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o

diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că

datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din

punct de vedere ştiinţific

Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul

detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat

Erorile studiilor medicale

Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura

anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară

caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea

asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri

legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias

Erorile potenţiale icircn studiile epidemiologice

1 Erori icircntacircmplătoare

2 Erori sistematice

3 Confuzia

4 Validitatea

1 Erori icircntacircmplătoare

Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a

parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel

de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot

fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii

(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor

de măsură (eroarea de măsurare)

44

2 Erori sistematice

Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate

care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu

acurateţe mare Acurateţea nu este afectată de mărimea eşantionului

Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de

experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea

dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus

şi greu de cuantificat (consum de alcool personalitate etc)

Principalele tipuri de erori din această categorie sunt

bull Biasul de selecţie

bull Biasul de informaţie

Biasul de selecţie

Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul

trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion

inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale

persoanelor incluse

Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se

ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia

Biasul de informaţie

Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de

instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze

expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere

nesemnificativă sau chiar să nu şi-o amintească de loc

3 Confuzia

Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune

prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este

cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă

de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte

important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor

protector

4 Validitatea

Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă

Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte

estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional

Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă

45

conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se

demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)

Validitatea externă se poate realiza numai dacă studiul este valid intern

Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii

studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de

studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt

laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi

validă din punct de vedere intern)

3 6 Prezentarea rezultatelor

După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite

Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor

icircntr-o formă bdquodigerabilărdquo este necesară

Scopul prezentării datelor

1 Transmiterea concluziilor studiului

a Datele corecte şi importante merită comunicate

b Datele trebuie să confirme sau să infirme ipoteza studiului

c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală

2 Acordarea posibilităţii altor cercetători să aprecieze studiul

a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti

b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor

prezentate

Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru

fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie

statistică

Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de

valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras

(Tabel 3)

Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)

46

Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct

numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor

precum şi prezentarea acestora sub formă inteligibilă

Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care

convin cercetătorului

Prezentarea datelor se poate face

1 Figuri şi tabele icircn articole scrise

2 Figuri şi tabele icircn prezentări orale

3 Figuri şi tabele icircn postere

4 Text scris sau incluse icircn text

5 Site-uri de WEB

Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor

Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie

Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele

exprimacircnd exact ceea ce acestea exprimă

Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate

anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel

să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se

acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca

mai sus sugestive sunt formatele simple şi puţin icircncărcate

Dacă nu există reguli impuse se respectă

1 Mesaj simplu fără falsificarea datelor

2 De obicei este necesar atacirct tabelul cacirct şi graficul

3 Să fie simplu şi clar

Tabele

Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile

coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică

elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de

1 Se folosesc doar linii orizontale

2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn

evidenţi prin linie de separare (Tabelul 4)

Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland

Noua Zeelandă)

(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)

47

3 Numerele sunt aliniate icircn funcţie de virgulă

4 Indicii statistici sunt explicaţi sub tabel

5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană

6 Abrevierile pot fi folosite

7 Numărul de zecimale trebuie limitat la maxim două

8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel

9 Plasarea legendei este obligatorie sub tabel

10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)

Icircn cazul prezentărilor orale sau a posterelor este indicat ca

1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării

2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte

3 Folosirea de simboluri este permisă

Clasificarea tabelelor

Tabelele se clasifică după

i) conţinut

bull cu distribuţii de frecvenţe

bull de clase de frecvenţe

bull de contingenţă

ii) structura

bull cu doua coloane

bull cu subclasificări

bull ldquomasterrdquo

Tabele ce conţin distribuţii de frecvenţe

O modalitate comodă de a prezenta o mulţime de date brute este

1 Se ordonează datele in ordine crescătoare

2 Se determine frecvenţa fiecărei valori

3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane

(Tabelul 5)

Tabelul 5 Distribuţii de frecvenţă absolută

48

Tabelul claselor de frecvenţe

1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă

2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)

Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)

Tabele de contingenţă

1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a

tabelelor de contingenţă

2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a

combinaţiilor de perechi ordonate de valori

3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre

a factor de risc si

b starea sănătăţii

4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)

5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)

Tabelul 7 Tabel de contingenţă 2 x 2

49

Grafice

Există două categorii de moduri grafice sub care se pot prezenta datele

1 Ilustraţii şi fotografii

2 Grafice

1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă

pentru lucrare

2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit

Putem vorbi despre mai multe tipuri de grafice

bull Grafice pentru reprezentarea datelor cantitative

1048707 Grafic cartezian (X Y)

1048707 Histograma

1048707 Poligonul de frecvenţe

1048707 Diagrama bdquoscatterrdquo

bull Grafice pentru reprezentarea datelor calitative

1048707 Grafic cu bare

1048707 Diagrama tip bdquoboxplotrdquo

1048707 Diagrama bdquopierdquo

1048707 Cartograma

Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi

dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)

Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)

Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie

Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)

Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)

50

Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir

de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele

două variabile studiate (Figura 6)

Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2

(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2

rămacircne aproximativ constantă)

Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea

comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea

comparativă a mai multor variabile

Figura 7 Grafic calitativ cu bare

51

Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo

Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două

posibilităţi reprezentate grafic este mai frecventă (Figura 8)

Figura 8 Reprezentare tip bdquopierdquo

Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli

sau a oricărui element comparativ Se foloseşte de epidemiologi

Rezultate

Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare

Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o

manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu

explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția

bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la

ilustraţii tabele grafice

Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi

nici rezultatele care invalidează eventual ipoteza

Discuţii

Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd

cultura ştiinţifică şi inteligenţa autorilor

Acest capitol răspunde la trei obiective

Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia

calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de

selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează

rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv

52

este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn

care a fost abordată problema fără a face o revistă a literaturii

Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea

rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul

Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor

afirmaţii nesusţinute de conţinutul lucrării

Concluzii

Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate

să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie

Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de

concluzii va scădea valoarea lucrării

Bibliografia (lista referinţelor citarea icircn text)

Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn

lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente

Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli

- să conţină cele mai importante şi recente lucrări

- să includă numai lucrări publicate

- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate

Bibliografie

Elisabeta Jaba ndash Statistică Ed Economică 1998

Mihai Ţarcă ndash Statistică volI Ed UAIC 1979

Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale

Ed University Press 2009

Sorana Daniela Bolboacă ndash Metodologia cercetării curs

53

Page 22: cercetarea medicala - metodologie

Dacă p le 005 respingem ipoteza nulă şi acceptăm ipoteza alternativă (am obţinut semnificaţia

statistică)

Dacă p gt 005 acceptăm ipoteza nulă (nu am obţinut semnificaţia statistică)

p = 013

NU respingem ipoteza nulă

Risc de eroare de tip II

α = 005

p = 002

Respingem ipoteza nulă

Risc de eroare de tip I

Semnificaţia lui p

Criteriu de luare a deciziei cu privire la o ipoteză statistică nulă

Cuantifică şansa ca o decizie de respingere a ipotezei nule să fie greşită

Măsură a semnificaţiei statistice şi NU CLINICĂ

22

Semnificaţia lui p (reguli empirice)

001 le p lt 005 rezultatul e semnificativ statistic

0001 le p lt 001 rezultatul e icircnalt semnificativ statistic

p lt 0001 rezultatul e foarte icircnalt semnificativ statistic

p ge 005 rezultatul e considerat nesemnificativ statistic

Limite ale valorii p

Valoarea p NU ne dă informaţii despre

Şansa de beneficiu a unui pacient individual

Procentul de pacienţi care vor avea un beneficiu icircn urma instituirii procedurii medicale

Gradul de beneficiu expectat pentru un anumit pacient

Puterea unui test statistic

Este capacitatea de a detecta o diferenţă acolo unde există

Creşterea volumului eşantionului determină creşterea puterii testului statistic aplicat

Valoarea este icircn relaţie directă cu eroarea de tip II

Puterea = 1 ndash β

Cea mai utilizată modalitate de creştere a puterii unui test statistic este de a creşte volumul

eşantionului

Tipul scalei de măsură ndash testul statistic

Denumire test Interval Nominal Observaţii

Corelaţie Pearson 2 0 Există o relaţie liniară

χ2 0 2

Student 1 1 Doar 2 grupuri

ANOVA 1 1 2 sau mai multe grupuri

Student perechi 1 1 Eşantioane perechi

Măsurători repetate (ANOVA) 1 1 Mai mult de 2 grupuri date

perechi

Inferenţa statistică pe date calitativ e

Tabela de contingenţă 2times2

Riscuri şi raţii

Testul χ2 (testarea asocierii icircn tabela de contingenţă)

Testul Fisher

23

Testul z pentru proporţii

Testul McNemar

Tabela de contingenţă 2times2

Scale de tip nominal (dicotomiale tabela de contingenţă de 2times2) sau ordinal (tabela de contingenţă de

rtimesc)

Frecvenţa absolută (numărul de evenimente per categorie)

Tabela de contingenţă de 2times2 4 categorii

AP = adevărat pozitiv

FP = fals pozitiv

FN = fals negativ

AN = adevărat negativ

Ulcer deschis Ulcer vindecat Total

Recurenţă + AP = 1 FP = 5 = 1+5 = 6

Recurenţă - FN = 7 AN = 16 = 7+16 = 23

Total =1+7=8 =5+16=21 29

Riscuri şi raţii Mărimi ale asocierii

Denumire Formula Definiţie

Rata falşilor pozitivi =FP(FP+AN) Probabilitatea unui test fals + (α)

Rata falşilor negativi =FN(FN+AP) Probabilitatea unui test fals ndash (β)

Sensibilitate =AP(AP+FN) Probabilitatea unui test real + (1- β)

Specificitate =AN(AN+FP) Probabilitatea unui test real ndash (1- α)

Acurateţe =(AP+AN)n Probabilitatea generală a unei decizii corecte

Valoarea predictivă pozitivă =AP(AP+FP) Probabilitatea ca un test pozitiv să fie corect

Valoarea predictivă negativă =AN(AN+FN) Probabilitatea ca un test negativ să fie corect

Riscul relativ =AP(FP+AN)FN(AP+FP)

Rata şansei =(AP∙AN)(FN∙FP)

Riscul atribuabil =AP(AP+FP)-FN(FN+AN)

24

Denumire Formula

Rata falşilor pozitivi = 5(5+1) = 08334

Rata falşilor negativi = 7(7+16) = 03043

Sensibilitate = 1(1+7) = 01250

Specificitate = 16(16+5) = 07619

Acurateţe = (1+16)29 = 05862

Valoarea predictivă pozitivă = 1(1+5) = 01667

Valoarea predictivă negativă = 16(16+7) = 06957

Riscul relativ = 1(5+16)7(1+5) = 2142 = 050

Rata şansei = (1∙16)(7∙5) = 04571

Riscul atribuabil = 1(1+5)-7(7+16) = 01667-03043=-01376

Testarea asocierii icircn tabela de contingenţă

Testul χ2

Nu trebuie utilizat pentru eşantioane de volum mic

Testul este valid doar dacă valoarea expectată (aşteptată) pentru fiecare celulă este cel puţin

egală cu 1 şi frecvenţa absolută observată este de minim 5

Dacă aceste condiţii nu sunt icircndeplinite se aplică testul exact al lui Fisher (Fisherrsquos Exact Test)

Indică dacă cele două variabile sunt sau nu independente DAR NU cuantifică puterea asocierii

dintre ele

Problema S-a investigat icircntr-un studiu asocierea dintre obezitatea (ca factor de risc) şi bolile

cardio-vasculare la persoanele icircn etate (gt 60 ani) Din totalul de 620 persoane investigate s-au

identificat 150 persoane cu obezitate şi boală cardio-vasculară 230 persoane fără obezitate şi

fără boală cardio-vasculară şi 60 persoane fără obezitate dar cu boală cardio-vasculară Există

o asociere icircntre obezitate şi boala cardio-vasculară (df=1 α=005 χ2critic = 384)

Testul χ2 exemplu

H025

Nu există asociere icircntre obezitate şi bolile cardio-vasculare

Obezitatea şi bolile cardio-vasculare sunt independente

H1

Există asociere icircntre obezitate şi bolile cardio-vasculare

Obezitatea şi bolile cardio-vasculare sunt asociate

a = 005 pragul de semnificaţie al testului

urmează o lege cu (r-1)(c-1) grade de libertate

χ2 = parametrul testului χ2

fio = frecvenţa observată

fit = frecvenţa teoretică

Regiunea critică este [χα2 yen)

Pentru α = 005 χα2 = 384

OBSERVAT BCV+ BCV- Total

Obezitate + AP = 150 FP = 180 330

Obezitate - FN = 60 AN = 230 290

Total 210 410 620

TEORETIC BCV+ BCV- Total

Obezitate + = 330times210620 = 330times410620 330

Obezitate - = 290times210620 = 290times410620 290

Total 210 410 620

TEORETIC BCV+ BCV- Total

Obezitate + = 330times210620 = 330times410620 330

26

Obezitate - = 290times210620 = 290times410620 290

Total 210 410 620

TEORETIC BCV+ BCV-

Obezitate + = 112 = 218

Obezitate - = 98 = 192

Deoarece 4177Icirc[384 yen) se respinge H0 cu un risc de eroare de 5

Există asociere icircntre obezitate şi bolile cardio-vasculare

Testul Fisher

Corecţie a testului χ2

Valoarea p asociată parametrului ne dă probabilitatea ca valoarea observată de independenţă să fie

atribuită doar şansei

O valoare p mică indică că există alte cauze decacirct şansa influenţează rezultatul şi astfel cele două

variabile investigate nu sunt independente

Testul Fisher = dispersia corectată a factorului x dispersia corectată a factorilor reziduali

Icircn acest context regula adunării dispersiilor se poate scrie unde

este variaţia lui y pe seama variaţiei variabilei x

este variaţia lui y pe seama influenţei factorilor reziduali (neicircnregistraţi)

este variaţia totală a caracteristicii y

Testul Fisher empiric se calculează după formula

27

se compară cu Ftab pentru nx şi nz grade de libertate la un anumit prag de semnificaţie stabilit

Dacă Fc gt Ftab rezultă că variaţia factorului de grupare x este semnificativă pentru variaţia caracteristicii y

Testul z pentru proporţii

1 Compararea unei frecvenţe observate cu o frecvenţă teoretică

2 Testarea egalităţii a două frecvenţe

Testul z Compararea unei frecvenţe observate cu o frecvenţă teoretică

Scop Investigarea semnificaţiei diferenţei icircntre o frecvenţă teoretică p (icircntr-o populaţie) şi o frecvenţă

observată f pe un eşantion reprezentativ (variabilă calitativă (binare))

Condiţii de aplicare Testul este corect aplicat dacă numărul n al observaţiilor eşantionului este

suficient de mare (n∙p n∙(1-p)gt10

Parametrul

n = volumul eşantionului

Suntem interesaţi de investigarea prevalenţei hepatitei B la personalul care lucrează icircn laboratoarele

clinicilor de boli infecţioase din Transilvania Se ştie din studii anterioare că prevalenţa hepatitei B icircn

populaţia generală din Transilvania este de 9 S-a luat icircn studiu un eşantion de 100 persoane şi s-a

obţinut o prevalenţă a hepatitei B de 6 Există diferenţă semnificativă icircntre frecvenţa hepatitei B la

personalul care lucrează icircn laboratoarele spitalelor de boli infecţioase din Transilvania faţă de

populaţia generală

f = 006 p = 009 n = 100

Ipoteza nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat

faţă de frecvenţa hepatitei B icircn populaţia generală

Ipoteza alternativă test bilateral Există diferenţă semnificativă icircntre frecvenţa hepatitei B la

nivelul eşantionului şi prevalenţa hepatitei B icircn populaţia generală

f = 006 p = 009 n = 100

Pragul de semnificaţie a = 005

Regiunea critică test bilateral (-yen -196 ]Egrave[196 yen)

28

Concluzia testului

Deoarece parametrul statistic calculat al testului nu aparţine regiunii critice se acceptă ipoteza

nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat faţă de

frecvenţa hepatitei B icircn populaţia generală

Testul McNemar

Evaluarea dependenţei variabilelor calitative perechi (dorim să determinăm dacă o anumită

caracteristică este sau nu asociată cu o anumită patologie)

Identificăm n pacienţi care prezintă patologia de interes (eg Cancer bronho-pulmonar) şi n

pacienţi cu aceleaşi caracteristici ca şi primul grup dar care nu o prezintă

Martor = da Martor = nu

Caz = da a b

Caz = nu c d

Testul McNemar - exemplu fumat vs cancer

Martor = da Martor = nu

Cancer = da a = 2 b = 5

Cancer = nu c = 0 d = 3

29

χ2critic(α=005) = 384

32 lt 384 rarr acceptăm ipoteza nulă

Fumatul nu este icircn relaţie cu apariţia cancerului bronho-pulmonar

Inferenţa statistică pe date cantitative

Variabile cantitative continue

Testul z şi Student (t) (o medie sau medii perechi)

Testul z şi Student (t) (testarea a două medii)

ANOVA (ge 3 medii)

Ranguri (variabile cantitative discrete sau cantitative care nu icircndeplinesc condiţia de

normalitate)

Testul sumei rangurilor Wilcoxon

Kruskal-Wallis (ge 3 eşantioane independente)

Friedman (ge 3 eşantioane dependente)

Teste de normalitate variabile cantitative continue

Shapiro-Wilk

Kolmogorov-Smirnov

Shapiro-Wilk

Chi-Square Goodness-of-Fit

Dacă datele urmează o distribuţie normală aplicăm un test parametric

Dacă datele nu urmează o distribuţie normală aplicăm un test de comparare al rangurilor

30

Testul Z de comparare a mediei unui eşantion cu media unei populaţii

Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ

extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie

s2 care se cunoaşte

Condiţii de aplicare

1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru

compararea mediei unui eşantion cu media unei populaţii)

2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal

distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă

3 Talia eşantionului este mare ( ge 30)

Ipoteze

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media

eşantionului şi media populaţiei

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

(-yen -196 ] Egrave [196 yen)

Parametrul testului

n = volumul eşantionului

= media eşantionului

s = deviaţia standard a populaţiei

Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)

Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard

cunoscută

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi

media standard

Condiţii de aplicare

Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se

realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această

condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea

31

Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai

puternic

Numărul de grade de libertate (df) df = n-1

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

Parametrul testului

n = volumul eşantionului

micro0 = media standard

= media eşantionului

s = deviaţia standard a eşantionului

Testul ANOVA compararea mediilor a mai multe eşantioane

H0 = toate mediile sunt egale

H1 = nu toate mediile sunt egale

Condiţii de aplicare

1 Datele sunt independente unele faţă de celelalte

2 Datele fiecărui grup sunt normal distribuite

3 Deviaţia standard este aceeaşi pentru toate grupurile

Id Medicament

A B C D E F

1 5 6 7 10 5 9

2 6 8 8 11 8 8

3 7 7 9 13 6 7

4 8 9 11 12 4 5

32

5 9 10 10 9 7 6

Suma 35 40 45 55 30 35

Media 7 8 9 11 6 7

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =

= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)

Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2

F = (suma pătratelor(icircntre))(suma pătratelor(icircn))

Suma pătratelor (icircntre) = 16times5 = 80

Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60

Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn

interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare

SP df Media pătratelor F = MPicircntreMPicircn

Icircntre 80 5 = 805 = 16 = 1625 = 64

Icircn 60 24 = 6024 = 25

Total 140 29 -

Testul sumei rangurilor Wilcoxon

Aplicat pentru

Un set de observaţii provenite dintr-o valoare ipotetică comună

Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)

Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero

Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace

Suma rangurilor pentru diferenţele negative = 2+3+1 = 6

Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30

33

Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului

egal cu 8 = 0109

Icircnainte După Diferenţa Rang

64 66 -2 2

66 58 8 5

67 68 -1 3

71 65 6 4

72 75 -3 1

76 67 9 6

78 59 19 8

89 74 15 7

Testul Kruskal-Wallis (ge 3 eşantioane independente)

Test de ranguri aplicate pe mai mult de 3 eşantioane

H = parametrul testului

n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)

Tk = suma rangurilor

Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie

pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni

34

df = k-1 (k = numărul de eşantioane)

df = 3-1 = 2

Hcritic(α=005) = 599

H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie

pozitivă şi respectiv biopsie negativă

Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie

a tipului de studiu pe eşantioane perechi)

1 Definirea numărului de tratamente k

2 Obţinerea rangurilor pentru fiecare tratament

3 Sumarea rangurilor fiecărui tratament

4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)

5 Dacă Fr gt Frcritic rarr respingem H0

Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost

măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi

n = 9 k = 3 T12 = 225 T2

2 = 38025 T32 = 38025

Frcritic = 599

Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de

prostată

35

De reţinut

Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei

Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-

of-Fit

Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z

Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t

Compararea mediilor a 3 sau mai multe eşantioane ANOVA

Compararea mediilor a două populaţii (σ) testul Z

Compararea mediilor a două eşantioane (s) testul t

Compararea mediilor a două eşantioane perechi (s) testul t

ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi

cu cel pentru compararea a două eşantioane perechi

Ranguri

Distribuţia datelor nu are importanţă

Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)

Trei sau mai multe eşantioane Kruskal-Wallis

Trei sau mai multe eşantioane perechi Friedman

Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia

Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a

datelor)

Variabile nominale

Un singur eşantion sau eşantioane perechi

Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte

Eşantioane perechi testul Mc Nemar

Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2

Icircn analiza proporţiilor există teste diferite pentru

Compararea unei frecvenţe cu o frecvenţă cunoscută

Compararea a două frecvenţe

Semnificaţia statistică

Valoarea p (p value)

Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor

două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E

posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării

aleatorii

36

Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală

urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii

Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este

probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un

experiment de dimensiunea acestuia

Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că

diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii

diferite

Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca

fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă

ar fi fost adevărată

Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă

1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe

baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De

fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001

2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie

3 Se aplică testul statistic aferent pentru a calcula valoarea p

4 Se compară valoarea p cu valoarea ndash prag

5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe

semnificativă dpdv statisticrdquo

6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e

semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să

conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă

Teste de semnificaţie

Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului

populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)

Testarea ipotezelor implică posibile erori

Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile

sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui

grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul

icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005

ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există

37

nici o diferenţă

Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ

statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de

ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost

ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau

dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă

cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă

semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe

ipotetice variate icircn cazul icircn care ele există

Măsuri ale frecvenţei

Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)

Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate

Generic formula pe care se bazează toate cele trei este

unde x şi y sunt cantităţile de comparat

Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea

unei frecvenţe pe grupe de sex vacircrstă etc

Proporţia implică icircn mod necesar ca x să fie inclus icircn y

Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară

frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp

Pentru calcularea unei rate trebuie ţinut cont de trei aspecte

bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin

bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp

bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo

Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un

tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei

populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei

aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)

38

Indicatori

Rata de incidenţă

Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă

icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii

Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o

perioadă de timp

Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de

timp x

Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei

susceptibili de a dezvolta icircmbolnăvirea studiată

Numitorul poate fi

bull Numărul mediu al populaţiei icircn perioada de timp studiată

bull Mărimea populaţiei icircn mijlocul perioadei de studiu

bull Mărimea populaţiei la icircnceputul studiului

Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă

Este obligatorie menţionarea perioadei de timp

Prevalenţa

Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la

un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă

schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa

momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)

39

Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include

numai cazuri noi respectiv include cazuri noi şi vechi

Rata de atac

Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este

folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp

raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori

Rata persoană-timp

Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din

momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte

migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost

observate

Riscul relativ (RR)

Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment

legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele

prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două

grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la

bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la

bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai

mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo

Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2

Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn

cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă

(Tabelul 1)

Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR

Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la

neexpuşi

40

Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de

culegere a datelor

Odds ratio (OR)

Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin

raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general

studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)

Tabelul 2 Tabelul 2 x 2 pentru calcularea OR

Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală

Rate de mortalitate

Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp

specificată Există mai multe tipuri de rate de mortalitate

o Mortalitate specifică pe sex

o Mortalitate specifică pe rasă

o Mortalitate specifică pe boală

o Mortalitate neonatală

o Mortalitate postneonatală

o Mortalitate infantilă

o Mortalitate maternă

Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP

41

Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de

viaţă şi vacircrsta la care survine decesul dacă este prematur

Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu

Ani de viaţă pierduţi datorat dizabilităţii

Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt

utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru

cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite

grupuri

Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de

risc şi o boală se folosesc riscul relativ şi odds ratio

35 Analiza şi interpretarea datelor

După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date

trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul

Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor

colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului

studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu

plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde

prezenţa biostatisticianului este necesară

Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu

elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat

iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului

iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate

depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori

testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere

clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza

Interpretarea rezultatelor statistice

Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne

motive (număr mic de date) acceptarea ei să fie falsă

Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine

gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia

ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument

de decizie Intervalul de confidenţă

42

Interpretarea statistica ne interpretarea clinică

Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă

Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice

obţinute pe eşantionul studiat

Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare

Ce interpretăm Rezultatele

personale obţinute icircn urma studiului

care au fost prezentate icircn secţiunea bdquoRezultaterdquo

Explicăm rezultatele obţinute

Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale

Interpretarea trebuie să se realizeze icircn

lumina limitelor studiului

contextul cultural social şi educaţional al locului unde s-a realizat cercetarea

contextul a ceea ce se cunoaşte din literatura de specialitate

Interpretăm doar rezultatele personale obţinute icircn urma studiului

Interpretarea statistică nu este tot una cu interpretarea clinică

Interpretarea statistică este importantă

Interpretarea clinică este foarte importantă

Intervalul de confidenţă

Media calculată pe baza unui eşantion nu va echivala media populaţiei

Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului

Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a

populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a

populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)

pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru

orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare

dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de

confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de

date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de

5

Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel

Dacă valoarea p este mică

Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare

aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o

medie diferită Diferenţa este semnificativă dpdv statistic

43

Icircn continuare

Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa

reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică

pentru a fi interesante din punct de vedere ştiinţific

Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC

oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care

este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a

obţine o concluzie clară

Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o

diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că

datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din

punct de vedere ştiinţific

Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul

detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat

Erorile studiilor medicale

Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura

anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară

caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea

asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri

legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias

Erorile potenţiale icircn studiile epidemiologice

1 Erori icircntacircmplătoare

2 Erori sistematice

3 Confuzia

4 Validitatea

1 Erori icircntacircmplătoare

Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a

parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel

de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot

fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii

(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor

de măsură (eroarea de măsurare)

44

2 Erori sistematice

Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate

care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu

acurateţe mare Acurateţea nu este afectată de mărimea eşantionului

Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de

experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea

dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus

şi greu de cuantificat (consum de alcool personalitate etc)

Principalele tipuri de erori din această categorie sunt

bull Biasul de selecţie

bull Biasul de informaţie

Biasul de selecţie

Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul

trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion

inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale

persoanelor incluse

Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se

ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia

Biasul de informaţie

Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de

instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze

expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere

nesemnificativă sau chiar să nu şi-o amintească de loc

3 Confuzia

Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune

prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este

cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă

de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte

important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor

protector

4 Validitatea

Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă

Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte

estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional

Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă

45

conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se

demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)

Validitatea externă se poate realiza numai dacă studiul este valid intern

Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii

studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de

studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt

laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi

validă din punct de vedere intern)

3 6 Prezentarea rezultatelor

După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite

Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor

icircntr-o formă bdquodigerabilărdquo este necesară

Scopul prezentării datelor

1 Transmiterea concluziilor studiului

a Datele corecte şi importante merită comunicate

b Datele trebuie să confirme sau să infirme ipoteza studiului

c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală

2 Acordarea posibilităţii altor cercetători să aprecieze studiul

a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti

b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor

prezentate

Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru

fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie

statistică

Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de

valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras

(Tabel 3)

Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)

46

Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct

numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor

precum şi prezentarea acestora sub formă inteligibilă

Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care

convin cercetătorului

Prezentarea datelor se poate face

1 Figuri şi tabele icircn articole scrise

2 Figuri şi tabele icircn prezentări orale

3 Figuri şi tabele icircn postere

4 Text scris sau incluse icircn text

5 Site-uri de WEB

Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor

Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie

Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele

exprimacircnd exact ceea ce acestea exprimă

Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate

anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel

să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se

acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca

mai sus sugestive sunt formatele simple şi puţin icircncărcate

Dacă nu există reguli impuse se respectă

1 Mesaj simplu fără falsificarea datelor

2 De obicei este necesar atacirct tabelul cacirct şi graficul

3 Să fie simplu şi clar

Tabele

Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile

coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică

elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de

1 Se folosesc doar linii orizontale

2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn

evidenţi prin linie de separare (Tabelul 4)

Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland

Noua Zeelandă)

(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)

47

3 Numerele sunt aliniate icircn funcţie de virgulă

4 Indicii statistici sunt explicaţi sub tabel

5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană

6 Abrevierile pot fi folosite

7 Numărul de zecimale trebuie limitat la maxim două

8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel

9 Plasarea legendei este obligatorie sub tabel

10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)

Icircn cazul prezentărilor orale sau a posterelor este indicat ca

1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării

2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte

3 Folosirea de simboluri este permisă

Clasificarea tabelelor

Tabelele se clasifică după

i) conţinut

bull cu distribuţii de frecvenţe

bull de clase de frecvenţe

bull de contingenţă

ii) structura

bull cu doua coloane

bull cu subclasificări

bull ldquomasterrdquo

Tabele ce conţin distribuţii de frecvenţe

O modalitate comodă de a prezenta o mulţime de date brute este

1 Se ordonează datele in ordine crescătoare

2 Se determine frecvenţa fiecărei valori

3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane

(Tabelul 5)

Tabelul 5 Distribuţii de frecvenţă absolută

48

Tabelul claselor de frecvenţe

1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă

2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)

Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)

Tabele de contingenţă

1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a

tabelelor de contingenţă

2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a

combinaţiilor de perechi ordonate de valori

3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre

a factor de risc si

b starea sănătăţii

4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)

5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)

Tabelul 7 Tabel de contingenţă 2 x 2

49

Grafice

Există două categorii de moduri grafice sub care se pot prezenta datele

1 Ilustraţii şi fotografii

2 Grafice

1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă

pentru lucrare

2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit

Putem vorbi despre mai multe tipuri de grafice

bull Grafice pentru reprezentarea datelor cantitative

1048707 Grafic cartezian (X Y)

1048707 Histograma

1048707 Poligonul de frecvenţe

1048707 Diagrama bdquoscatterrdquo

bull Grafice pentru reprezentarea datelor calitative

1048707 Grafic cu bare

1048707 Diagrama tip bdquoboxplotrdquo

1048707 Diagrama bdquopierdquo

1048707 Cartograma

Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi

dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)

Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)

Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie

Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)

Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)

50

Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir

de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele

două variabile studiate (Figura 6)

Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2

(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2

rămacircne aproximativ constantă)

Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea

comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea

comparativă a mai multor variabile

Figura 7 Grafic calitativ cu bare

51

Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo

Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două

posibilităţi reprezentate grafic este mai frecventă (Figura 8)

Figura 8 Reprezentare tip bdquopierdquo

Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli

sau a oricărui element comparativ Se foloseşte de epidemiologi

Rezultate

Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare

Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o

manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu

explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția

bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la

ilustraţii tabele grafice

Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi

nici rezultatele care invalidează eventual ipoteza

Discuţii

Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd

cultura ştiinţifică şi inteligenţa autorilor

Acest capitol răspunde la trei obiective

Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia

calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de

selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează

rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv

52

este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn

care a fost abordată problema fără a face o revistă a literaturii

Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea

rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul

Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor

afirmaţii nesusţinute de conţinutul lucrării

Concluzii

Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate

să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie

Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de

concluzii va scădea valoarea lucrării

Bibliografia (lista referinţelor citarea icircn text)

Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn

lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente

Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli

- să conţină cele mai importante şi recente lucrări

- să includă numai lucrări publicate

- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate

Bibliografie

Elisabeta Jaba ndash Statistică Ed Economică 1998

Mihai Ţarcă ndash Statistică volI Ed UAIC 1979

Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale

Ed University Press 2009

Sorana Daniela Bolboacă ndash Metodologia cercetării curs

53

Page 23: cercetarea medicala - metodologie

Semnificaţia lui p (reguli empirice)

001 le p lt 005 rezultatul e semnificativ statistic

0001 le p lt 001 rezultatul e icircnalt semnificativ statistic

p lt 0001 rezultatul e foarte icircnalt semnificativ statistic

p ge 005 rezultatul e considerat nesemnificativ statistic

Limite ale valorii p

Valoarea p NU ne dă informaţii despre

Şansa de beneficiu a unui pacient individual

Procentul de pacienţi care vor avea un beneficiu icircn urma instituirii procedurii medicale

Gradul de beneficiu expectat pentru un anumit pacient

Puterea unui test statistic

Este capacitatea de a detecta o diferenţă acolo unde există

Creşterea volumului eşantionului determină creşterea puterii testului statistic aplicat

Valoarea este icircn relaţie directă cu eroarea de tip II

Puterea = 1 ndash β

Cea mai utilizată modalitate de creştere a puterii unui test statistic este de a creşte volumul

eşantionului

Tipul scalei de măsură ndash testul statistic

Denumire test Interval Nominal Observaţii

Corelaţie Pearson 2 0 Există o relaţie liniară

χ2 0 2

Student 1 1 Doar 2 grupuri

ANOVA 1 1 2 sau mai multe grupuri

Student perechi 1 1 Eşantioane perechi

Măsurători repetate (ANOVA) 1 1 Mai mult de 2 grupuri date

perechi

Inferenţa statistică pe date calitativ e

Tabela de contingenţă 2times2

Riscuri şi raţii

Testul χ2 (testarea asocierii icircn tabela de contingenţă)

Testul Fisher

23

Testul z pentru proporţii

Testul McNemar

Tabela de contingenţă 2times2

Scale de tip nominal (dicotomiale tabela de contingenţă de 2times2) sau ordinal (tabela de contingenţă de

rtimesc)

Frecvenţa absolută (numărul de evenimente per categorie)

Tabela de contingenţă de 2times2 4 categorii

AP = adevărat pozitiv

FP = fals pozitiv

FN = fals negativ

AN = adevărat negativ

Ulcer deschis Ulcer vindecat Total

Recurenţă + AP = 1 FP = 5 = 1+5 = 6

Recurenţă - FN = 7 AN = 16 = 7+16 = 23

Total =1+7=8 =5+16=21 29

Riscuri şi raţii Mărimi ale asocierii

Denumire Formula Definiţie

Rata falşilor pozitivi =FP(FP+AN) Probabilitatea unui test fals + (α)

Rata falşilor negativi =FN(FN+AP) Probabilitatea unui test fals ndash (β)

Sensibilitate =AP(AP+FN) Probabilitatea unui test real + (1- β)

Specificitate =AN(AN+FP) Probabilitatea unui test real ndash (1- α)

Acurateţe =(AP+AN)n Probabilitatea generală a unei decizii corecte

Valoarea predictivă pozitivă =AP(AP+FP) Probabilitatea ca un test pozitiv să fie corect

Valoarea predictivă negativă =AN(AN+FN) Probabilitatea ca un test negativ să fie corect

Riscul relativ =AP(FP+AN)FN(AP+FP)

Rata şansei =(AP∙AN)(FN∙FP)

Riscul atribuabil =AP(AP+FP)-FN(FN+AN)

24

Denumire Formula

Rata falşilor pozitivi = 5(5+1) = 08334

Rata falşilor negativi = 7(7+16) = 03043

Sensibilitate = 1(1+7) = 01250

Specificitate = 16(16+5) = 07619

Acurateţe = (1+16)29 = 05862

Valoarea predictivă pozitivă = 1(1+5) = 01667

Valoarea predictivă negativă = 16(16+7) = 06957

Riscul relativ = 1(5+16)7(1+5) = 2142 = 050

Rata şansei = (1∙16)(7∙5) = 04571

Riscul atribuabil = 1(1+5)-7(7+16) = 01667-03043=-01376

Testarea asocierii icircn tabela de contingenţă

Testul χ2

Nu trebuie utilizat pentru eşantioane de volum mic

Testul este valid doar dacă valoarea expectată (aşteptată) pentru fiecare celulă este cel puţin

egală cu 1 şi frecvenţa absolută observată este de minim 5

Dacă aceste condiţii nu sunt icircndeplinite se aplică testul exact al lui Fisher (Fisherrsquos Exact Test)

Indică dacă cele două variabile sunt sau nu independente DAR NU cuantifică puterea asocierii

dintre ele

Problema S-a investigat icircntr-un studiu asocierea dintre obezitatea (ca factor de risc) şi bolile

cardio-vasculare la persoanele icircn etate (gt 60 ani) Din totalul de 620 persoane investigate s-au

identificat 150 persoane cu obezitate şi boală cardio-vasculară 230 persoane fără obezitate şi

fără boală cardio-vasculară şi 60 persoane fără obezitate dar cu boală cardio-vasculară Există

o asociere icircntre obezitate şi boala cardio-vasculară (df=1 α=005 χ2critic = 384)

Testul χ2 exemplu

H025

Nu există asociere icircntre obezitate şi bolile cardio-vasculare

Obezitatea şi bolile cardio-vasculare sunt independente

H1

Există asociere icircntre obezitate şi bolile cardio-vasculare

Obezitatea şi bolile cardio-vasculare sunt asociate

a = 005 pragul de semnificaţie al testului

urmează o lege cu (r-1)(c-1) grade de libertate

χ2 = parametrul testului χ2

fio = frecvenţa observată

fit = frecvenţa teoretică

Regiunea critică este [χα2 yen)

Pentru α = 005 χα2 = 384

OBSERVAT BCV+ BCV- Total

Obezitate + AP = 150 FP = 180 330

Obezitate - FN = 60 AN = 230 290

Total 210 410 620

TEORETIC BCV+ BCV- Total

Obezitate + = 330times210620 = 330times410620 330

Obezitate - = 290times210620 = 290times410620 290

Total 210 410 620

TEORETIC BCV+ BCV- Total

Obezitate + = 330times210620 = 330times410620 330

26

Obezitate - = 290times210620 = 290times410620 290

Total 210 410 620

TEORETIC BCV+ BCV-

Obezitate + = 112 = 218

Obezitate - = 98 = 192

Deoarece 4177Icirc[384 yen) se respinge H0 cu un risc de eroare de 5

Există asociere icircntre obezitate şi bolile cardio-vasculare

Testul Fisher

Corecţie a testului χ2

Valoarea p asociată parametrului ne dă probabilitatea ca valoarea observată de independenţă să fie

atribuită doar şansei

O valoare p mică indică că există alte cauze decacirct şansa influenţează rezultatul şi astfel cele două

variabile investigate nu sunt independente

Testul Fisher = dispersia corectată a factorului x dispersia corectată a factorilor reziduali

Icircn acest context regula adunării dispersiilor se poate scrie unde

este variaţia lui y pe seama variaţiei variabilei x

este variaţia lui y pe seama influenţei factorilor reziduali (neicircnregistraţi)

este variaţia totală a caracteristicii y

Testul Fisher empiric se calculează după formula

27

se compară cu Ftab pentru nx şi nz grade de libertate la un anumit prag de semnificaţie stabilit

Dacă Fc gt Ftab rezultă că variaţia factorului de grupare x este semnificativă pentru variaţia caracteristicii y

Testul z pentru proporţii

1 Compararea unei frecvenţe observate cu o frecvenţă teoretică

2 Testarea egalităţii a două frecvenţe

Testul z Compararea unei frecvenţe observate cu o frecvenţă teoretică

Scop Investigarea semnificaţiei diferenţei icircntre o frecvenţă teoretică p (icircntr-o populaţie) şi o frecvenţă

observată f pe un eşantion reprezentativ (variabilă calitativă (binare))

Condiţii de aplicare Testul este corect aplicat dacă numărul n al observaţiilor eşantionului este

suficient de mare (n∙p n∙(1-p)gt10

Parametrul

n = volumul eşantionului

Suntem interesaţi de investigarea prevalenţei hepatitei B la personalul care lucrează icircn laboratoarele

clinicilor de boli infecţioase din Transilvania Se ştie din studii anterioare că prevalenţa hepatitei B icircn

populaţia generală din Transilvania este de 9 S-a luat icircn studiu un eşantion de 100 persoane şi s-a

obţinut o prevalenţă a hepatitei B de 6 Există diferenţă semnificativă icircntre frecvenţa hepatitei B la

personalul care lucrează icircn laboratoarele spitalelor de boli infecţioase din Transilvania faţă de

populaţia generală

f = 006 p = 009 n = 100

Ipoteza nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat

faţă de frecvenţa hepatitei B icircn populaţia generală

Ipoteza alternativă test bilateral Există diferenţă semnificativă icircntre frecvenţa hepatitei B la

nivelul eşantionului şi prevalenţa hepatitei B icircn populaţia generală

f = 006 p = 009 n = 100

Pragul de semnificaţie a = 005

Regiunea critică test bilateral (-yen -196 ]Egrave[196 yen)

28

Concluzia testului

Deoarece parametrul statistic calculat al testului nu aparţine regiunii critice se acceptă ipoteza

nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat faţă de

frecvenţa hepatitei B icircn populaţia generală

Testul McNemar

Evaluarea dependenţei variabilelor calitative perechi (dorim să determinăm dacă o anumită

caracteristică este sau nu asociată cu o anumită patologie)

Identificăm n pacienţi care prezintă patologia de interes (eg Cancer bronho-pulmonar) şi n

pacienţi cu aceleaşi caracteristici ca şi primul grup dar care nu o prezintă

Martor = da Martor = nu

Caz = da a b

Caz = nu c d

Testul McNemar - exemplu fumat vs cancer

Martor = da Martor = nu

Cancer = da a = 2 b = 5

Cancer = nu c = 0 d = 3

29

χ2critic(α=005) = 384

32 lt 384 rarr acceptăm ipoteza nulă

Fumatul nu este icircn relaţie cu apariţia cancerului bronho-pulmonar

Inferenţa statistică pe date cantitative

Variabile cantitative continue

Testul z şi Student (t) (o medie sau medii perechi)

Testul z şi Student (t) (testarea a două medii)

ANOVA (ge 3 medii)

Ranguri (variabile cantitative discrete sau cantitative care nu icircndeplinesc condiţia de

normalitate)

Testul sumei rangurilor Wilcoxon

Kruskal-Wallis (ge 3 eşantioane independente)

Friedman (ge 3 eşantioane dependente)

Teste de normalitate variabile cantitative continue

Shapiro-Wilk

Kolmogorov-Smirnov

Shapiro-Wilk

Chi-Square Goodness-of-Fit

Dacă datele urmează o distribuţie normală aplicăm un test parametric

Dacă datele nu urmează o distribuţie normală aplicăm un test de comparare al rangurilor

30

Testul Z de comparare a mediei unui eşantion cu media unei populaţii

Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ

extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie

s2 care se cunoaşte

Condiţii de aplicare

1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru

compararea mediei unui eşantion cu media unei populaţii)

2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal

distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă

3 Talia eşantionului este mare ( ge 30)

Ipoteze

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media

eşantionului şi media populaţiei

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

(-yen -196 ] Egrave [196 yen)

Parametrul testului

n = volumul eşantionului

= media eşantionului

s = deviaţia standard a populaţiei

Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)

Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard

cunoscută

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi

media standard

Condiţii de aplicare

Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se

realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această

condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea

31

Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai

puternic

Numărul de grade de libertate (df) df = n-1

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

Parametrul testului

n = volumul eşantionului

micro0 = media standard

= media eşantionului

s = deviaţia standard a eşantionului

Testul ANOVA compararea mediilor a mai multe eşantioane

H0 = toate mediile sunt egale

H1 = nu toate mediile sunt egale

Condiţii de aplicare

1 Datele sunt independente unele faţă de celelalte

2 Datele fiecărui grup sunt normal distribuite

3 Deviaţia standard este aceeaşi pentru toate grupurile

Id Medicament

A B C D E F

1 5 6 7 10 5 9

2 6 8 8 11 8 8

3 7 7 9 13 6 7

4 8 9 11 12 4 5

32

5 9 10 10 9 7 6

Suma 35 40 45 55 30 35

Media 7 8 9 11 6 7

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =

= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)

Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2

F = (suma pătratelor(icircntre))(suma pătratelor(icircn))

Suma pătratelor (icircntre) = 16times5 = 80

Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60

Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn

interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare

SP df Media pătratelor F = MPicircntreMPicircn

Icircntre 80 5 = 805 = 16 = 1625 = 64

Icircn 60 24 = 6024 = 25

Total 140 29 -

Testul sumei rangurilor Wilcoxon

Aplicat pentru

Un set de observaţii provenite dintr-o valoare ipotetică comună

Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)

Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero

Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace

Suma rangurilor pentru diferenţele negative = 2+3+1 = 6

Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30

33

Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului

egal cu 8 = 0109

Icircnainte După Diferenţa Rang

64 66 -2 2

66 58 8 5

67 68 -1 3

71 65 6 4

72 75 -3 1

76 67 9 6

78 59 19 8

89 74 15 7

Testul Kruskal-Wallis (ge 3 eşantioane independente)

Test de ranguri aplicate pe mai mult de 3 eşantioane

H = parametrul testului

n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)

Tk = suma rangurilor

Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie

pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni

34

df = k-1 (k = numărul de eşantioane)

df = 3-1 = 2

Hcritic(α=005) = 599

H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie

pozitivă şi respectiv biopsie negativă

Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie

a tipului de studiu pe eşantioane perechi)

1 Definirea numărului de tratamente k

2 Obţinerea rangurilor pentru fiecare tratament

3 Sumarea rangurilor fiecărui tratament

4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)

5 Dacă Fr gt Frcritic rarr respingem H0

Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost

măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi

n = 9 k = 3 T12 = 225 T2

2 = 38025 T32 = 38025

Frcritic = 599

Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de

prostată

35

De reţinut

Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei

Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-

of-Fit

Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z

Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t

Compararea mediilor a 3 sau mai multe eşantioane ANOVA

Compararea mediilor a două populaţii (σ) testul Z

Compararea mediilor a două eşantioane (s) testul t

Compararea mediilor a două eşantioane perechi (s) testul t

ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi

cu cel pentru compararea a două eşantioane perechi

Ranguri

Distribuţia datelor nu are importanţă

Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)

Trei sau mai multe eşantioane Kruskal-Wallis

Trei sau mai multe eşantioane perechi Friedman

Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia

Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a

datelor)

Variabile nominale

Un singur eşantion sau eşantioane perechi

Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte

Eşantioane perechi testul Mc Nemar

Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2

Icircn analiza proporţiilor există teste diferite pentru

Compararea unei frecvenţe cu o frecvenţă cunoscută

Compararea a două frecvenţe

Semnificaţia statistică

Valoarea p (p value)

Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor

două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E

posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării

aleatorii

36

Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală

urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii

Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este

probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un

experiment de dimensiunea acestuia

Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că

diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii

diferite

Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca

fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă

ar fi fost adevărată

Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă

1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe

baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De

fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001

2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie

3 Se aplică testul statistic aferent pentru a calcula valoarea p

4 Se compară valoarea p cu valoarea ndash prag

5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe

semnificativă dpdv statisticrdquo

6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e

semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să

conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă

Teste de semnificaţie

Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului

populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)

Testarea ipotezelor implică posibile erori

Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile

sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui

grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul

icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005

ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există

37

nici o diferenţă

Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ

statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de

ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost

ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau

dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă

cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă

semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe

ipotetice variate icircn cazul icircn care ele există

Măsuri ale frecvenţei

Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)

Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate

Generic formula pe care se bazează toate cele trei este

unde x şi y sunt cantităţile de comparat

Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea

unei frecvenţe pe grupe de sex vacircrstă etc

Proporţia implică icircn mod necesar ca x să fie inclus icircn y

Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară

frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp

Pentru calcularea unei rate trebuie ţinut cont de trei aspecte

bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin

bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp

bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo

Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un

tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei

populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei

aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)

38

Indicatori

Rata de incidenţă

Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă

icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii

Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o

perioadă de timp

Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de

timp x

Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei

susceptibili de a dezvolta icircmbolnăvirea studiată

Numitorul poate fi

bull Numărul mediu al populaţiei icircn perioada de timp studiată

bull Mărimea populaţiei icircn mijlocul perioadei de studiu

bull Mărimea populaţiei la icircnceputul studiului

Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă

Este obligatorie menţionarea perioadei de timp

Prevalenţa

Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la

un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă

schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa

momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)

39

Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include

numai cazuri noi respectiv include cazuri noi şi vechi

Rata de atac

Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este

folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp

raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori

Rata persoană-timp

Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din

momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte

migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost

observate

Riscul relativ (RR)

Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment

legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele

prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două

grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la

bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la

bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai

mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo

Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2

Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn

cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă

(Tabelul 1)

Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR

Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la

neexpuşi

40

Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de

culegere a datelor

Odds ratio (OR)

Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin

raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general

studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)

Tabelul 2 Tabelul 2 x 2 pentru calcularea OR

Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală

Rate de mortalitate

Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp

specificată Există mai multe tipuri de rate de mortalitate

o Mortalitate specifică pe sex

o Mortalitate specifică pe rasă

o Mortalitate specifică pe boală

o Mortalitate neonatală

o Mortalitate postneonatală

o Mortalitate infantilă

o Mortalitate maternă

Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP

41

Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de

viaţă şi vacircrsta la care survine decesul dacă este prematur

Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu

Ani de viaţă pierduţi datorat dizabilităţii

Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt

utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru

cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite

grupuri

Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de

risc şi o boală se folosesc riscul relativ şi odds ratio

35 Analiza şi interpretarea datelor

După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date

trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul

Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor

colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului

studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu

plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde

prezenţa biostatisticianului este necesară

Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu

elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat

iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului

iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate

depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori

testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere

clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza

Interpretarea rezultatelor statistice

Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne

motive (număr mic de date) acceptarea ei să fie falsă

Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine

gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia

ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument

de decizie Intervalul de confidenţă

42

Interpretarea statistica ne interpretarea clinică

Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă

Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice

obţinute pe eşantionul studiat

Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare

Ce interpretăm Rezultatele

personale obţinute icircn urma studiului

care au fost prezentate icircn secţiunea bdquoRezultaterdquo

Explicăm rezultatele obţinute

Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale

Interpretarea trebuie să se realizeze icircn

lumina limitelor studiului

contextul cultural social şi educaţional al locului unde s-a realizat cercetarea

contextul a ceea ce se cunoaşte din literatura de specialitate

Interpretăm doar rezultatele personale obţinute icircn urma studiului

Interpretarea statistică nu este tot una cu interpretarea clinică

Interpretarea statistică este importantă

Interpretarea clinică este foarte importantă

Intervalul de confidenţă

Media calculată pe baza unui eşantion nu va echivala media populaţiei

Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului

Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a

populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a

populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)

pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru

orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare

dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de

confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de

date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de

5

Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel

Dacă valoarea p este mică

Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare

aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o

medie diferită Diferenţa este semnificativă dpdv statistic

43

Icircn continuare

Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa

reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică

pentru a fi interesante din punct de vedere ştiinţific

Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC

oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care

este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a

obţine o concluzie clară

Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o

diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că

datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din

punct de vedere ştiinţific

Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul

detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat

Erorile studiilor medicale

Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura

anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară

caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea

asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri

legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias

Erorile potenţiale icircn studiile epidemiologice

1 Erori icircntacircmplătoare

2 Erori sistematice

3 Confuzia

4 Validitatea

1 Erori icircntacircmplătoare

Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a

parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel

de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot

fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii

(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor

de măsură (eroarea de măsurare)

44

2 Erori sistematice

Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate

care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu

acurateţe mare Acurateţea nu este afectată de mărimea eşantionului

Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de

experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea

dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus

şi greu de cuantificat (consum de alcool personalitate etc)

Principalele tipuri de erori din această categorie sunt

bull Biasul de selecţie

bull Biasul de informaţie

Biasul de selecţie

Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul

trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion

inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale

persoanelor incluse

Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se

ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia

Biasul de informaţie

Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de

instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze

expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere

nesemnificativă sau chiar să nu şi-o amintească de loc

3 Confuzia

Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune

prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este

cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă

de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte

important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor

protector

4 Validitatea

Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă

Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte

estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional

Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă

45

conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se

demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)

Validitatea externă se poate realiza numai dacă studiul este valid intern

Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii

studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de

studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt

laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi

validă din punct de vedere intern)

3 6 Prezentarea rezultatelor

După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite

Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor

icircntr-o formă bdquodigerabilărdquo este necesară

Scopul prezentării datelor

1 Transmiterea concluziilor studiului

a Datele corecte şi importante merită comunicate

b Datele trebuie să confirme sau să infirme ipoteza studiului

c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală

2 Acordarea posibilităţii altor cercetători să aprecieze studiul

a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti

b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor

prezentate

Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru

fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie

statistică

Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de

valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras

(Tabel 3)

Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)

46

Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct

numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor

precum şi prezentarea acestora sub formă inteligibilă

Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care

convin cercetătorului

Prezentarea datelor se poate face

1 Figuri şi tabele icircn articole scrise

2 Figuri şi tabele icircn prezentări orale

3 Figuri şi tabele icircn postere

4 Text scris sau incluse icircn text

5 Site-uri de WEB

Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor

Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie

Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele

exprimacircnd exact ceea ce acestea exprimă

Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate

anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel

să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se

acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca

mai sus sugestive sunt formatele simple şi puţin icircncărcate

Dacă nu există reguli impuse se respectă

1 Mesaj simplu fără falsificarea datelor

2 De obicei este necesar atacirct tabelul cacirct şi graficul

3 Să fie simplu şi clar

Tabele

Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile

coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică

elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de

1 Se folosesc doar linii orizontale

2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn

evidenţi prin linie de separare (Tabelul 4)

Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland

Noua Zeelandă)

(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)

47

3 Numerele sunt aliniate icircn funcţie de virgulă

4 Indicii statistici sunt explicaţi sub tabel

5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană

6 Abrevierile pot fi folosite

7 Numărul de zecimale trebuie limitat la maxim două

8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel

9 Plasarea legendei este obligatorie sub tabel

10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)

Icircn cazul prezentărilor orale sau a posterelor este indicat ca

1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării

2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte

3 Folosirea de simboluri este permisă

Clasificarea tabelelor

Tabelele se clasifică după

i) conţinut

bull cu distribuţii de frecvenţe

bull de clase de frecvenţe

bull de contingenţă

ii) structura

bull cu doua coloane

bull cu subclasificări

bull ldquomasterrdquo

Tabele ce conţin distribuţii de frecvenţe

O modalitate comodă de a prezenta o mulţime de date brute este

1 Se ordonează datele in ordine crescătoare

2 Se determine frecvenţa fiecărei valori

3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane

(Tabelul 5)

Tabelul 5 Distribuţii de frecvenţă absolută

48

Tabelul claselor de frecvenţe

1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă

2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)

Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)

Tabele de contingenţă

1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a

tabelelor de contingenţă

2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a

combinaţiilor de perechi ordonate de valori

3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre

a factor de risc si

b starea sănătăţii

4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)

5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)

Tabelul 7 Tabel de contingenţă 2 x 2

49

Grafice

Există două categorii de moduri grafice sub care se pot prezenta datele

1 Ilustraţii şi fotografii

2 Grafice

1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă

pentru lucrare

2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit

Putem vorbi despre mai multe tipuri de grafice

bull Grafice pentru reprezentarea datelor cantitative

1048707 Grafic cartezian (X Y)

1048707 Histograma

1048707 Poligonul de frecvenţe

1048707 Diagrama bdquoscatterrdquo

bull Grafice pentru reprezentarea datelor calitative

1048707 Grafic cu bare

1048707 Diagrama tip bdquoboxplotrdquo

1048707 Diagrama bdquopierdquo

1048707 Cartograma

Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi

dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)

Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)

Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie

Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)

Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)

50

Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir

de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele

două variabile studiate (Figura 6)

Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2

(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2

rămacircne aproximativ constantă)

Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea

comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea

comparativă a mai multor variabile

Figura 7 Grafic calitativ cu bare

51

Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo

Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două

posibilităţi reprezentate grafic este mai frecventă (Figura 8)

Figura 8 Reprezentare tip bdquopierdquo

Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli

sau a oricărui element comparativ Se foloseşte de epidemiologi

Rezultate

Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare

Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o

manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu

explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția

bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la

ilustraţii tabele grafice

Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi

nici rezultatele care invalidează eventual ipoteza

Discuţii

Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd

cultura ştiinţifică şi inteligenţa autorilor

Acest capitol răspunde la trei obiective

Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia

calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de

selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează

rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv

52

este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn

care a fost abordată problema fără a face o revistă a literaturii

Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea

rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul

Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor

afirmaţii nesusţinute de conţinutul lucrării

Concluzii

Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate

să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie

Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de

concluzii va scădea valoarea lucrării

Bibliografia (lista referinţelor citarea icircn text)

Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn

lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente

Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli

- să conţină cele mai importante şi recente lucrări

- să includă numai lucrări publicate

- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate

Bibliografie

Elisabeta Jaba ndash Statistică Ed Economică 1998

Mihai Ţarcă ndash Statistică volI Ed UAIC 1979

Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale

Ed University Press 2009

Sorana Daniela Bolboacă ndash Metodologia cercetării curs

53

Page 24: cercetarea medicala - metodologie

Testul z pentru proporţii

Testul McNemar

Tabela de contingenţă 2times2

Scale de tip nominal (dicotomiale tabela de contingenţă de 2times2) sau ordinal (tabela de contingenţă de

rtimesc)

Frecvenţa absolută (numărul de evenimente per categorie)

Tabela de contingenţă de 2times2 4 categorii

AP = adevărat pozitiv

FP = fals pozitiv

FN = fals negativ

AN = adevărat negativ

Ulcer deschis Ulcer vindecat Total

Recurenţă + AP = 1 FP = 5 = 1+5 = 6

Recurenţă - FN = 7 AN = 16 = 7+16 = 23

Total =1+7=8 =5+16=21 29

Riscuri şi raţii Mărimi ale asocierii

Denumire Formula Definiţie

Rata falşilor pozitivi =FP(FP+AN) Probabilitatea unui test fals + (α)

Rata falşilor negativi =FN(FN+AP) Probabilitatea unui test fals ndash (β)

Sensibilitate =AP(AP+FN) Probabilitatea unui test real + (1- β)

Specificitate =AN(AN+FP) Probabilitatea unui test real ndash (1- α)

Acurateţe =(AP+AN)n Probabilitatea generală a unei decizii corecte

Valoarea predictivă pozitivă =AP(AP+FP) Probabilitatea ca un test pozitiv să fie corect

Valoarea predictivă negativă =AN(AN+FN) Probabilitatea ca un test negativ să fie corect

Riscul relativ =AP(FP+AN)FN(AP+FP)

Rata şansei =(AP∙AN)(FN∙FP)

Riscul atribuabil =AP(AP+FP)-FN(FN+AN)

24

Denumire Formula

Rata falşilor pozitivi = 5(5+1) = 08334

Rata falşilor negativi = 7(7+16) = 03043

Sensibilitate = 1(1+7) = 01250

Specificitate = 16(16+5) = 07619

Acurateţe = (1+16)29 = 05862

Valoarea predictivă pozitivă = 1(1+5) = 01667

Valoarea predictivă negativă = 16(16+7) = 06957

Riscul relativ = 1(5+16)7(1+5) = 2142 = 050

Rata şansei = (1∙16)(7∙5) = 04571

Riscul atribuabil = 1(1+5)-7(7+16) = 01667-03043=-01376

Testarea asocierii icircn tabela de contingenţă

Testul χ2

Nu trebuie utilizat pentru eşantioane de volum mic

Testul este valid doar dacă valoarea expectată (aşteptată) pentru fiecare celulă este cel puţin

egală cu 1 şi frecvenţa absolută observată este de minim 5

Dacă aceste condiţii nu sunt icircndeplinite se aplică testul exact al lui Fisher (Fisherrsquos Exact Test)

Indică dacă cele două variabile sunt sau nu independente DAR NU cuantifică puterea asocierii

dintre ele

Problema S-a investigat icircntr-un studiu asocierea dintre obezitatea (ca factor de risc) şi bolile

cardio-vasculare la persoanele icircn etate (gt 60 ani) Din totalul de 620 persoane investigate s-au

identificat 150 persoane cu obezitate şi boală cardio-vasculară 230 persoane fără obezitate şi

fără boală cardio-vasculară şi 60 persoane fără obezitate dar cu boală cardio-vasculară Există

o asociere icircntre obezitate şi boala cardio-vasculară (df=1 α=005 χ2critic = 384)

Testul χ2 exemplu

H025

Nu există asociere icircntre obezitate şi bolile cardio-vasculare

Obezitatea şi bolile cardio-vasculare sunt independente

H1

Există asociere icircntre obezitate şi bolile cardio-vasculare

Obezitatea şi bolile cardio-vasculare sunt asociate

a = 005 pragul de semnificaţie al testului

urmează o lege cu (r-1)(c-1) grade de libertate

χ2 = parametrul testului χ2

fio = frecvenţa observată

fit = frecvenţa teoretică

Regiunea critică este [χα2 yen)

Pentru α = 005 χα2 = 384

OBSERVAT BCV+ BCV- Total

Obezitate + AP = 150 FP = 180 330

Obezitate - FN = 60 AN = 230 290

Total 210 410 620

TEORETIC BCV+ BCV- Total

Obezitate + = 330times210620 = 330times410620 330

Obezitate - = 290times210620 = 290times410620 290

Total 210 410 620

TEORETIC BCV+ BCV- Total

Obezitate + = 330times210620 = 330times410620 330

26

Obezitate - = 290times210620 = 290times410620 290

Total 210 410 620

TEORETIC BCV+ BCV-

Obezitate + = 112 = 218

Obezitate - = 98 = 192

Deoarece 4177Icirc[384 yen) se respinge H0 cu un risc de eroare de 5

Există asociere icircntre obezitate şi bolile cardio-vasculare

Testul Fisher

Corecţie a testului χ2

Valoarea p asociată parametrului ne dă probabilitatea ca valoarea observată de independenţă să fie

atribuită doar şansei

O valoare p mică indică că există alte cauze decacirct şansa influenţează rezultatul şi astfel cele două

variabile investigate nu sunt independente

Testul Fisher = dispersia corectată a factorului x dispersia corectată a factorilor reziduali

Icircn acest context regula adunării dispersiilor se poate scrie unde

este variaţia lui y pe seama variaţiei variabilei x

este variaţia lui y pe seama influenţei factorilor reziduali (neicircnregistraţi)

este variaţia totală a caracteristicii y

Testul Fisher empiric se calculează după formula

27

se compară cu Ftab pentru nx şi nz grade de libertate la un anumit prag de semnificaţie stabilit

Dacă Fc gt Ftab rezultă că variaţia factorului de grupare x este semnificativă pentru variaţia caracteristicii y

Testul z pentru proporţii

1 Compararea unei frecvenţe observate cu o frecvenţă teoretică

2 Testarea egalităţii a două frecvenţe

Testul z Compararea unei frecvenţe observate cu o frecvenţă teoretică

Scop Investigarea semnificaţiei diferenţei icircntre o frecvenţă teoretică p (icircntr-o populaţie) şi o frecvenţă

observată f pe un eşantion reprezentativ (variabilă calitativă (binare))

Condiţii de aplicare Testul este corect aplicat dacă numărul n al observaţiilor eşantionului este

suficient de mare (n∙p n∙(1-p)gt10

Parametrul

n = volumul eşantionului

Suntem interesaţi de investigarea prevalenţei hepatitei B la personalul care lucrează icircn laboratoarele

clinicilor de boli infecţioase din Transilvania Se ştie din studii anterioare că prevalenţa hepatitei B icircn

populaţia generală din Transilvania este de 9 S-a luat icircn studiu un eşantion de 100 persoane şi s-a

obţinut o prevalenţă a hepatitei B de 6 Există diferenţă semnificativă icircntre frecvenţa hepatitei B la

personalul care lucrează icircn laboratoarele spitalelor de boli infecţioase din Transilvania faţă de

populaţia generală

f = 006 p = 009 n = 100

Ipoteza nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat

faţă de frecvenţa hepatitei B icircn populaţia generală

Ipoteza alternativă test bilateral Există diferenţă semnificativă icircntre frecvenţa hepatitei B la

nivelul eşantionului şi prevalenţa hepatitei B icircn populaţia generală

f = 006 p = 009 n = 100

Pragul de semnificaţie a = 005

Regiunea critică test bilateral (-yen -196 ]Egrave[196 yen)

28

Concluzia testului

Deoarece parametrul statistic calculat al testului nu aparţine regiunii critice se acceptă ipoteza

nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat faţă de

frecvenţa hepatitei B icircn populaţia generală

Testul McNemar

Evaluarea dependenţei variabilelor calitative perechi (dorim să determinăm dacă o anumită

caracteristică este sau nu asociată cu o anumită patologie)

Identificăm n pacienţi care prezintă patologia de interes (eg Cancer bronho-pulmonar) şi n

pacienţi cu aceleaşi caracteristici ca şi primul grup dar care nu o prezintă

Martor = da Martor = nu

Caz = da a b

Caz = nu c d

Testul McNemar - exemplu fumat vs cancer

Martor = da Martor = nu

Cancer = da a = 2 b = 5

Cancer = nu c = 0 d = 3

29

χ2critic(α=005) = 384

32 lt 384 rarr acceptăm ipoteza nulă

Fumatul nu este icircn relaţie cu apariţia cancerului bronho-pulmonar

Inferenţa statistică pe date cantitative

Variabile cantitative continue

Testul z şi Student (t) (o medie sau medii perechi)

Testul z şi Student (t) (testarea a două medii)

ANOVA (ge 3 medii)

Ranguri (variabile cantitative discrete sau cantitative care nu icircndeplinesc condiţia de

normalitate)

Testul sumei rangurilor Wilcoxon

Kruskal-Wallis (ge 3 eşantioane independente)

Friedman (ge 3 eşantioane dependente)

Teste de normalitate variabile cantitative continue

Shapiro-Wilk

Kolmogorov-Smirnov

Shapiro-Wilk

Chi-Square Goodness-of-Fit

Dacă datele urmează o distribuţie normală aplicăm un test parametric

Dacă datele nu urmează o distribuţie normală aplicăm un test de comparare al rangurilor

30

Testul Z de comparare a mediei unui eşantion cu media unei populaţii

Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ

extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie

s2 care se cunoaşte

Condiţii de aplicare

1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru

compararea mediei unui eşantion cu media unei populaţii)

2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal

distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă

3 Talia eşantionului este mare ( ge 30)

Ipoteze

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media

eşantionului şi media populaţiei

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

(-yen -196 ] Egrave [196 yen)

Parametrul testului

n = volumul eşantionului

= media eşantionului

s = deviaţia standard a populaţiei

Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)

Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard

cunoscută

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi

media standard

Condiţii de aplicare

Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se

realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această

condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea

31

Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai

puternic

Numărul de grade de libertate (df) df = n-1

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

Parametrul testului

n = volumul eşantionului

micro0 = media standard

= media eşantionului

s = deviaţia standard a eşantionului

Testul ANOVA compararea mediilor a mai multe eşantioane

H0 = toate mediile sunt egale

H1 = nu toate mediile sunt egale

Condiţii de aplicare

1 Datele sunt independente unele faţă de celelalte

2 Datele fiecărui grup sunt normal distribuite

3 Deviaţia standard este aceeaşi pentru toate grupurile

Id Medicament

A B C D E F

1 5 6 7 10 5 9

2 6 8 8 11 8 8

3 7 7 9 13 6 7

4 8 9 11 12 4 5

32

5 9 10 10 9 7 6

Suma 35 40 45 55 30 35

Media 7 8 9 11 6 7

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =

= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)

Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2

F = (suma pătratelor(icircntre))(suma pătratelor(icircn))

Suma pătratelor (icircntre) = 16times5 = 80

Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60

Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn

interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare

SP df Media pătratelor F = MPicircntreMPicircn

Icircntre 80 5 = 805 = 16 = 1625 = 64

Icircn 60 24 = 6024 = 25

Total 140 29 -

Testul sumei rangurilor Wilcoxon

Aplicat pentru

Un set de observaţii provenite dintr-o valoare ipotetică comună

Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)

Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero

Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace

Suma rangurilor pentru diferenţele negative = 2+3+1 = 6

Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30

33

Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului

egal cu 8 = 0109

Icircnainte După Diferenţa Rang

64 66 -2 2

66 58 8 5

67 68 -1 3

71 65 6 4

72 75 -3 1

76 67 9 6

78 59 19 8

89 74 15 7

Testul Kruskal-Wallis (ge 3 eşantioane independente)

Test de ranguri aplicate pe mai mult de 3 eşantioane

H = parametrul testului

n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)

Tk = suma rangurilor

Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie

pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni

34

df = k-1 (k = numărul de eşantioane)

df = 3-1 = 2

Hcritic(α=005) = 599

H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie

pozitivă şi respectiv biopsie negativă

Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie

a tipului de studiu pe eşantioane perechi)

1 Definirea numărului de tratamente k

2 Obţinerea rangurilor pentru fiecare tratament

3 Sumarea rangurilor fiecărui tratament

4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)

5 Dacă Fr gt Frcritic rarr respingem H0

Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost

măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi

n = 9 k = 3 T12 = 225 T2

2 = 38025 T32 = 38025

Frcritic = 599

Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de

prostată

35

De reţinut

Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei

Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-

of-Fit

Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z

Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t

Compararea mediilor a 3 sau mai multe eşantioane ANOVA

Compararea mediilor a două populaţii (σ) testul Z

Compararea mediilor a două eşantioane (s) testul t

Compararea mediilor a două eşantioane perechi (s) testul t

ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi

cu cel pentru compararea a două eşantioane perechi

Ranguri

Distribuţia datelor nu are importanţă

Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)

Trei sau mai multe eşantioane Kruskal-Wallis

Trei sau mai multe eşantioane perechi Friedman

Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia

Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a

datelor)

Variabile nominale

Un singur eşantion sau eşantioane perechi

Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte

Eşantioane perechi testul Mc Nemar

Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2

Icircn analiza proporţiilor există teste diferite pentru

Compararea unei frecvenţe cu o frecvenţă cunoscută

Compararea a două frecvenţe

Semnificaţia statistică

Valoarea p (p value)

Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor

două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E

posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării

aleatorii

36

Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală

urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii

Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este

probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un

experiment de dimensiunea acestuia

Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că

diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii

diferite

Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca

fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă

ar fi fost adevărată

Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă

1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe

baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De

fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001

2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie

3 Se aplică testul statistic aferent pentru a calcula valoarea p

4 Se compară valoarea p cu valoarea ndash prag

5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe

semnificativă dpdv statisticrdquo

6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e

semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să

conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă

Teste de semnificaţie

Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului

populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)

Testarea ipotezelor implică posibile erori

Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile

sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui

grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul

icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005

ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există

37

nici o diferenţă

Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ

statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de

ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost

ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau

dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă

cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă

semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe

ipotetice variate icircn cazul icircn care ele există

Măsuri ale frecvenţei

Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)

Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate

Generic formula pe care se bazează toate cele trei este

unde x şi y sunt cantităţile de comparat

Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea

unei frecvenţe pe grupe de sex vacircrstă etc

Proporţia implică icircn mod necesar ca x să fie inclus icircn y

Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară

frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp

Pentru calcularea unei rate trebuie ţinut cont de trei aspecte

bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin

bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp

bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo

Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un

tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei

populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei

aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)

38

Indicatori

Rata de incidenţă

Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă

icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii

Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o

perioadă de timp

Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de

timp x

Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei

susceptibili de a dezvolta icircmbolnăvirea studiată

Numitorul poate fi

bull Numărul mediu al populaţiei icircn perioada de timp studiată

bull Mărimea populaţiei icircn mijlocul perioadei de studiu

bull Mărimea populaţiei la icircnceputul studiului

Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă

Este obligatorie menţionarea perioadei de timp

Prevalenţa

Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la

un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă

schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa

momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)

39

Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include

numai cazuri noi respectiv include cazuri noi şi vechi

Rata de atac

Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este

folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp

raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori

Rata persoană-timp

Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din

momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte

migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost

observate

Riscul relativ (RR)

Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment

legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele

prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două

grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la

bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la

bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai

mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo

Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2

Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn

cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă

(Tabelul 1)

Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR

Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la

neexpuşi

40

Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de

culegere a datelor

Odds ratio (OR)

Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin

raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general

studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)

Tabelul 2 Tabelul 2 x 2 pentru calcularea OR

Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală

Rate de mortalitate

Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp

specificată Există mai multe tipuri de rate de mortalitate

o Mortalitate specifică pe sex

o Mortalitate specifică pe rasă

o Mortalitate specifică pe boală

o Mortalitate neonatală

o Mortalitate postneonatală

o Mortalitate infantilă

o Mortalitate maternă

Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP

41

Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de

viaţă şi vacircrsta la care survine decesul dacă este prematur

Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu

Ani de viaţă pierduţi datorat dizabilităţii

Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt

utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru

cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite

grupuri

Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de

risc şi o boală se folosesc riscul relativ şi odds ratio

35 Analiza şi interpretarea datelor

După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date

trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul

Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor

colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului

studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu

plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde

prezenţa biostatisticianului este necesară

Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu

elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat

iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului

iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate

depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori

testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere

clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza

Interpretarea rezultatelor statistice

Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne

motive (număr mic de date) acceptarea ei să fie falsă

Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine

gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia

ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument

de decizie Intervalul de confidenţă

42

Interpretarea statistica ne interpretarea clinică

Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă

Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice

obţinute pe eşantionul studiat

Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare

Ce interpretăm Rezultatele

personale obţinute icircn urma studiului

care au fost prezentate icircn secţiunea bdquoRezultaterdquo

Explicăm rezultatele obţinute

Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale

Interpretarea trebuie să se realizeze icircn

lumina limitelor studiului

contextul cultural social şi educaţional al locului unde s-a realizat cercetarea

contextul a ceea ce se cunoaşte din literatura de specialitate

Interpretăm doar rezultatele personale obţinute icircn urma studiului

Interpretarea statistică nu este tot una cu interpretarea clinică

Interpretarea statistică este importantă

Interpretarea clinică este foarte importantă

Intervalul de confidenţă

Media calculată pe baza unui eşantion nu va echivala media populaţiei

Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului

Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a

populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a

populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)

pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru

orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare

dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de

confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de

date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de

5

Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel

Dacă valoarea p este mică

Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare

aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o

medie diferită Diferenţa este semnificativă dpdv statistic

43

Icircn continuare

Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa

reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică

pentru a fi interesante din punct de vedere ştiinţific

Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC

oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care

este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a

obţine o concluzie clară

Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o

diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că

datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din

punct de vedere ştiinţific

Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul

detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat

Erorile studiilor medicale

Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura

anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară

caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea

asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri

legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias

Erorile potenţiale icircn studiile epidemiologice

1 Erori icircntacircmplătoare

2 Erori sistematice

3 Confuzia

4 Validitatea

1 Erori icircntacircmplătoare

Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a

parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel

de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot

fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii

(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor

de măsură (eroarea de măsurare)

44

2 Erori sistematice

Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate

care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu

acurateţe mare Acurateţea nu este afectată de mărimea eşantionului

Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de

experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea

dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus

şi greu de cuantificat (consum de alcool personalitate etc)

Principalele tipuri de erori din această categorie sunt

bull Biasul de selecţie

bull Biasul de informaţie

Biasul de selecţie

Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul

trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion

inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale

persoanelor incluse

Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se

ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia

Biasul de informaţie

Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de

instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze

expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere

nesemnificativă sau chiar să nu şi-o amintească de loc

3 Confuzia

Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune

prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este

cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă

de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte

important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor

protector

4 Validitatea

Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă

Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte

estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional

Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă

45

conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se

demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)

Validitatea externă se poate realiza numai dacă studiul este valid intern

Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii

studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de

studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt

laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi

validă din punct de vedere intern)

3 6 Prezentarea rezultatelor

După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite

Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor

icircntr-o formă bdquodigerabilărdquo este necesară

Scopul prezentării datelor

1 Transmiterea concluziilor studiului

a Datele corecte şi importante merită comunicate

b Datele trebuie să confirme sau să infirme ipoteza studiului

c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală

2 Acordarea posibilităţii altor cercetători să aprecieze studiul

a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti

b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor

prezentate

Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru

fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie

statistică

Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de

valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras

(Tabel 3)

Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)

46

Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct

numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor

precum şi prezentarea acestora sub formă inteligibilă

Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care

convin cercetătorului

Prezentarea datelor se poate face

1 Figuri şi tabele icircn articole scrise

2 Figuri şi tabele icircn prezentări orale

3 Figuri şi tabele icircn postere

4 Text scris sau incluse icircn text

5 Site-uri de WEB

Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor

Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie

Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele

exprimacircnd exact ceea ce acestea exprimă

Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate

anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel

să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se

acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca

mai sus sugestive sunt formatele simple şi puţin icircncărcate

Dacă nu există reguli impuse se respectă

1 Mesaj simplu fără falsificarea datelor

2 De obicei este necesar atacirct tabelul cacirct şi graficul

3 Să fie simplu şi clar

Tabele

Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile

coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică

elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de

1 Se folosesc doar linii orizontale

2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn

evidenţi prin linie de separare (Tabelul 4)

Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland

Noua Zeelandă)

(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)

47

3 Numerele sunt aliniate icircn funcţie de virgulă

4 Indicii statistici sunt explicaţi sub tabel

5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană

6 Abrevierile pot fi folosite

7 Numărul de zecimale trebuie limitat la maxim două

8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel

9 Plasarea legendei este obligatorie sub tabel

10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)

Icircn cazul prezentărilor orale sau a posterelor este indicat ca

1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării

2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte

3 Folosirea de simboluri este permisă

Clasificarea tabelelor

Tabelele se clasifică după

i) conţinut

bull cu distribuţii de frecvenţe

bull de clase de frecvenţe

bull de contingenţă

ii) structura

bull cu doua coloane

bull cu subclasificări

bull ldquomasterrdquo

Tabele ce conţin distribuţii de frecvenţe

O modalitate comodă de a prezenta o mulţime de date brute este

1 Se ordonează datele in ordine crescătoare

2 Se determine frecvenţa fiecărei valori

3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane

(Tabelul 5)

Tabelul 5 Distribuţii de frecvenţă absolută

48

Tabelul claselor de frecvenţe

1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă

2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)

Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)

Tabele de contingenţă

1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a

tabelelor de contingenţă

2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a

combinaţiilor de perechi ordonate de valori

3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre

a factor de risc si

b starea sănătăţii

4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)

5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)

Tabelul 7 Tabel de contingenţă 2 x 2

49

Grafice

Există două categorii de moduri grafice sub care se pot prezenta datele

1 Ilustraţii şi fotografii

2 Grafice

1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă

pentru lucrare

2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit

Putem vorbi despre mai multe tipuri de grafice

bull Grafice pentru reprezentarea datelor cantitative

1048707 Grafic cartezian (X Y)

1048707 Histograma

1048707 Poligonul de frecvenţe

1048707 Diagrama bdquoscatterrdquo

bull Grafice pentru reprezentarea datelor calitative

1048707 Grafic cu bare

1048707 Diagrama tip bdquoboxplotrdquo

1048707 Diagrama bdquopierdquo

1048707 Cartograma

Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi

dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)

Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)

Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie

Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)

Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)

50

Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir

de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele

două variabile studiate (Figura 6)

Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2

(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2

rămacircne aproximativ constantă)

Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea

comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea

comparativă a mai multor variabile

Figura 7 Grafic calitativ cu bare

51

Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo

Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două

posibilităţi reprezentate grafic este mai frecventă (Figura 8)

Figura 8 Reprezentare tip bdquopierdquo

Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli

sau a oricărui element comparativ Se foloseşte de epidemiologi

Rezultate

Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare

Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o

manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu

explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția

bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la

ilustraţii tabele grafice

Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi

nici rezultatele care invalidează eventual ipoteza

Discuţii

Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd

cultura ştiinţifică şi inteligenţa autorilor

Acest capitol răspunde la trei obiective

Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia

calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de

selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează

rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv

52

este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn

care a fost abordată problema fără a face o revistă a literaturii

Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea

rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul

Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor

afirmaţii nesusţinute de conţinutul lucrării

Concluzii

Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate

să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie

Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de

concluzii va scădea valoarea lucrării

Bibliografia (lista referinţelor citarea icircn text)

Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn

lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente

Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli

- să conţină cele mai importante şi recente lucrări

- să includă numai lucrări publicate

- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate

Bibliografie

Elisabeta Jaba ndash Statistică Ed Economică 1998

Mihai Ţarcă ndash Statistică volI Ed UAIC 1979

Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale

Ed University Press 2009

Sorana Daniela Bolboacă ndash Metodologia cercetării curs

53

Page 25: cercetarea medicala - metodologie

Denumire Formula

Rata falşilor pozitivi = 5(5+1) = 08334

Rata falşilor negativi = 7(7+16) = 03043

Sensibilitate = 1(1+7) = 01250

Specificitate = 16(16+5) = 07619

Acurateţe = (1+16)29 = 05862

Valoarea predictivă pozitivă = 1(1+5) = 01667

Valoarea predictivă negativă = 16(16+7) = 06957

Riscul relativ = 1(5+16)7(1+5) = 2142 = 050

Rata şansei = (1∙16)(7∙5) = 04571

Riscul atribuabil = 1(1+5)-7(7+16) = 01667-03043=-01376

Testarea asocierii icircn tabela de contingenţă

Testul χ2

Nu trebuie utilizat pentru eşantioane de volum mic

Testul este valid doar dacă valoarea expectată (aşteptată) pentru fiecare celulă este cel puţin

egală cu 1 şi frecvenţa absolută observată este de minim 5

Dacă aceste condiţii nu sunt icircndeplinite se aplică testul exact al lui Fisher (Fisherrsquos Exact Test)

Indică dacă cele două variabile sunt sau nu independente DAR NU cuantifică puterea asocierii

dintre ele

Problema S-a investigat icircntr-un studiu asocierea dintre obezitatea (ca factor de risc) şi bolile

cardio-vasculare la persoanele icircn etate (gt 60 ani) Din totalul de 620 persoane investigate s-au

identificat 150 persoane cu obezitate şi boală cardio-vasculară 230 persoane fără obezitate şi

fără boală cardio-vasculară şi 60 persoane fără obezitate dar cu boală cardio-vasculară Există

o asociere icircntre obezitate şi boala cardio-vasculară (df=1 α=005 χ2critic = 384)

Testul χ2 exemplu

H025

Nu există asociere icircntre obezitate şi bolile cardio-vasculare

Obezitatea şi bolile cardio-vasculare sunt independente

H1

Există asociere icircntre obezitate şi bolile cardio-vasculare

Obezitatea şi bolile cardio-vasculare sunt asociate

a = 005 pragul de semnificaţie al testului

urmează o lege cu (r-1)(c-1) grade de libertate

χ2 = parametrul testului χ2

fio = frecvenţa observată

fit = frecvenţa teoretică

Regiunea critică este [χα2 yen)

Pentru α = 005 χα2 = 384

OBSERVAT BCV+ BCV- Total

Obezitate + AP = 150 FP = 180 330

Obezitate - FN = 60 AN = 230 290

Total 210 410 620

TEORETIC BCV+ BCV- Total

Obezitate + = 330times210620 = 330times410620 330

Obezitate - = 290times210620 = 290times410620 290

Total 210 410 620

TEORETIC BCV+ BCV- Total

Obezitate + = 330times210620 = 330times410620 330

26

Obezitate - = 290times210620 = 290times410620 290

Total 210 410 620

TEORETIC BCV+ BCV-

Obezitate + = 112 = 218

Obezitate - = 98 = 192

Deoarece 4177Icirc[384 yen) se respinge H0 cu un risc de eroare de 5

Există asociere icircntre obezitate şi bolile cardio-vasculare

Testul Fisher

Corecţie a testului χ2

Valoarea p asociată parametrului ne dă probabilitatea ca valoarea observată de independenţă să fie

atribuită doar şansei

O valoare p mică indică că există alte cauze decacirct şansa influenţează rezultatul şi astfel cele două

variabile investigate nu sunt independente

Testul Fisher = dispersia corectată a factorului x dispersia corectată a factorilor reziduali

Icircn acest context regula adunării dispersiilor se poate scrie unde

este variaţia lui y pe seama variaţiei variabilei x

este variaţia lui y pe seama influenţei factorilor reziduali (neicircnregistraţi)

este variaţia totală a caracteristicii y

Testul Fisher empiric se calculează după formula

27

se compară cu Ftab pentru nx şi nz grade de libertate la un anumit prag de semnificaţie stabilit

Dacă Fc gt Ftab rezultă că variaţia factorului de grupare x este semnificativă pentru variaţia caracteristicii y

Testul z pentru proporţii

1 Compararea unei frecvenţe observate cu o frecvenţă teoretică

2 Testarea egalităţii a două frecvenţe

Testul z Compararea unei frecvenţe observate cu o frecvenţă teoretică

Scop Investigarea semnificaţiei diferenţei icircntre o frecvenţă teoretică p (icircntr-o populaţie) şi o frecvenţă

observată f pe un eşantion reprezentativ (variabilă calitativă (binare))

Condiţii de aplicare Testul este corect aplicat dacă numărul n al observaţiilor eşantionului este

suficient de mare (n∙p n∙(1-p)gt10

Parametrul

n = volumul eşantionului

Suntem interesaţi de investigarea prevalenţei hepatitei B la personalul care lucrează icircn laboratoarele

clinicilor de boli infecţioase din Transilvania Se ştie din studii anterioare că prevalenţa hepatitei B icircn

populaţia generală din Transilvania este de 9 S-a luat icircn studiu un eşantion de 100 persoane şi s-a

obţinut o prevalenţă a hepatitei B de 6 Există diferenţă semnificativă icircntre frecvenţa hepatitei B la

personalul care lucrează icircn laboratoarele spitalelor de boli infecţioase din Transilvania faţă de

populaţia generală

f = 006 p = 009 n = 100

Ipoteza nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat

faţă de frecvenţa hepatitei B icircn populaţia generală

Ipoteza alternativă test bilateral Există diferenţă semnificativă icircntre frecvenţa hepatitei B la

nivelul eşantionului şi prevalenţa hepatitei B icircn populaţia generală

f = 006 p = 009 n = 100

Pragul de semnificaţie a = 005

Regiunea critică test bilateral (-yen -196 ]Egrave[196 yen)

28

Concluzia testului

Deoarece parametrul statistic calculat al testului nu aparţine regiunii critice se acceptă ipoteza

nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat faţă de

frecvenţa hepatitei B icircn populaţia generală

Testul McNemar

Evaluarea dependenţei variabilelor calitative perechi (dorim să determinăm dacă o anumită

caracteristică este sau nu asociată cu o anumită patologie)

Identificăm n pacienţi care prezintă patologia de interes (eg Cancer bronho-pulmonar) şi n

pacienţi cu aceleaşi caracteristici ca şi primul grup dar care nu o prezintă

Martor = da Martor = nu

Caz = da a b

Caz = nu c d

Testul McNemar - exemplu fumat vs cancer

Martor = da Martor = nu

Cancer = da a = 2 b = 5

Cancer = nu c = 0 d = 3

29

χ2critic(α=005) = 384

32 lt 384 rarr acceptăm ipoteza nulă

Fumatul nu este icircn relaţie cu apariţia cancerului bronho-pulmonar

Inferenţa statistică pe date cantitative

Variabile cantitative continue

Testul z şi Student (t) (o medie sau medii perechi)

Testul z şi Student (t) (testarea a două medii)

ANOVA (ge 3 medii)

Ranguri (variabile cantitative discrete sau cantitative care nu icircndeplinesc condiţia de

normalitate)

Testul sumei rangurilor Wilcoxon

Kruskal-Wallis (ge 3 eşantioane independente)

Friedman (ge 3 eşantioane dependente)

Teste de normalitate variabile cantitative continue

Shapiro-Wilk

Kolmogorov-Smirnov

Shapiro-Wilk

Chi-Square Goodness-of-Fit

Dacă datele urmează o distribuţie normală aplicăm un test parametric

Dacă datele nu urmează o distribuţie normală aplicăm un test de comparare al rangurilor

30

Testul Z de comparare a mediei unui eşantion cu media unei populaţii

Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ

extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie

s2 care se cunoaşte

Condiţii de aplicare

1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru

compararea mediei unui eşantion cu media unei populaţii)

2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal

distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă

3 Talia eşantionului este mare ( ge 30)

Ipoteze

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media

eşantionului şi media populaţiei

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

(-yen -196 ] Egrave [196 yen)

Parametrul testului

n = volumul eşantionului

= media eşantionului

s = deviaţia standard a populaţiei

Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)

Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard

cunoscută

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi

media standard

Condiţii de aplicare

Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se

realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această

condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea

31

Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai

puternic

Numărul de grade de libertate (df) df = n-1

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

Parametrul testului

n = volumul eşantionului

micro0 = media standard

= media eşantionului

s = deviaţia standard a eşantionului

Testul ANOVA compararea mediilor a mai multe eşantioane

H0 = toate mediile sunt egale

H1 = nu toate mediile sunt egale

Condiţii de aplicare

1 Datele sunt independente unele faţă de celelalte

2 Datele fiecărui grup sunt normal distribuite

3 Deviaţia standard este aceeaşi pentru toate grupurile

Id Medicament

A B C D E F

1 5 6 7 10 5 9

2 6 8 8 11 8 8

3 7 7 9 13 6 7

4 8 9 11 12 4 5

32

5 9 10 10 9 7 6

Suma 35 40 45 55 30 35

Media 7 8 9 11 6 7

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =

= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)

Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2

F = (suma pătratelor(icircntre))(suma pătratelor(icircn))

Suma pătratelor (icircntre) = 16times5 = 80

Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60

Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn

interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare

SP df Media pătratelor F = MPicircntreMPicircn

Icircntre 80 5 = 805 = 16 = 1625 = 64

Icircn 60 24 = 6024 = 25

Total 140 29 -

Testul sumei rangurilor Wilcoxon

Aplicat pentru

Un set de observaţii provenite dintr-o valoare ipotetică comună

Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)

Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero

Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace

Suma rangurilor pentru diferenţele negative = 2+3+1 = 6

Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30

33

Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului

egal cu 8 = 0109

Icircnainte După Diferenţa Rang

64 66 -2 2

66 58 8 5

67 68 -1 3

71 65 6 4

72 75 -3 1

76 67 9 6

78 59 19 8

89 74 15 7

Testul Kruskal-Wallis (ge 3 eşantioane independente)

Test de ranguri aplicate pe mai mult de 3 eşantioane

H = parametrul testului

n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)

Tk = suma rangurilor

Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie

pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni

34

df = k-1 (k = numărul de eşantioane)

df = 3-1 = 2

Hcritic(α=005) = 599

H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie

pozitivă şi respectiv biopsie negativă

Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie

a tipului de studiu pe eşantioane perechi)

1 Definirea numărului de tratamente k

2 Obţinerea rangurilor pentru fiecare tratament

3 Sumarea rangurilor fiecărui tratament

4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)

5 Dacă Fr gt Frcritic rarr respingem H0

Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost

măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi

n = 9 k = 3 T12 = 225 T2

2 = 38025 T32 = 38025

Frcritic = 599

Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de

prostată

35

De reţinut

Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei

Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-

of-Fit

Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z

Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t

Compararea mediilor a 3 sau mai multe eşantioane ANOVA

Compararea mediilor a două populaţii (σ) testul Z

Compararea mediilor a două eşantioane (s) testul t

Compararea mediilor a două eşantioane perechi (s) testul t

ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi

cu cel pentru compararea a două eşantioane perechi

Ranguri

Distribuţia datelor nu are importanţă

Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)

Trei sau mai multe eşantioane Kruskal-Wallis

Trei sau mai multe eşantioane perechi Friedman

Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia

Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a

datelor)

Variabile nominale

Un singur eşantion sau eşantioane perechi

Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte

Eşantioane perechi testul Mc Nemar

Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2

Icircn analiza proporţiilor există teste diferite pentru

Compararea unei frecvenţe cu o frecvenţă cunoscută

Compararea a două frecvenţe

Semnificaţia statistică

Valoarea p (p value)

Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor

două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E

posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării

aleatorii

36

Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală

urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii

Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este

probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un

experiment de dimensiunea acestuia

Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că

diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii

diferite

Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca

fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă

ar fi fost adevărată

Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă

1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe

baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De

fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001

2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie

3 Se aplică testul statistic aferent pentru a calcula valoarea p

4 Se compară valoarea p cu valoarea ndash prag

5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe

semnificativă dpdv statisticrdquo

6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e

semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să

conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă

Teste de semnificaţie

Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului

populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)

Testarea ipotezelor implică posibile erori

Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile

sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui

grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul

icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005

ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există

37

nici o diferenţă

Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ

statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de

ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost

ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau

dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă

cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă

semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe

ipotetice variate icircn cazul icircn care ele există

Măsuri ale frecvenţei

Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)

Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate

Generic formula pe care se bazează toate cele trei este

unde x şi y sunt cantităţile de comparat

Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea

unei frecvenţe pe grupe de sex vacircrstă etc

Proporţia implică icircn mod necesar ca x să fie inclus icircn y

Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară

frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp

Pentru calcularea unei rate trebuie ţinut cont de trei aspecte

bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin

bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp

bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo

Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un

tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei

populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei

aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)

38

Indicatori

Rata de incidenţă

Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă

icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii

Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o

perioadă de timp

Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de

timp x

Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei

susceptibili de a dezvolta icircmbolnăvirea studiată

Numitorul poate fi

bull Numărul mediu al populaţiei icircn perioada de timp studiată

bull Mărimea populaţiei icircn mijlocul perioadei de studiu

bull Mărimea populaţiei la icircnceputul studiului

Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă

Este obligatorie menţionarea perioadei de timp

Prevalenţa

Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la

un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă

schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa

momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)

39

Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include

numai cazuri noi respectiv include cazuri noi şi vechi

Rata de atac

Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este

folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp

raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori

Rata persoană-timp

Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din

momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte

migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost

observate

Riscul relativ (RR)

Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment

legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele

prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două

grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la

bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la

bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai

mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo

Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2

Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn

cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă

(Tabelul 1)

Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR

Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la

neexpuşi

40

Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de

culegere a datelor

Odds ratio (OR)

Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin

raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general

studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)

Tabelul 2 Tabelul 2 x 2 pentru calcularea OR

Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală

Rate de mortalitate

Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp

specificată Există mai multe tipuri de rate de mortalitate

o Mortalitate specifică pe sex

o Mortalitate specifică pe rasă

o Mortalitate specifică pe boală

o Mortalitate neonatală

o Mortalitate postneonatală

o Mortalitate infantilă

o Mortalitate maternă

Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP

41

Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de

viaţă şi vacircrsta la care survine decesul dacă este prematur

Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu

Ani de viaţă pierduţi datorat dizabilităţii

Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt

utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru

cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite

grupuri

Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de

risc şi o boală se folosesc riscul relativ şi odds ratio

35 Analiza şi interpretarea datelor

După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date

trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul

Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor

colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului

studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu

plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde

prezenţa biostatisticianului este necesară

Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu

elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat

iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului

iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate

depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori

testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere

clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza

Interpretarea rezultatelor statistice

Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne

motive (număr mic de date) acceptarea ei să fie falsă

Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine

gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia

ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument

de decizie Intervalul de confidenţă

42

Interpretarea statistica ne interpretarea clinică

Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă

Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice

obţinute pe eşantionul studiat

Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare

Ce interpretăm Rezultatele

personale obţinute icircn urma studiului

care au fost prezentate icircn secţiunea bdquoRezultaterdquo

Explicăm rezultatele obţinute

Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale

Interpretarea trebuie să se realizeze icircn

lumina limitelor studiului

contextul cultural social şi educaţional al locului unde s-a realizat cercetarea

contextul a ceea ce se cunoaşte din literatura de specialitate

Interpretăm doar rezultatele personale obţinute icircn urma studiului

Interpretarea statistică nu este tot una cu interpretarea clinică

Interpretarea statistică este importantă

Interpretarea clinică este foarte importantă

Intervalul de confidenţă

Media calculată pe baza unui eşantion nu va echivala media populaţiei

Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului

Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a

populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a

populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)

pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru

orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare

dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de

confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de

date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de

5

Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel

Dacă valoarea p este mică

Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare

aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o

medie diferită Diferenţa este semnificativă dpdv statistic

43

Icircn continuare

Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa

reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică

pentru a fi interesante din punct de vedere ştiinţific

Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC

oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care

este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a

obţine o concluzie clară

Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o

diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că

datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din

punct de vedere ştiinţific

Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul

detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat

Erorile studiilor medicale

Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura

anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară

caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea

asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri

legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias

Erorile potenţiale icircn studiile epidemiologice

1 Erori icircntacircmplătoare

2 Erori sistematice

3 Confuzia

4 Validitatea

1 Erori icircntacircmplătoare

Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a

parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel

de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot

fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii

(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor

de măsură (eroarea de măsurare)

44

2 Erori sistematice

Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate

care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu

acurateţe mare Acurateţea nu este afectată de mărimea eşantionului

Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de

experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea

dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus

şi greu de cuantificat (consum de alcool personalitate etc)

Principalele tipuri de erori din această categorie sunt

bull Biasul de selecţie

bull Biasul de informaţie

Biasul de selecţie

Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul

trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion

inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale

persoanelor incluse

Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se

ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia

Biasul de informaţie

Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de

instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze

expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere

nesemnificativă sau chiar să nu şi-o amintească de loc

3 Confuzia

Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune

prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este

cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă

de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte

important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor

protector

4 Validitatea

Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă

Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte

estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional

Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă

45

conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se

demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)

Validitatea externă se poate realiza numai dacă studiul este valid intern

Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii

studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de

studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt

laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi

validă din punct de vedere intern)

3 6 Prezentarea rezultatelor

După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite

Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor

icircntr-o formă bdquodigerabilărdquo este necesară

Scopul prezentării datelor

1 Transmiterea concluziilor studiului

a Datele corecte şi importante merită comunicate

b Datele trebuie să confirme sau să infirme ipoteza studiului

c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală

2 Acordarea posibilităţii altor cercetători să aprecieze studiul

a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti

b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor

prezentate

Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru

fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie

statistică

Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de

valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras

(Tabel 3)

Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)

46

Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct

numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor

precum şi prezentarea acestora sub formă inteligibilă

Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care

convin cercetătorului

Prezentarea datelor se poate face

1 Figuri şi tabele icircn articole scrise

2 Figuri şi tabele icircn prezentări orale

3 Figuri şi tabele icircn postere

4 Text scris sau incluse icircn text

5 Site-uri de WEB

Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor

Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie

Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele

exprimacircnd exact ceea ce acestea exprimă

Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate

anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel

să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se

acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca

mai sus sugestive sunt formatele simple şi puţin icircncărcate

Dacă nu există reguli impuse se respectă

1 Mesaj simplu fără falsificarea datelor

2 De obicei este necesar atacirct tabelul cacirct şi graficul

3 Să fie simplu şi clar

Tabele

Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile

coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică

elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de

1 Se folosesc doar linii orizontale

2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn

evidenţi prin linie de separare (Tabelul 4)

Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland

Noua Zeelandă)

(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)

47

3 Numerele sunt aliniate icircn funcţie de virgulă

4 Indicii statistici sunt explicaţi sub tabel

5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană

6 Abrevierile pot fi folosite

7 Numărul de zecimale trebuie limitat la maxim două

8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel

9 Plasarea legendei este obligatorie sub tabel

10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)

Icircn cazul prezentărilor orale sau a posterelor este indicat ca

1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării

2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte

3 Folosirea de simboluri este permisă

Clasificarea tabelelor

Tabelele se clasifică după

i) conţinut

bull cu distribuţii de frecvenţe

bull de clase de frecvenţe

bull de contingenţă

ii) structura

bull cu doua coloane

bull cu subclasificări

bull ldquomasterrdquo

Tabele ce conţin distribuţii de frecvenţe

O modalitate comodă de a prezenta o mulţime de date brute este

1 Se ordonează datele in ordine crescătoare

2 Se determine frecvenţa fiecărei valori

3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane

(Tabelul 5)

Tabelul 5 Distribuţii de frecvenţă absolută

48

Tabelul claselor de frecvenţe

1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă

2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)

Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)

Tabele de contingenţă

1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a

tabelelor de contingenţă

2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a

combinaţiilor de perechi ordonate de valori

3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre

a factor de risc si

b starea sănătăţii

4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)

5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)

Tabelul 7 Tabel de contingenţă 2 x 2

49

Grafice

Există două categorii de moduri grafice sub care se pot prezenta datele

1 Ilustraţii şi fotografii

2 Grafice

1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă

pentru lucrare

2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit

Putem vorbi despre mai multe tipuri de grafice

bull Grafice pentru reprezentarea datelor cantitative

1048707 Grafic cartezian (X Y)

1048707 Histograma

1048707 Poligonul de frecvenţe

1048707 Diagrama bdquoscatterrdquo

bull Grafice pentru reprezentarea datelor calitative

1048707 Grafic cu bare

1048707 Diagrama tip bdquoboxplotrdquo

1048707 Diagrama bdquopierdquo

1048707 Cartograma

Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi

dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)

Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)

Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie

Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)

Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)

50

Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir

de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele

două variabile studiate (Figura 6)

Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2

(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2

rămacircne aproximativ constantă)

Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea

comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea

comparativă a mai multor variabile

Figura 7 Grafic calitativ cu bare

51

Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo

Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două

posibilităţi reprezentate grafic este mai frecventă (Figura 8)

Figura 8 Reprezentare tip bdquopierdquo

Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli

sau a oricărui element comparativ Se foloseşte de epidemiologi

Rezultate

Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare

Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o

manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu

explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția

bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la

ilustraţii tabele grafice

Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi

nici rezultatele care invalidează eventual ipoteza

Discuţii

Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd

cultura ştiinţifică şi inteligenţa autorilor

Acest capitol răspunde la trei obiective

Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia

calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de

selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează

rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv

52

este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn

care a fost abordată problema fără a face o revistă a literaturii

Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea

rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul

Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor

afirmaţii nesusţinute de conţinutul lucrării

Concluzii

Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate

să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie

Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de

concluzii va scădea valoarea lucrării

Bibliografia (lista referinţelor citarea icircn text)

Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn

lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente

Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli

- să conţină cele mai importante şi recente lucrări

- să includă numai lucrări publicate

- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate

Bibliografie

Elisabeta Jaba ndash Statistică Ed Economică 1998

Mihai Ţarcă ndash Statistică volI Ed UAIC 1979

Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale

Ed University Press 2009

Sorana Daniela Bolboacă ndash Metodologia cercetării curs

53

Page 26: cercetarea medicala - metodologie

Nu există asociere icircntre obezitate şi bolile cardio-vasculare

Obezitatea şi bolile cardio-vasculare sunt independente

H1

Există asociere icircntre obezitate şi bolile cardio-vasculare

Obezitatea şi bolile cardio-vasculare sunt asociate

a = 005 pragul de semnificaţie al testului

urmează o lege cu (r-1)(c-1) grade de libertate

χ2 = parametrul testului χ2

fio = frecvenţa observată

fit = frecvenţa teoretică

Regiunea critică este [χα2 yen)

Pentru α = 005 χα2 = 384

OBSERVAT BCV+ BCV- Total

Obezitate + AP = 150 FP = 180 330

Obezitate - FN = 60 AN = 230 290

Total 210 410 620

TEORETIC BCV+ BCV- Total

Obezitate + = 330times210620 = 330times410620 330

Obezitate - = 290times210620 = 290times410620 290

Total 210 410 620

TEORETIC BCV+ BCV- Total

Obezitate + = 330times210620 = 330times410620 330

26

Obezitate - = 290times210620 = 290times410620 290

Total 210 410 620

TEORETIC BCV+ BCV-

Obezitate + = 112 = 218

Obezitate - = 98 = 192

Deoarece 4177Icirc[384 yen) se respinge H0 cu un risc de eroare de 5

Există asociere icircntre obezitate şi bolile cardio-vasculare

Testul Fisher

Corecţie a testului χ2

Valoarea p asociată parametrului ne dă probabilitatea ca valoarea observată de independenţă să fie

atribuită doar şansei

O valoare p mică indică că există alte cauze decacirct şansa influenţează rezultatul şi astfel cele două

variabile investigate nu sunt independente

Testul Fisher = dispersia corectată a factorului x dispersia corectată a factorilor reziduali

Icircn acest context regula adunării dispersiilor se poate scrie unde

este variaţia lui y pe seama variaţiei variabilei x

este variaţia lui y pe seama influenţei factorilor reziduali (neicircnregistraţi)

este variaţia totală a caracteristicii y

Testul Fisher empiric se calculează după formula

27

se compară cu Ftab pentru nx şi nz grade de libertate la un anumit prag de semnificaţie stabilit

Dacă Fc gt Ftab rezultă că variaţia factorului de grupare x este semnificativă pentru variaţia caracteristicii y

Testul z pentru proporţii

1 Compararea unei frecvenţe observate cu o frecvenţă teoretică

2 Testarea egalităţii a două frecvenţe

Testul z Compararea unei frecvenţe observate cu o frecvenţă teoretică

Scop Investigarea semnificaţiei diferenţei icircntre o frecvenţă teoretică p (icircntr-o populaţie) şi o frecvenţă

observată f pe un eşantion reprezentativ (variabilă calitativă (binare))

Condiţii de aplicare Testul este corect aplicat dacă numărul n al observaţiilor eşantionului este

suficient de mare (n∙p n∙(1-p)gt10

Parametrul

n = volumul eşantionului

Suntem interesaţi de investigarea prevalenţei hepatitei B la personalul care lucrează icircn laboratoarele

clinicilor de boli infecţioase din Transilvania Se ştie din studii anterioare că prevalenţa hepatitei B icircn

populaţia generală din Transilvania este de 9 S-a luat icircn studiu un eşantion de 100 persoane şi s-a

obţinut o prevalenţă a hepatitei B de 6 Există diferenţă semnificativă icircntre frecvenţa hepatitei B la

personalul care lucrează icircn laboratoarele spitalelor de boli infecţioase din Transilvania faţă de

populaţia generală

f = 006 p = 009 n = 100

Ipoteza nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat

faţă de frecvenţa hepatitei B icircn populaţia generală

Ipoteza alternativă test bilateral Există diferenţă semnificativă icircntre frecvenţa hepatitei B la

nivelul eşantionului şi prevalenţa hepatitei B icircn populaţia generală

f = 006 p = 009 n = 100

Pragul de semnificaţie a = 005

Regiunea critică test bilateral (-yen -196 ]Egrave[196 yen)

28

Concluzia testului

Deoarece parametrul statistic calculat al testului nu aparţine regiunii critice se acceptă ipoteza

nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat faţă de

frecvenţa hepatitei B icircn populaţia generală

Testul McNemar

Evaluarea dependenţei variabilelor calitative perechi (dorim să determinăm dacă o anumită

caracteristică este sau nu asociată cu o anumită patologie)

Identificăm n pacienţi care prezintă patologia de interes (eg Cancer bronho-pulmonar) şi n

pacienţi cu aceleaşi caracteristici ca şi primul grup dar care nu o prezintă

Martor = da Martor = nu

Caz = da a b

Caz = nu c d

Testul McNemar - exemplu fumat vs cancer

Martor = da Martor = nu

Cancer = da a = 2 b = 5

Cancer = nu c = 0 d = 3

29

χ2critic(α=005) = 384

32 lt 384 rarr acceptăm ipoteza nulă

Fumatul nu este icircn relaţie cu apariţia cancerului bronho-pulmonar

Inferenţa statistică pe date cantitative

Variabile cantitative continue

Testul z şi Student (t) (o medie sau medii perechi)

Testul z şi Student (t) (testarea a două medii)

ANOVA (ge 3 medii)

Ranguri (variabile cantitative discrete sau cantitative care nu icircndeplinesc condiţia de

normalitate)

Testul sumei rangurilor Wilcoxon

Kruskal-Wallis (ge 3 eşantioane independente)

Friedman (ge 3 eşantioane dependente)

Teste de normalitate variabile cantitative continue

Shapiro-Wilk

Kolmogorov-Smirnov

Shapiro-Wilk

Chi-Square Goodness-of-Fit

Dacă datele urmează o distribuţie normală aplicăm un test parametric

Dacă datele nu urmează o distribuţie normală aplicăm un test de comparare al rangurilor

30

Testul Z de comparare a mediei unui eşantion cu media unei populaţii

Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ

extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie

s2 care se cunoaşte

Condiţii de aplicare

1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru

compararea mediei unui eşantion cu media unei populaţii)

2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal

distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă

3 Talia eşantionului este mare ( ge 30)

Ipoteze

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media

eşantionului şi media populaţiei

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

(-yen -196 ] Egrave [196 yen)

Parametrul testului

n = volumul eşantionului

= media eşantionului

s = deviaţia standard a populaţiei

Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)

Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard

cunoscută

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi

media standard

Condiţii de aplicare

Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se

realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această

condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea

31

Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai

puternic

Numărul de grade de libertate (df) df = n-1

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

Parametrul testului

n = volumul eşantionului

micro0 = media standard

= media eşantionului

s = deviaţia standard a eşantionului

Testul ANOVA compararea mediilor a mai multe eşantioane

H0 = toate mediile sunt egale

H1 = nu toate mediile sunt egale

Condiţii de aplicare

1 Datele sunt independente unele faţă de celelalte

2 Datele fiecărui grup sunt normal distribuite

3 Deviaţia standard este aceeaşi pentru toate grupurile

Id Medicament

A B C D E F

1 5 6 7 10 5 9

2 6 8 8 11 8 8

3 7 7 9 13 6 7

4 8 9 11 12 4 5

32

5 9 10 10 9 7 6

Suma 35 40 45 55 30 35

Media 7 8 9 11 6 7

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =

= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)

Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2

F = (suma pătratelor(icircntre))(suma pătratelor(icircn))

Suma pătratelor (icircntre) = 16times5 = 80

Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60

Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn

interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare

SP df Media pătratelor F = MPicircntreMPicircn

Icircntre 80 5 = 805 = 16 = 1625 = 64

Icircn 60 24 = 6024 = 25

Total 140 29 -

Testul sumei rangurilor Wilcoxon

Aplicat pentru

Un set de observaţii provenite dintr-o valoare ipotetică comună

Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)

Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero

Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace

Suma rangurilor pentru diferenţele negative = 2+3+1 = 6

Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30

33

Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului

egal cu 8 = 0109

Icircnainte După Diferenţa Rang

64 66 -2 2

66 58 8 5

67 68 -1 3

71 65 6 4

72 75 -3 1

76 67 9 6

78 59 19 8

89 74 15 7

Testul Kruskal-Wallis (ge 3 eşantioane independente)

Test de ranguri aplicate pe mai mult de 3 eşantioane

H = parametrul testului

n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)

Tk = suma rangurilor

Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie

pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni

34

df = k-1 (k = numărul de eşantioane)

df = 3-1 = 2

Hcritic(α=005) = 599

H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie

pozitivă şi respectiv biopsie negativă

Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie

a tipului de studiu pe eşantioane perechi)

1 Definirea numărului de tratamente k

2 Obţinerea rangurilor pentru fiecare tratament

3 Sumarea rangurilor fiecărui tratament

4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)

5 Dacă Fr gt Frcritic rarr respingem H0

Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost

măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi

n = 9 k = 3 T12 = 225 T2

2 = 38025 T32 = 38025

Frcritic = 599

Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de

prostată

35

De reţinut

Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei

Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-

of-Fit

Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z

Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t

Compararea mediilor a 3 sau mai multe eşantioane ANOVA

Compararea mediilor a două populaţii (σ) testul Z

Compararea mediilor a două eşantioane (s) testul t

Compararea mediilor a două eşantioane perechi (s) testul t

ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi

cu cel pentru compararea a două eşantioane perechi

Ranguri

Distribuţia datelor nu are importanţă

Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)

Trei sau mai multe eşantioane Kruskal-Wallis

Trei sau mai multe eşantioane perechi Friedman

Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia

Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a

datelor)

Variabile nominale

Un singur eşantion sau eşantioane perechi

Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte

Eşantioane perechi testul Mc Nemar

Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2

Icircn analiza proporţiilor există teste diferite pentru

Compararea unei frecvenţe cu o frecvenţă cunoscută

Compararea a două frecvenţe

Semnificaţia statistică

Valoarea p (p value)

Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor

două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E

posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării

aleatorii

36

Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală

urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii

Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este

probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un

experiment de dimensiunea acestuia

Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că

diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii

diferite

Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca

fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă

ar fi fost adevărată

Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă

1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe

baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De

fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001

2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie

3 Se aplică testul statistic aferent pentru a calcula valoarea p

4 Se compară valoarea p cu valoarea ndash prag

5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe

semnificativă dpdv statisticrdquo

6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e

semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să

conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă

Teste de semnificaţie

Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului

populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)

Testarea ipotezelor implică posibile erori

Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile

sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui

grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul

icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005

ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există

37

nici o diferenţă

Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ

statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de

ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost

ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau

dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă

cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă

semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe

ipotetice variate icircn cazul icircn care ele există

Măsuri ale frecvenţei

Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)

Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate

Generic formula pe care se bazează toate cele trei este

unde x şi y sunt cantităţile de comparat

Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea

unei frecvenţe pe grupe de sex vacircrstă etc

Proporţia implică icircn mod necesar ca x să fie inclus icircn y

Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară

frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp

Pentru calcularea unei rate trebuie ţinut cont de trei aspecte

bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin

bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp

bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo

Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un

tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei

populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei

aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)

38

Indicatori

Rata de incidenţă

Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă

icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii

Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o

perioadă de timp

Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de

timp x

Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei

susceptibili de a dezvolta icircmbolnăvirea studiată

Numitorul poate fi

bull Numărul mediu al populaţiei icircn perioada de timp studiată

bull Mărimea populaţiei icircn mijlocul perioadei de studiu

bull Mărimea populaţiei la icircnceputul studiului

Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă

Este obligatorie menţionarea perioadei de timp

Prevalenţa

Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la

un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă

schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa

momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)

39

Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include

numai cazuri noi respectiv include cazuri noi şi vechi

Rata de atac

Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este

folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp

raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori

Rata persoană-timp

Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din

momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte

migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost

observate

Riscul relativ (RR)

Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment

legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele

prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două

grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la

bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la

bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai

mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo

Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2

Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn

cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă

(Tabelul 1)

Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR

Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la

neexpuşi

40

Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de

culegere a datelor

Odds ratio (OR)

Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin

raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general

studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)

Tabelul 2 Tabelul 2 x 2 pentru calcularea OR

Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală

Rate de mortalitate

Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp

specificată Există mai multe tipuri de rate de mortalitate

o Mortalitate specifică pe sex

o Mortalitate specifică pe rasă

o Mortalitate specifică pe boală

o Mortalitate neonatală

o Mortalitate postneonatală

o Mortalitate infantilă

o Mortalitate maternă

Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP

41

Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de

viaţă şi vacircrsta la care survine decesul dacă este prematur

Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu

Ani de viaţă pierduţi datorat dizabilităţii

Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt

utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru

cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite

grupuri

Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de

risc şi o boală se folosesc riscul relativ şi odds ratio

35 Analiza şi interpretarea datelor

După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date

trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul

Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor

colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului

studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu

plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde

prezenţa biostatisticianului este necesară

Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu

elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat

iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului

iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate

depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori

testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere

clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza

Interpretarea rezultatelor statistice

Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne

motive (număr mic de date) acceptarea ei să fie falsă

Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine

gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia

ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument

de decizie Intervalul de confidenţă

42

Interpretarea statistica ne interpretarea clinică

Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă

Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice

obţinute pe eşantionul studiat

Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare

Ce interpretăm Rezultatele

personale obţinute icircn urma studiului

care au fost prezentate icircn secţiunea bdquoRezultaterdquo

Explicăm rezultatele obţinute

Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale

Interpretarea trebuie să se realizeze icircn

lumina limitelor studiului

contextul cultural social şi educaţional al locului unde s-a realizat cercetarea

contextul a ceea ce se cunoaşte din literatura de specialitate

Interpretăm doar rezultatele personale obţinute icircn urma studiului

Interpretarea statistică nu este tot una cu interpretarea clinică

Interpretarea statistică este importantă

Interpretarea clinică este foarte importantă

Intervalul de confidenţă

Media calculată pe baza unui eşantion nu va echivala media populaţiei

Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului

Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a

populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a

populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)

pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru

orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare

dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de

confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de

date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de

5

Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel

Dacă valoarea p este mică

Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare

aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o

medie diferită Diferenţa este semnificativă dpdv statistic

43

Icircn continuare

Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa

reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică

pentru a fi interesante din punct de vedere ştiinţific

Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC

oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care

este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a

obţine o concluzie clară

Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o

diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că

datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din

punct de vedere ştiinţific

Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul

detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat

Erorile studiilor medicale

Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura

anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară

caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea

asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri

legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias

Erorile potenţiale icircn studiile epidemiologice

1 Erori icircntacircmplătoare

2 Erori sistematice

3 Confuzia

4 Validitatea

1 Erori icircntacircmplătoare

Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a

parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel

de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot

fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii

(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor

de măsură (eroarea de măsurare)

44

2 Erori sistematice

Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate

care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu

acurateţe mare Acurateţea nu este afectată de mărimea eşantionului

Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de

experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea

dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus

şi greu de cuantificat (consum de alcool personalitate etc)

Principalele tipuri de erori din această categorie sunt

bull Biasul de selecţie

bull Biasul de informaţie

Biasul de selecţie

Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul

trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion

inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale

persoanelor incluse

Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se

ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia

Biasul de informaţie

Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de

instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze

expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere

nesemnificativă sau chiar să nu şi-o amintească de loc

3 Confuzia

Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune

prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este

cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă

de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte

important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor

protector

4 Validitatea

Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă

Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte

estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional

Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă

45

conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se

demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)

Validitatea externă se poate realiza numai dacă studiul este valid intern

Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii

studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de

studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt

laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi

validă din punct de vedere intern)

3 6 Prezentarea rezultatelor

După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite

Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor

icircntr-o formă bdquodigerabilărdquo este necesară

Scopul prezentării datelor

1 Transmiterea concluziilor studiului

a Datele corecte şi importante merită comunicate

b Datele trebuie să confirme sau să infirme ipoteza studiului

c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală

2 Acordarea posibilităţii altor cercetători să aprecieze studiul

a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti

b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor

prezentate

Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru

fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie

statistică

Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de

valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras

(Tabel 3)

Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)

46

Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct

numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor

precum şi prezentarea acestora sub formă inteligibilă

Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care

convin cercetătorului

Prezentarea datelor se poate face

1 Figuri şi tabele icircn articole scrise

2 Figuri şi tabele icircn prezentări orale

3 Figuri şi tabele icircn postere

4 Text scris sau incluse icircn text

5 Site-uri de WEB

Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor

Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie

Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele

exprimacircnd exact ceea ce acestea exprimă

Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate

anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel

să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se

acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca

mai sus sugestive sunt formatele simple şi puţin icircncărcate

Dacă nu există reguli impuse se respectă

1 Mesaj simplu fără falsificarea datelor

2 De obicei este necesar atacirct tabelul cacirct şi graficul

3 Să fie simplu şi clar

Tabele

Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile

coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică

elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de

1 Se folosesc doar linii orizontale

2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn

evidenţi prin linie de separare (Tabelul 4)

Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland

Noua Zeelandă)

(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)

47

3 Numerele sunt aliniate icircn funcţie de virgulă

4 Indicii statistici sunt explicaţi sub tabel

5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană

6 Abrevierile pot fi folosite

7 Numărul de zecimale trebuie limitat la maxim două

8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel

9 Plasarea legendei este obligatorie sub tabel

10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)

Icircn cazul prezentărilor orale sau a posterelor este indicat ca

1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării

2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte

3 Folosirea de simboluri este permisă

Clasificarea tabelelor

Tabelele se clasifică după

i) conţinut

bull cu distribuţii de frecvenţe

bull de clase de frecvenţe

bull de contingenţă

ii) structura

bull cu doua coloane

bull cu subclasificări

bull ldquomasterrdquo

Tabele ce conţin distribuţii de frecvenţe

O modalitate comodă de a prezenta o mulţime de date brute este

1 Se ordonează datele in ordine crescătoare

2 Se determine frecvenţa fiecărei valori

3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane

(Tabelul 5)

Tabelul 5 Distribuţii de frecvenţă absolută

48

Tabelul claselor de frecvenţe

1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă

2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)

Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)

Tabele de contingenţă

1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a

tabelelor de contingenţă

2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a

combinaţiilor de perechi ordonate de valori

3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre

a factor de risc si

b starea sănătăţii

4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)

5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)

Tabelul 7 Tabel de contingenţă 2 x 2

49

Grafice

Există două categorii de moduri grafice sub care se pot prezenta datele

1 Ilustraţii şi fotografii

2 Grafice

1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă

pentru lucrare

2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit

Putem vorbi despre mai multe tipuri de grafice

bull Grafice pentru reprezentarea datelor cantitative

1048707 Grafic cartezian (X Y)

1048707 Histograma

1048707 Poligonul de frecvenţe

1048707 Diagrama bdquoscatterrdquo

bull Grafice pentru reprezentarea datelor calitative

1048707 Grafic cu bare

1048707 Diagrama tip bdquoboxplotrdquo

1048707 Diagrama bdquopierdquo

1048707 Cartograma

Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi

dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)

Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)

Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie

Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)

Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)

50

Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir

de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele

două variabile studiate (Figura 6)

Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2

(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2

rămacircne aproximativ constantă)

Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea

comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea

comparativă a mai multor variabile

Figura 7 Grafic calitativ cu bare

51

Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo

Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două

posibilităţi reprezentate grafic este mai frecventă (Figura 8)

Figura 8 Reprezentare tip bdquopierdquo

Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli

sau a oricărui element comparativ Se foloseşte de epidemiologi

Rezultate

Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare

Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o

manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu

explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția

bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la

ilustraţii tabele grafice

Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi

nici rezultatele care invalidează eventual ipoteza

Discuţii

Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd

cultura ştiinţifică şi inteligenţa autorilor

Acest capitol răspunde la trei obiective

Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia

calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de

selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează

rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv

52

este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn

care a fost abordată problema fără a face o revistă a literaturii

Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea

rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul

Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor

afirmaţii nesusţinute de conţinutul lucrării

Concluzii

Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate

să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie

Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de

concluzii va scădea valoarea lucrării

Bibliografia (lista referinţelor citarea icircn text)

Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn

lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente

Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli

- să conţină cele mai importante şi recente lucrări

- să includă numai lucrări publicate

- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate

Bibliografie

Elisabeta Jaba ndash Statistică Ed Economică 1998

Mihai Ţarcă ndash Statistică volI Ed UAIC 1979

Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale

Ed University Press 2009

Sorana Daniela Bolboacă ndash Metodologia cercetării curs

53

Page 27: cercetarea medicala - metodologie

Obezitate - = 290times210620 = 290times410620 290

Total 210 410 620

TEORETIC BCV+ BCV-

Obezitate + = 112 = 218

Obezitate - = 98 = 192

Deoarece 4177Icirc[384 yen) se respinge H0 cu un risc de eroare de 5

Există asociere icircntre obezitate şi bolile cardio-vasculare

Testul Fisher

Corecţie a testului χ2

Valoarea p asociată parametrului ne dă probabilitatea ca valoarea observată de independenţă să fie

atribuită doar şansei

O valoare p mică indică că există alte cauze decacirct şansa influenţează rezultatul şi astfel cele două

variabile investigate nu sunt independente

Testul Fisher = dispersia corectată a factorului x dispersia corectată a factorilor reziduali

Icircn acest context regula adunării dispersiilor se poate scrie unde

este variaţia lui y pe seama variaţiei variabilei x

este variaţia lui y pe seama influenţei factorilor reziduali (neicircnregistraţi)

este variaţia totală a caracteristicii y

Testul Fisher empiric se calculează după formula

27

se compară cu Ftab pentru nx şi nz grade de libertate la un anumit prag de semnificaţie stabilit

Dacă Fc gt Ftab rezultă că variaţia factorului de grupare x este semnificativă pentru variaţia caracteristicii y

Testul z pentru proporţii

1 Compararea unei frecvenţe observate cu o frecvenţă teoretică

2 Testarea egalităţii a două frecvenţe

Testul z Compararea unei frecvenţe observate cu o frecvenţă teoretică

Scop Investigarea semnificaţiei diferenţei icircntre o frecvenţă teoretică p (icircntr-o populaţie) şi o frecvenţă

observată f pe un eşantion reprezentativ (variabilă calitativă (binare))

Condiţii de aplicare Testul este corect aplicat dacă numărul n al observaţiilor eşantionului este

suficient de mare (n∙p n∙(1-p)gt10

Parametrul

n = volumul eşantionului

Suntem interesaţi de investigarea prevalenţei hepatitei B la personalul care lucrează icircn laboratoarele

clinicilor de boli infecţioase din Transilvania Se ştie din studii anterioare că prevalenţa hepatitei B icircn

populaţia generală din Transilvania este de 9 S-a luat icircn studiu un eşantion de 100 persoane şi s-a

obţinut o prevalenţă a hepatitei B de 6 Există diferenţă semnificativă icircntre frecvenţa hepatitei B la

personalul care lucrează icircn laboratoarele spitalelor de boli infecţioase din Transilvania faţă de

populaţia generală

f = 006 p = 009 n = 100

Ipoteza nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat

faţă de frecvenţa hepatitei B icircn populaţia generală

Ipoteza alternativă test bilateral Există diferenţă semnificativă icircntre frecvenţa hepatitei B la

nivelul eşantionului şi prevalenţa hepatitei B icircn populaţia generală

f = 006 p = 009 n = 100

Pragul de semnificaţie a = 005

Regiunea critică test bilateral (-yen -196 ]Egrave[196 yen)

28

Concluzia testului

Deoarece parametrul statistic calculat al testului nu aparţine regiunii critice se acceptă ipoteza

nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat faţă de

frecvenţa hepatitei B icircn populaţia generală

Testul McNemar

Evaluarea dependenţei variabilelor calitative perechi (dorim să determinăm dacă o anumită

caracteristică este sau nu asociată cu o anumită patologie)

Identificăm n pacienţi care prezintă patologia de interes (eg Cancer bronho-pulmonar) şi n

pacienţi cu aceleaşi caracteristici ca şi primul grup dar care nu o prezintă

Martor = da Martor = nu

Caz = da a b

Caz = nu c d

Testul McNemar - exemplu fumat vs cancer

Martor = da Martor = nu

Cancer = da a = 2 b = 5

Cancer = nu c = 0 d = 3

29

χ2critic(α=005) = 384

32 lt 384 rarr acceptăm ipoteza nulă

Fumatul nu este icircn relaţie cu apariţia cancerului bronho-pulmonar

Inferenţa statistică pe date cantitative

Variabile cantitative continue

Testul z şi Student (t) (o medie sau medii perechi)

Testul z şi Student (t) (testarea a două medii)

ANOVA (ge 3 medii)

Ranguri (variabile cantitative discrete sau cantitative care nu icircndeplinesc condiţia de

normalitate)

Testul sumei rangurilor Wilcoxon

Kruskal-Wallis (ge 3 eşantioane independente)

Friedman (ge 3 eşantioane dependente)

Teste de normalitate variabile cantitative continue

Shapiro-Wilk

Kolmogorov-Smirnov

Shapiro-Wilk

Chi-Square Goodness-of-Fit

Dacă datele urmează o distribuţie normală aplicăm un test parametric

Dacă datele nu urmează o distribuţie normală aplicăm un test de comparare al rangurilor

30

Testul Z de comparare a mediei unui eşantion cu media unei populaţii

Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ

extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie

s2 care se cunoaşte

Condiţii de aplicare

1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru

compararea mediei unui eşantion cu media unei populaţii)

2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal

distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă

3 Talia eşantionului este mare ( ge 30)

Ipoteze

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media

eşantionului şi media populaţiei

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

(-yen -196 ] Egrave [196 yen)

Parametrul testului

n = volumul eşantionului

= media eşantionului

s = deviaţia standard a populaţiei

Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)

Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard

cunoscută

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi

media standard

Condiţii de aplicare

Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se

realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această

condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea

31

Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai

puternic

Numărul de grade de libertate (df) df = n-1

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

Parametrul testului

n = volumul eşantionului

micro0 = media standard

= media eşantionului

s = deviaţia standard a eşantionului

Testul ANOVA compararea mediilor a mai multe eşantioane

H0 = toate mediile sunt egale

H1 = nu toate mediile sunt egale

Condiţii de aplicare

1 Datele sunt independente unele faţă de celelalte

2 Datele fiecărui grup sunt normal distribuite

3 Deviaţia standard este aceeaşi pentru toate grupurile

Id Medicament

A B C D E F

1 5 6 7 10 5 9

2 6 8 8 11 8 8

3 7 7 9 13 6 7

4 8 9 11 12 4 5

32

5 9 10 10 9 7 6

Suma 35 40 45 55 30 35

Media 7 8 9 11 6 7

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =

= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)

Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2

F = (suma pătratelor(icircntre))(suma pătratelor(icircn))

Suma pătratelor (icircntre) = 16times5 = 80

Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60

Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn

interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare

SP df Media pătratelor F = MPicircntreMPicircn

Icircntre 80 5 = 805 = 16 = 1625 = 64

Icircn 60 24 = 6024 = 25

Total 140 29 -

Testul sumei rangurilor Wilcoxon

Aplicat pentru

Un set de observaţii provenite dintr-o valoare ipotetică comună

Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)

Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero

Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace

Suma rangurilor pentru diferenţele negative = 2+3+1 = 6

Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30

33

Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului

egal cu 8 = 0109

Icircnainte După Diferenţa Rang

64 66 -2 2

66 58 8 5

67 68 -1 3

71 65 6 4

72 75 -3 1

76 67 9 6

78 59 19 8

89 74 15 7

Testul Kruskal-Wallis (ge 3 eşantioane independente)

Test de ranguri aplicate pe mai mult de 3 eşantioane

H = parametrul testului

n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)

Tk = suma rangurilor

Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie

pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni

34

df = k-1 (k = numărul de eşantioane)

df = 3-1 = 2

Hcritic(α=005) = 599

H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie

pozitivă şi respectiv biopsie negativă

Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie

a tipului de studiu pe eşantioane perechi)

1 Definirea numărului de tratamente k

2 Obţinerea rangurilor pentru fiecare tratament

3 Sumarea rangurilor fiecărui tratament

4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)

5 Dacă Fr gt Frcritic rarr respingem H0

Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost

măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi

n = 9 k = 3 T12 = 225 T2

2 = 38025 T32 = 38025

Frcritic = 599

Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de

prostată

35

De reţinut

Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei

Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-

of-Fit

Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z

Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t

Compararea mediilor a 3 sau mai multe eşantioane ANOVA

Compararea mediilor a două populaţii (σ) testul Z

Compararea mediilor a două eşantioane (s) testul t

Compararea mediilor a două eşantioane perechi (s) testul t

ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi

cu cel pentru compararea a două eşantioane perechi

Ranguri

Distribuţia datelor nu are importanţă

Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)

Trei sau mai multe eşantioane Kruskal-Wallis

Trei sau mai multe eşantioane perechi Friedman

Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia

Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a

datelor)

Variabile nominale

Un singur eşantion sau eşantioane perechi

Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte

Eşantioane perechi testul Mc Nemar

Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2

Icircn analiza proporţiilor există teste diferite pentru

Compararea unei frecvenţe cu o frecvenţă cunoscută

Compararea a două frecvenţe

Semnificaţia statistică

Valoarea p (p value)

Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor

două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E

posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării

aleatorii

36

Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală

urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii

Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este

probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un

experiment de dimensiunea acestuia

Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că

diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii

diferite

Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca

fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă

ar fi fost adevărată

Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă

1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe

baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De

fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001

2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie

3 Se aplică testul statistic aferent pentru a calcula valoarea p

4 Se compară valoarea p cu valoarea ndash prag

5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe

semnificativă dpdv statisticrdquo

6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e

semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să

conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă

Teste de semnificaţie

Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului

populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)

Testarea ipotezelor implică posibile erori

Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile

sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui

grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul

icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005

ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există

37

nici o diferenţă

Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ

statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de

ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost

ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau

dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă

cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă

semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe

ipotetice variate icircn cazul icircn care ele există

Măsuri ale frecvenţei

Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)

Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate

Generic formula pe care se bazează toate cele trei este

unde x şi y sunt cantităţile de comparat

Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea

unei frecvenţe pe grupe de sex vacircrstă etc

Proporţia implică icircn mod necesar ca x să fie inclus icircn y

Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară

frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp

Pentru calcularea unei rate trebuie ţinut cont de trei aspecte

bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin

bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp

bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo

Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un

tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei

populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei

aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)

38

Indicatori

Rata de incidenţă

Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă

icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii

Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o

perioadă de timp

Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de

timp x

Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei

susceptibili de a dezvolta icircmbolnăvirea studiată

Numitorul poate fi

bull Numărul mediu al populaţiei icircn perioada de timp studiată

bull Mărimea populaţiei icircn mijlocul perioadei de studiu

bull Mărimea populaţiei la icircnceputul studiului

Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă

Este obligatorie menţionarea perioadei de timp

Prevalenţa

Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la

un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă

schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa

momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)

39

Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include

numai cazuri noi respectiv include cazuri noi şi vechi

Rata de atac

Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este

folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp

raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori

Rata persoană-timp

Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din

momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte

migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost

observate

Riscul relativ (RR)

Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment

legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele

prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două

grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la

bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la

bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai

mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo

Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2

Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn

cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă

(Tabelul 1)

Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR

Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la

neexpuşi

40

Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de

culegere a datelor

Odds ratio (OR)

Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin

raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general

studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)

Tabelul 2 Tabelul 2 x 2 pentru calcularea OR

Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală

Rate de mortalitate

Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp

specificată Există mai multe tipuri de rate de mortalitate

o Mortalitate specifică pe sex

o Mortalitate specifică pe rasă

o Mortalitate specifică pe boală

o Mortalitate neonatală

o Mortalitate postneonatală

o Mortalitate infantilă

o Mortalitate maternă

Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP

41

Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de

viaţă şi vacircrsta la care survine decesul dacă este prematur

Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu

Ani de viaţă pierduţi datorat dizabilităţii

Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt

utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru

cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite

grupuri

Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de

risc şi o boală se folosesc riscul relativ şi odds ratio

35 Analiza şi interpretarea datelor

După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date

trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul

Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor

colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului

studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu

plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde

prezenţa biostatisticianului este necesară

Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu

elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat

iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului

iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate

depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori

testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere

clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza

Interpretarea rezultatelor statistice

Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne

motive (număr mic de date) acceptarea ei să fie falsă

Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine

gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia

ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument

de decizie Intervalul de confidenţă

42

Interpretarea statistica ne interpretarea clinică

Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă

Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice

obţinute pe eşantionul studiat

Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare

Ce interpretăm Rezultatele

personale obţinute icircn urma studiului

care au fost prezentate icircn secţiunea bdquoRezultaterdquo

Explicăm rezultatele obţinute

Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale

Interpretarea trebuie să se realizeze icircn

lumina limitelor studiului

contextul cultural social şi educaţional al locului unde s-a realizat cercetarea

contextul a ceea ce se cunoaşte din literatura de specialitate

Interpretăm doar rezultatele personale obţinute icircn urma studiului

Interpretarea statistică nu este tot una cu interpretarea clinică

Interpretarea statistică este importantă

Interpretarea clinică este foarte importantă

Intervalul de confidenţă

Media calculată pe baza unui eşantion nu va echivala media populaţiei

Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului

Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a

populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a

populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)

pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru

orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare

dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de

confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de

date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de

5

Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel

Dacă valoarea p este mică

Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare

aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o

medie diferită Diferenţa este semnificativă dpdv statistic

43

Icircn continuare

Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa

reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică

pentru a fi interesante din punct de vedere ştiinţific

Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC

oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care

este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a

obţine o concluzie clară

Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o

diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că

datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din

punct de vedere ştiinţific

Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul

detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat

Erorile studiilor medicale

Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura

anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară

caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea

asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri

legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias

Erorile potenţiale icircn studiile epidemiologice

1 Erori icircntacircmplătoare

2 Erori sistematice

3 Confuzia

4 Validitatea

1 Erori icircntacircmplătoare

Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a

parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel

de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot

fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii

(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor

de măsură (eroarea de măsurare)

44

2 Erori sistematice

Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate

care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu

acurateţe mare Acurateţea nu este afectată de mărimea eşantionului

Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de

experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea

dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus

şi greu de cuantificat (consum de alcool personalitate etc)

Principalele tipuri de erori din această categorie sunt

bull Biasul de selecţie

bull Biasul de informaţie

Biasul de selecţie

Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul

trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion

inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale

persoanelor incluse

Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se

ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia

Biasul de informaţie

Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de

instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze

expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere

nesemnificativă sau chiar să nu şi-o amintească de loc

3 Confuzia

Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune

prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este

cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă

de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte

important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor

protector

4 Validitatea

Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă

Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte

estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional

Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă

45

conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se

demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)

Validitatea externă se poate realiza numai dacă studiul este valid intern

Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii

studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de

studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt

laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi

validă din punct de vedere intern)

3 6 Prezentarea rezultatelor

După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite

Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor

icircntr-o formă bdquodigerabilărdquo este necesară

Scopul prezentării datelor

1 Transmiterea concluziilor studiului

a Datele corecte şi importante merită comunicate

b Datele trebuie să confirme sau să infirme ipoteza studiului

c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală

2 Acordarea posibilităţii altor cercetători să aprecieze studiul

a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti

b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor

prezentate

Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru

fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie

statistică

Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de

valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras

(Tabel 3)

Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)

46

Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct

numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor

precum şi prezentarea acestora sub formă inteligibilă

Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care

convin cercetătorului

Prezentarea datelor se poate face

1 Figuri şi tabele icircn articole scrise

2 Figuri şi tabele icircn prezentări orale

3 Figuri şi tabele icircn postere

4 Text scris sau incluse icircn text

5 Site-uri de WEB

Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor

Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie

Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele

exprimacircnd exact ceea ce acestea exprimă

Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate

anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel

să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se

acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca

mai sus sugestive sunt formatele simple şi puţin icircncărcate

Dacă nu există reguli impuse se respectă

1 Mesaj simplu fără falsificarea datelor

2 De obicei este necesar atacirct tabelul cacirct şi graficul

3 Să fie simplu şi clar

Tabele

Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile

coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică

elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de

1 Se folosesc doar linii orizontale

2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn

evidenţi prin linie de separare (Tabelul 4)

Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland

Noua Zeelandă)

(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)

47

3 Numerele sunt aliniate icircn funcţie de virgulă

4 Indicii statistici sunt explicaţi sub tabel

5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană

6 Abrevierile pot fi folosite

7 Numărul de zecimale trebuie limitat la maxim două

8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel

9 Plasarea legendei este obligatorie sub tabel

10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)

Icircn cazul prezentărilor orale sau a posterelor este indicat ca

1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării

2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte

3 Folosirea de simboluri este permisă

Clasificarea tabelelor

Tabelele se clasifică după

i) conţinut

bull cu distribuţii de frecvenţe

bull de clase de frecvenţe

bull de contingenţă

ii) structura

bull cu doua coloane

bull cu subclasificări

bull ldquomasterrdquo

Tabele ce conţin distribuţii de frecvenţe

O modalitate comodă de a prezenta o mulţime de date brute este

1 Se ordonează datele in ordine crescătoare

2 Se determine frecvenţa fiecărei valori

3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane

(Tabelul 5)

Tabelul 5 Distribuţii de frecvenţă absolută

48

Tabelul claselor de frecvenţe

1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă

2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)

Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)

Tabele de contingenţă

1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a

tabelelor de contingenţă

2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a

combinaţiilor de perechi ordonate de valori

3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre

a factor de risc si

b starea sănătăţii

4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)

5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)

Tabelul 7 Tabel de contingenţă 2 x 2

49

Grafice

Există două categorii de moduri grafice sub care se pot prezenta datele

1 Ilustraţii şi fotografii

2 Grafice

1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă

pentru lucrare

2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit

Putem vorbi despre mai multe tipuri de grafice

bull Grafice pentru reprezentarea datelor cantitative

1048707 Grafic cartezian (X Y)

1048707 Histograma

1048707 Poligonul de frecvenţe

1048707 Diagrama bdquoscatterrdquo

bull Grafice pentru reprezentarea datelor calitative

1048707 Grafic cu bare

1048707 Diagrama tip bdquoboxplotrdquo

1048707 Diagrama bdquopierdquo

1048707 Cartograma

Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi

dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)

Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)

Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie

Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)

Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)

50

Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir

de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele

două variabile studiate (Figura 6)

Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2

(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2

rămacircne aproximativ constantă)

Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea

comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea

comparativă a mai multor variabile

Figura 7 Grafic calitativ cu bare

51

Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo

Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două

posibilităţi reprezentate grafic este mai frecventă (Figura 8)

Figura 8 Reprezentare tip bdquopierdquo

Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli

sau a oricărui element comparativ Se foloseşte de epidemiologi

Rezultate

Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare

Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o

manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu

explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția

bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la

ilustraţii tabele grafice

Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi

nici rezultatele care invalidează eventual ipoteza

Discuţii

Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd

cultura ştiinţifică şi inteligenţa autorilor

Acest capitol răspunde la trei obiective

Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia

calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de

selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează

rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv

52

este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn

care a fost abordată problema fără a face o revistă a literaturii

Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea

rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul

Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor

afirmaţii nesusţinute de conţinutul lucrării

Concluzii

Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate

să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie

Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de

concluzii va scădea valoarea lucrării

Bibliografia (lista referinţelor citarea icircn text)

Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn

lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente

Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli

- să conţină cele mai importante şi recente lucrări

- să includă numai lucrări publicate

- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate

Bibliografie

Elisabeta Jaba ndash Statistică Ed Economică 1998

Mihai Ţarcă ndash Statistică volI Ed UAIC 1979

Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale

Ed University Press 2009

Sorana Daniela Bolboacă ndash Metodologia cercetării curs

53

Page 28: cercetarea medicala - metodologie

se compară cu Ftab pentru nx şi nz grade de libertate la un anumit prag de semnificaţie stabilit

Dacă Fc gt Ftab rezultă că variaţia factorului de grupare x este semnificativă pentru variaţia caracteristicii y

Testul z pentru proporţii

1 Compararea unei frecvenţe observate cu o frecvenţă teoretică

2 Testarea egalităţii a două frecvenţe

Testul z Compararea unei frecvenţe observate cu o frecvenţă teoretică

Scop Investigarea semnificaţiei diferenţei icircntre o frecvenţă teoretică p (icircntr-o populaţie) şi o frecvenţă

observată f pe un eşantion reprezentativ (variabilă calitativă (binare))

Condiţii de aplicare Testul este corect aplicat dacă numărul n al observaţiilor eşantionului este

suficient de mare (n∙p n∙(1-p)gt10

Parametrul

n = volumul eşantionului

Suntem interesaţi de investigarea prevalenţei hepatitei B la personalul care lucrează icircn laboratoarele

clinicilor de boli infecţioase din Transilvania Se ştie din studii anterioare că prevalenţa hepatitei B icircn

populaţia generală din Transilvania este de 9 S-a luat icircn studiu un eşantion de 100 persoane şi s-a

obţinut o prevalenţă a hepatitei B de 6 Există diferenţă semnificativă icircntre frecvenţa hepatitei B la

personalul care lucrează icircn laboratoarele spitalelor de boli infecţioase din Transilvania faţă de

populaţia generală

f = 006 p = 009 n = 100

Ipoteza nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat

faţă de frecvenţa hepatitei B icircn populaţia generală

Ipoteza alternativă test bilateral Există diferenţă semnificativă icircntre frecvenţa hepatitei B la

nivelul eşantionului şi prevalenţa hepatitei B icircn populaţia generală

f = 006 p = 009 n = 100

Pragul de semnificaţie a = 005

Regiunea critică test bilateral (-yen -196 ]Egrave[196 yen)

28

Concluzia testului

Deoarece parametrul statistic calculat al testului nu aparţine regiunii critice se acceptă ipoteza

nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat faţă de

frecvenţa hepatitei B icircn populaţia generală

Testul McNemar

Evaluarea dependenţei variabilelor calitative perechi (dorim să determinăm dacă o anumită

caracteristică este sau nu asociată cu o anumită patologie)

Identificăm n pacienţi care prezintă patologia de interes (eg Cancer bronho-pulmonar) şi n

pacienţi cu aceleaşi caracteristici ca şi primul grup dar care nu o prezintă

Martor = da Martor = nu

Caz = da a b

Caz = nu c d

Testul McNemar - exemplu fumat vs cancer

Martor = da Martor = nu

Cancer = da a = 2 b = 5

Cancer = nu c = 0 d = 3

29

χ2critic(α=005) = 384

32 lt 384 rarr acceptăm ipoteza nulă

Fumatul nu este icircn relaţie cu apariţia cancerului bronho-pulmonar

Inferenţa statistică pe date cantitative

Variabile cantitative continue

Testul z şi Student (t) (o medie sau medii perechi)

Testul z şi Student (t) (testarea a două medii)

ANOVA (ge 3 medii)

Ranguri (variabile cantitative discrete sau cantitative care nu icircndeplinesc condiţia de

normalitate)

Testul sumei rangurilor Wilcoxon

Kruskal-Wallis (ge 3 eşantioane independente)

Friedman (ge 3 eşantioane dependente)

Teste de normalitate variabile cantitative continue

Shapiro-Wilk

Kolmogorov-Smirnov

Shapiro-Wilk

Chi-Square Goodness-of-Fit

Dacă datele urmează o distribuţie normală aplicăm un test parametric

Dacă datele nu urmează o distribuţie normală aplicăm un test de comparare al rangurilor

30

Testul Z de comparare a mediei unui eşantion cu media unei populaţii

Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ

extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie

s2 care se cunoaşte

Condiţii de aplicare

1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru

compararea mediei unui eşantion cu media unei populaţii)

2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal

distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă

3 Talia eşantionului este mare ( ge 30)

Ipoteze

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media

eşantionului şi media populaţiei

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

(-yen -196 ] Egrave [196 yen)

Parametrul testului

n = volumul eşantionului

= media eşantionului

s = deviaţia standard a populaţiei

Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)

Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard

cunoscută

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi

media standard

Condiţii de aplicare

Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se

realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această

condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea

31

Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai

puternic

Numărul de grade de libertate (df) df = n-1

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

Parametrul testului

n = volumul eşantionului

micro0 = media standard

= media eşantionului

s = deviaţia standard a eşantionului

Testul ANOVA compararea mediilor a mai multe eşantioane

H0 = toate mediile sunt egale

H1 = nu toate mediile sunt egale

Condiţii de aplicare

1 Datele sunt independente unele faţă de celelalte

2 Datele fiecărui grup sunt normal distribuite

3 Deviaţia standard este aceeaşi pentru toate grupurile

Id Medicament

A B C D E F

1 5 6 7 10 5 9

2 6 8 8 11 8 8

3 7 7 9 13 6 7

4 8 9 11 12 4 5

32

5 9 10 10 9 7 6

Suma 35 40 45 55 30 35

Media 7 8 9 11 6 7

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =

= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)

Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2

F = (suma pătratelor(icircntre))(suma pătratelor(icircn))

Suma pătratelor (icircntre) = 16times5 = 80

Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60

Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn

interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare

SP df Media pătratelor F = MPicircntreMPicircn

Icircntre 80 5 = 805 = 16 = 1625 = 64

Icircn 60 24 = 6024 = 25

Total 140 29 -

Testul sumei rangurilor Wilcoxon

Aplicat pentru

Un set de observaţii provenite dintr-o valoare ipotetică comună

Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)

Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero

Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace

Suma rangurilor pentru diferenţele negative = 2+3+1 = 6

Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30

33

Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului

egal cu 8 = 0109

Icircnainte După Diferenţa Rang

64 66 -2 2

66 58 8 5

67 68 -1 3

71 65 6 4

72 75 -3 1

76 67 9 6

78 59 19 8

89 74 15 7

Testul Kruskal-Wallis (ge 3 eşantioane independente)

Test de ranguri aplicate pe mai mult de 3 eşantioane

H = parametrul testului

n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)

Tk = suma rangurilor

Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie

pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni

34

df = k-1 (k = numărul de eşantioane)

df = 3-1 = 2

Hcritic(α=005) = 599

H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie

pozitivă şi respectiv biopsie negativă

Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie

a tipului de studiu pe eşantioane perechi)

1 Definirea numărului de tratamente k

2 Obţinerea rangurilor pentru fiecare tratament

3 Sumarea rangurilor fiecărui tratament

4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)

5 Dacă Fr gt Frcritic rarr respingem H0

Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost

măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi

n = 9 k = 3 T12 = 225 T2

2 = 38025 T32 = 38025

Frcritic = 599

Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de

prostată

35

De reţinut

Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei

Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-

of-Fit

Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z

Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t

Compararea mediilor a 3 sau mai multe eşantioane ANOVA

Compararea mediilor a două populaţii (σ) testul Z

Compararea mediilor a două eşantioane (s) testul t

Compararea mediilor a două eşantioane perechi (s) testul t

ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi

cu cel pentru compararea a două eşantioane perechi

Ranguri

Distribuţia datelor nu are importanţă

Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)

Trei sau mai multe eşantioane Kruskal-Wallis

Trei sau mai multe eşantioane perechi Friedman

Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia

Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a

datelor)

Variabile nominale

Un singur eşantion sau eşantioane perechi

Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte

Eşantioane perechi testul Mc Nemar

Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2

Icircn analiza proporţiilor există teste diferite pentru

Compararea unei frecvenţe cu o frecvenţă cunoscută

Compararea a două frecvenţe

Semnificaţia statistică

Valoarea p (p value)

Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor

două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E

posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării

aleatorii

36

Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală

urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii

Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este

probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un

experiment de dimensiunea acestuia

Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că

diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii

diferite

Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca

fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă

ar fi fost adevărată

Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă

1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe

baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De

fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001

2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie

3 Se aplică testul statistic aferent pentru a calcula valoarea p

4 Se compară valoarea p cu valoarea ndash prag

5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe

semnificativă dpdv statisticrdquo

6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e

semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să

conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă

Teste de semnificaţie

Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului

populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)

Testarea ipotezelor implică posibile erori

Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile

sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui

grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul

icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005

ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există

37

nici o diferenţă

Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ

statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de

ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost

ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau

dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă

cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă

semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe

ipotetice variate icircn cazul icircn care ele există

Măsuri ale frecvenţei

Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)

Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate

Generic formula pe care se bazează toate cele trei este

unde x şi y sunt cantităţile de comparat

Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea

unei frecvenţe pe grupe de sex vacircrstă etc

Proporţia implică icircn mod necesar ca x să fie inclus icircn y

Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară

frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp

Pentru calcularea unei rate trebuie ţinut cont de trei aspecte

bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin

bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp

bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo

Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un

tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei

populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei

aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)

38

Indicatori

Rata de incidenţă

Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă

icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii

Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o

perioadă de timp

Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de

timp x

Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei

susceptibili de a dezvolta icircmbolnăvirea studiată

Numitorul poate fi

bull Numărul mediu al populaţiei icircn perioada de timp studiată

bull Mărimea populaţiei icircn mijlocul perioadei de studiu

bull Mărimea populaţiei la icircnceputul studiului

Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă

Este obligatorie menţionarea perioadei de timp

Prevalenţa

Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la

un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă

schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa

momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)

39

Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include

numai cazuri noi respectiv include cazuri noi şi vechi

Rata de atac

Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este

folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp

raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori

Rata persoană-timp

Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din

momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte

migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost

observate

Riscul relativ (RR)

Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment

legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele

prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două

grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la

bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la

bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai

mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo

Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2

Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn

cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă

(Tabelul 1)

Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR

Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la

neexpuşi

40

Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de

culegere a datelor

Odds ratio (OR)

Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin

raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general

studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)

Tabelul 2 Tabelul 2 x 2 pentru calcularea OR

Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală

Rate de mortalitate

Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp

specificată Există mai multe tipuri de rate de mortalitate

o Mortalitate specifică pe sex

o Mortalitate specifică pe rasă

o Mortalitate specifică pe boală

o Mortalitate neonatală

o Mortalitate postneonatală

o Mortalitate infantilă

o Mortalitate maternă

Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP

41

Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de

viaţă şi vacircrsta la care survine decesul dacă este prematur

Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu

Ani de viaţă pierduţi datorat dizabilităţii

Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt

utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru

cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite

grupuri

Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de

risc şi o boală se folosesc riscul relativ şi odds ratio

35 Analiza şi interpretarea datelor

După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date

trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul

Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor

colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului

studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu

plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde

prezenţa biostatisticianului este necesară

Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu

elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat

iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului

iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate

depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori

testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere

clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza

Interpretarea rezultatelor statistice

Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne

motive (număr mic de date) acceptarea ei să fie falsă

Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine

gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia

ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument

de decizie Intervalul de confidenţă

42

Interpretarea statistica ne interpretarea clinică

Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă

Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice

obţinute pe eşantionul studiat

Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare

Ce interpretăm Rezultatele

personale obţinute icircn urma studiului

care au fost prezentate icircn secţiunea bdquoRezultaterdquo

Explicăm rezultatele obţinute

Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale

Interpretarea trebuie să se realizeze icircn

lumina limitelor studiului

contextul cultural social şi educaţional al locului unde s-a realizat cercetarea

contextul a ceea ce se cunoaşte din literatura de specialitate

Interpretăm doar rezultatele personale obţinute icircn urma studiului

Interpretarea statistică nu este tot una cu interpretarea clinică

Interpretarea statistică este importantă

Interpretarea clinică este foarte importantă

Intervalul de confidenţă

Media calculată pe baza unui eşantion nu va echivala media populaţiei

Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului

Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a

populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a

populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)

pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru

orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare

dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de

confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de

date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de

5

Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel

Dacă valoarea p este mică

Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare

aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o

medie diferită Diferenţa este semnificativă dpdv statistic

43

Icircn continuare

Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa

reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică

pentru a fi interesante din punct de vedere ştiinţific

Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC

oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care

este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a

obţine o concluzie clară

Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o

diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că

datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din

punct de vedere ştiinţific

Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul

detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat

Erorile studiilor medicale

Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura

anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară

caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea

asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri

legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias

Erorile potenţiale icircn studiile epidemiologice

1 Erori icircntacircmplătoare

2 Erori sistematice

3 Confuzia

4 Validitatea

1 Erori icircntacircmplătoare

Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a

parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel

de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot

fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii

(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor

de măsură (eroarea de măsurare)

44

2 Erori sistematice

Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate

care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu

acurateţe mare Acurateţea nu este afectată de mărimea eşantionului

Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de

experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea

dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus

şi greu de cuantificat (consum de alcool personalitate etc)

Principalele tipuri de erori din această categorie sunt

bull Biasul de selecţie

bull Biasul de informaţie

Biasul de selecţie

Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul

trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion

inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale

persoanelor incluse

Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se

ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia

Biasul de informaţie

Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de

instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze

expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere

nesemnificativă sau chiar să nu şi-o amintească de loc

3 Confuzia

Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune

prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este

cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă

de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte

important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor

protector

4 Validitatea

Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă

Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte

estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional

Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă

45

conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se

demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)

Validitatea externă se poate realiza numai dacă studiul este valid intern

Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii

studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de

studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt

laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi

validă din punct de vedere intern)

3 6 Prezentarea rezultatelor

După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite

Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor

icircntr-o formă bdquodigerabilărdquo este necesară

Scopul prezentării datelor

1 Transmiterea concluziilor studiului

a Datele corecte şi importante merită comunicate

b Datele trebuie să confirme sau să infirme ipoteza studiului

c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală

2 Acordarea posibilităţii altor cercetători să aprecieze studiul

a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti

b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor

prezentate

Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru

fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie

statistică

Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de

valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras

(Tabel 3)

Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)

46

Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct

numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor

precum şi prezentarea acestora sub formă inteligibilă

Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care

convin cercetătorului

Prezentarea datelor se poate face

1 Figuri şi tabele icircn articole scrise

2 Figuri şi tabele icircn prezentări orale

3 Figuri şi tabele icircn postere

4 Text scris sau incluse icircn text

5 Site-uri de WEB

Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor

Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie

Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele

exprimacircnd exact ceea ce acestea exprimă

Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate

anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel

să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se

acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca

mai sus sugestive sunt formatele simple şi puţin icircncărcate

Dacă nu există reguli impuse se respectă

1 Mesaj simplu fără falsificarea datelor

2 De obicei este necesar atacirct tabelul cacirct şi graficul

3 Să fie simplu şi clar

Tabele

Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile

coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică

elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de

1 Se folosesc doar linii orizontale

2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn

evidenţi prin linie de separare (Tabelul 4)

Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland

Noua Zeelandă)

(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)

47

3 Numerele sunt aliniate icircn funcţie de virgulă

4 Indicii statistici sunt explicaţi sub tabel

5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană

6 Abrevierile pot fi folosite

7 Numărul de zecimale trebuie limitat la maxim două

8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel

9 Plasarea legendei este obligatorie sub tabel

10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)

Icircn cazul prezentărilor orale sau a posterelor este indicat ca

1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării

2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte

3 Folosirea de simboluri este permisă

Clasificarea tabelelor

Tabelele se clasifică după

i) conţinut

bull cu distribuţii de frecvenţe

bull de clase de frecvenţe

bull de contingenţă

ii) structura

bull cu doua coloane

bull cu subclasificări

bull ldquomasterrdquo

Tabele ce conţin distribuţii de frecvenţe

O modalitate comodă de a prezenta o mulţime de date brute este

1 Se ordonează datele in ordine crescătoare

2 Se determine frecvenţa fiecărei valori

3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane

(Tabelul 5)

Tabelul 5 Distribuţii de frecvenţă absolută

48

Tabelul claselor de frecvenţe

1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă

2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)

Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)

Tabele de contingenţă

1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a

tabelelor de contingenţă

2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a

combinaţiilor de perechi ordonate de valori

3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre

a factor de risc si

b starea sănătăţii

4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)

5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)

Tabelul 7 Tabel de contingenţă 2 x 2

49

Grafice

Există două categorii de moduri grafice sub care se pot prezenta datele

1 Ilustraţii şi fotografii

2 Grafice

1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă

pentru lucrare

2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit

Putem vorbi despre mai multe tipuri de grafice

bull Grafice pentru reprezentarea datelor cantitative

1048707 Grafic cartezian (X Y)

1048707 Histograma

1048707 Poligonul de frecvenţe

1048707 Diagrama bdquoscatterrdquo

bull Grafice pentru reprezentarea datelor calitative

1048707 Grafic cu bare

1048707 Diagrama tip bdquoboxplotrdquo

1048707 Diagrama bdquopierdquo

1048707 Cartograma

Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi

dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)

Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)

Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie

Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)

Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)

50

Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir

de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele

două variabile studiate (Figura 6)

Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2

(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2

rămacircne aproximativ constantă)

Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea

comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea

comparativă a mai multor variabile

Figura 7 Grafic calitativ cu bare

51

Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo

Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două

posibilităţi reprezentate grafic este mai frecventă (Figura 8)

Figura 8 Reprezentare tip bdquopierdquo

Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli

sau a oricărui element comparativ Se foloseşte de epidemiologi

Rezultate

Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare

Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o

manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu

explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția

bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la

ilustraţii tabele grafice

Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi

nici rezultatele care invalidează eventual ipoteza

Discuţii

Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd

cultura ştiinţifică şi inteligenţa autorilor

Acest capitol răspunde la trei obiective

Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia

calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de

selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează

rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv

52

este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn

care a fost abordată problema fără a face o revistă a literaturii

Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea

rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul

Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor

afirmaţii nesusţinute de conţinutul lucrării

Concluzii

Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate

să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie

Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de

concluzii va scădea valoarea lucrării

Bibliografia (lista referinţelor citarea icircn text)

Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn

lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente

Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli

- să conţină cele mai importante şi recente lucrări

- să includă numai lucrări publicate

- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate

Bibliografie

Elisabeta Jaba ndash Statistică Ed Economică 1998

Mihai Ţarcă ndash Statistică volI Ed UAIC 1979

Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale

Ed University Press 2009

Sorana Daniela Bolboacă ndash Metodologia cercetării curs

53

Page 29: cercetarea medicala - metodologie

Concluzia testului

Deoarece parametrul statistic calculat al testului nu aparţine regiunii critice se acceptă ipoteza

nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat faţă de

frecvenţa hepatitei B icircn populaţia generală

Testul McNemar

Evaluarea dependenţei variabilelor calitative perechi (dorim să determinăm dacă o anumită

caracteristică este sau nu asociată cu o anumită patologie)

Identificăm n pacienţi care prezintă patologia de interes (eg Cancer bronho-pulmonar) şi n

pacienţi cu aceleaşi caracteristici ca şi primul grup dar care nu o prezintă

Martor = da Martor = nu

Caz = da a b

Caz = nu c d

Testul McNemar - exemplu fumat vs cancer

Martor = da Martor = nu

Cancer = da a = 2 b = 5

Cancer = nu c = 0 d = 3

29

χ2critic(α=005) = 384

32 lt 384 rarr acceptăm ipoteza nulă

Fumatul nu este icircn relaţie cu apariţia cancerului bronho-pulmonar

Inferenţa statistică pe date cantitative

Variabile cantitative continue

Testul z şi Student (t) (o medie sau medii perechi)

Testul z şi Student (t) (testarea a două medii)

ANOVA (ge 3 medii)

Ranguri (variabile cantitative discrete sau cantitative care nu icircndeplinesc condiţia de

normalitate)

Testul sumei rangurilor Wilcoxon

Kruskal-Wallis (ge 3 eşantioane independente)

Friedman (ge 3 eşantioane dependente)

Teste de normalitate variabile cantitative continue

Shapiro-Wilk

Kolmogorov-Smirnov

Shapiro-Wilk

Chi-Square Goodness-of-Fit

Dacă datele urmează o distribuţie normală aplicăm un test parametric

Dacă datele nu urmează o distribuţie normală aplicăm un test de comparare al rangurilor

30

Testul Z de comparare a mediei unui eşantion cu media unei populaţii

Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ

extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie

s2 care se cunoaşte

Condiţii de aplicare

1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru

compararea mediei unui eşantion cu media unei populaţii)

2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal

distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă

3 Talia eşantionului este mare ( ge 30)

Ipoteze

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media

eşantionului şi media populaţiei

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

(-yen -196 ] Egrave [196 yen)

Parametrul testului

n = volumul eşantionului

= media eşantionului

s = deviaţia standard a populaţiei

Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)

Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard

cunoscută

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi

media standard

Condiţii de aplicare

Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se

realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această

condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea

31

Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai

puternic

Numărul de grade de libertate (df) df = n-1

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

Parametrul testului

n = volumul eşantionului

micro0 = media standard

= media eşantionului

s = deviaţia standard a eşantionului

Testul ANOVA compararea mediilor a mai multe eşantioane

H0 = toate mediile sunt egale

H1 = nu toate mediile sunt egale

Condiţii de aplicare

1 Datele sunt independente unele faţă de celelalte

2 Datele fiecărui grup sunt normal distribuite

3 Deviaţia standard este aceeaşi pentru toate grupurile

Id Medicament

A B C D E F

1 5 6 7 10 5 9

2 6 8 8 11 8 8

3 7 7 9 13 6 7

4 8 9 11 12 4 5

32

5 9 10 10 9 7 6

Suma 35 40 45 55 30 35

Media 7 8 9 11 6 7

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =

= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)

Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2

F = (suma pătratelor(icircntre))(suma pătratelor(icircn))

Suma pătratelor (icircntre) = 16times5 = 80

Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60

Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn

interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare

SP df Media pătratelor F = MPicircntreMPicircn

Icircntre 80 5 = 805 = 16 = 1625 = 64

Icircn 60 24 = 6024 = 25

Total 140 29 -

Testul sumei rangurilor Wilcoxon

Aplicat pentru

Un set de observaţii provenite dintr-o valoare ipotetică comună

Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)

Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero

Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace

Suma rangurilor pentru diferenţele negative = 2+3+1 = 6

Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30

33

Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului

egal cu 8 = 0109

Icircnainte După Diferenţa Rang

64 66 -2 2

66 58 8 5

67 68 -1 3

71 65 6 4

72 75 -3 1

76 67 9 6

78 59 19 8

89 74 15 7

Testul Kruskal-Wallis (ge 3 eşantioane independente)

Test de ranguri aplicate pe mai mult de 3 eşantioane

H = parametrul testului

n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)

Tk = suma rangurilor

Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie

pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni

34

df = k-1 (k = numărul de eşantioane)

df = 3-1 = 2

Hcritic(α=005) = 599

H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie

pozitivă şi respectiv biopsie negativă

Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie

a tipului de studiu pe eşantioane perechi)

1 Definirea numărului de tratamente k

2 Obţinerea rangurilor pentru fiecare tratament

3 Sumarea rangurilor fiecărui tratament

4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)

5 Dacă Fr gt Frcritic rarr respingem H0

Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost

măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi

n = 9 k = 3 T12 = 225 T2

2 = 38025 T32 = 38025

Frcritic = 599

Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de

prostată

35

De reţinut

Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei

Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-

of-Fit

Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z

Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t

Compararea mediilor a 3 sau mai multe eşantioane ANOVA

Compararea mediilor a două populaţii (σ) testul Z

Compararea mediilor a două eşantioane (s) testul t

Compararea mediilor a două eşantioane perechi (s) testul t

ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi

cu cel pentru compararea a două eşantioane perechi

Ranguri

Distribuţia datelor nu are importanţă

Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)

Trei sau mai multe eşantioane Kruskal-Wallis

Trei sau mai multe eşantioane perechi Friedman

Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia

Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a

datelor)

Variabile nominale

Un singur eşantion sau eşantioane perechi

Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte

Eşantioane perechi testul Mc Nemar

Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2

Icircn analiza proporţiilor există teste diferite pentru

Compararea unei frecvenţe cu o frecvenţă cunoscută

Compararea a două frecvenţe

Semnificaţia statistică

Valoarea p (p value)

Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor

două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E

posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării

aleatorii

36

Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală

urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii

Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este

probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un

experiment de dimensiunea acestuia

Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că

diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii

diferite

Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca

fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă

ar fi fost adevărată

Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă

1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe

baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De

fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001

2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie

3 Se aplică testul statistic aferent pentru a calcula valoarea p

4 Se compară valoarea p cu valoarea ndash prag

5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe

semnificativă dpdv statisticrdquo

6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e

semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să

conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă

Teste de semnificaţie

Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului

populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)

Testarea ipotezelor implică posibile erori

Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile

sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui

grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul

icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005

ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există

37

nici o diferenţă

Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ

statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de

ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost

ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau

dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă

cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă

semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe

ipotetice variate icircn cazul icircn care ele există

Măsuri ale frecvenţei

Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)

Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate

Generic formula pe care se bazează toate cele trei este

unde x şi y sunt cantităţile de comparat

Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea

unei frecvenţe pe grupe de sex vacircrstă etc

Proporţia implică icircn mod necesar ca x să fie inclus icircn y

Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară

frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp

Pentru calcularea unei rate trebuie ţinut cont de trei aspecte

bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin

bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp

bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo

Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un

tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei

populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei

aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)

38

Indicatori

Rata de incidenţă

Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă

icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii

Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o

perioadă de timp

Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de

timp x

Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei

susceptibili de a dezvolta icircmbolnăvirea studiată

Numitorul poate fi

bull Numărul mediu al populaţiei icircn perioada de timp studiată

bull Mărimea populaţiei icircn mijlocul perioadei de studiu

bull Mărimea populaţiei la icircnceputul studiului

Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă

Este obligatorie menţionarea perioadei de timp

Prevalenţa

Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la

un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă

schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa

momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)

39

Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include

numai cazuri noi respectiv include cazuri noi şi vechi

Rata de atac

Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este

folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp

raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori

Rata persoană-timp

Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din

momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte

migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost

observate

Riscul relativ (RR)

Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment

legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele

prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două

grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la

bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la

bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai

mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo

Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2

Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn

cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă

(Tabelul 1)

Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR

Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la

neexpuşi

40

Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de

culegere a datelor

Odds ratio (OR)

Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin

raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general

studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)

Tabelul 2 Tabelul 2 x 2 pentru calcularea OR

Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală

Rate de mortalitate

Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp

specificată Există mai multe tipuri de rate de mortalitate

o Mortalitate specifică pe sex

o Mortalitate specifică pe rasă

o Mortalitate specifică pe boală

o Mortalitate neonatală

o Mortalitate postneonatală

o Mortalitate infantilă

o Mortalitate maternă

Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP

41

Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de

viaţă şi vacircrsta la care survine decesul dacă este prematur

Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu

Ani de viaţă pierduţi datorat dizabilităţii

Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt

utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru

cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite

grupuri

Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de

risc şi o boală se folosesc riscul relativ şi odds ratio

35 Analiza şi interpretarea datelor

După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date

trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul

Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor

colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului

studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu

plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde

prezenţa biostatisticianului este necesară

Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu

elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat

iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului

iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate

depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori

testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere

clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza

Interpretarea rezultatelor statistice

Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne

motive (număr mic de date) acceptarea ei să fie falsă

Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine

gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia

ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument

de decizie Intervalul de confidenţă

42

Interpretarea statistica ne interpretarea clinică

Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă

Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice

obţinute pe eşantionul studiat

Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare

Ce interpretăm Rezultatele

personale obţinute icircn urma studiului

care au fost prezentate icircn secţiunea bdquoRezultaterdquo

Explicăm rezultatele obţinute

Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale

Interpretarea trebuie să se realizeze icircn

lumina limitelor studiului

contextul cultural social şi educaţional al locului unde s-a realizat cercetarea

contextul a ceea ce se cunoaşte din literatura de specialitate

Interpretăm doar rezultatele personale obţinute icircn urma studiului

Interpretarea statistică nu este tot una cu interpretarea clinică

Interpretarea statistică este importantă

Interpretarea clinică este foarte importantă

Intervalul de confidenţă

Media calculată pe baza unui eşantion nu va echivala media populaţiei

Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului

Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a

populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a

populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)

pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru

orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare

dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de

confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de

date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de

5

Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel

Dacă valoarea p este mică

Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare

aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o

medie diferită Diferenţa este semnificativă dpdv statistic

43

Icircn continuare

Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa

reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică

pentru a fi interesante din punct de vedere ştiinţific

Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC

oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care

este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a

obţine o concluzie clară

Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o

diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că

datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din

punct de vedere ştiinţific

Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul

detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat

Erorile studiilor medicale

Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura

anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară

caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea

asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri

legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias

Erorile potenţiale icircn studiile epidemiologice

1 Erori icircntacircmplătoare

2 Erori sistematice

3 Confuzia

4 Validitatea

1 Erori icircntacircmplătoare

Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a

parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel

de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot

fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii

(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor

de măsură (eroarea de măsurare)

44

2 Erori sistematice

Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate

care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu

acurateţe mare Acurateţea nu este afectată de mărimea eşantionului

Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de

experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea

dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus

şi greu de cuantificat (consum de alcool personalitate etc)

Principalele tipuri de erori din această categorie sunt

bull Biasul de selecţie

bull Biasul de informaţie

Biasul de selecţie

Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul

trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion

inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale

persoanelor incluse

Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se

ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia

Biasul de informaţie

Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de

instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze

expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere

nesemnificativă sau chiar să nu şi-o amintească de loc

3 Confuzia

Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune

prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este

cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă

de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte

important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor

protector

4 Validitatea

Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă

Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte

estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional

Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă

45

conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se

demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)

Validitatea externă se poate realiza numai dacă studiul este valid intern

Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii

studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de

studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt

laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi

validă din punct de vedere intern)

3 6 Prezentarea rezultatelor

După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite

Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor

icircntr-o formă bdquodigerabilărdquo este necesară

Scopul prezentării datelor

1 Transmiterea concluziilor studiului

a Datele corecte şi importante merită comunicate

b Datele trebuie să confirme sau să infirme ipoteza studiului

c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală

2 Acordarea posibilităţii altor cercetători să aprecieze studiul

a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti

b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor

prezentate

Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru

fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie

statistică

Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de

valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras

(Tabel 3)

Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)

46

Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct

numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor

precum şi prezentarea acestora sub formă inteligibilă

Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care

convin cercetătorului

Prezentarea datelor se poate face

1 Figuri şi tabele icircn articole scrise

2 Figuri şi tabele icircn prezentări orale

3 Figuri şi tabele icircn postere

4 Text scris sau incluse icircn text

5 Site-uri de WEB

Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor

Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie

Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele

exprimacircnd exact ceea ce acestea exprimă

Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate

anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel

să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se

acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca

mai sus sugestive sunt formatele simple şi puţin icircncărcate

Dacă nu există reguli impuse se respectă

1 Mesaj simplu fără falsificarea datelor

2 De obicei este necesar atacirct tabelul cacirct şi graficul

3 Să fie simplu şi clar

Tabele

Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile

coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică

elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de

1 Se folosesc doar linii orizontale

2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn

evidenţi prin linie de separare (Tabelul 4)

Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland

Noua Zeelandă)

(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)

47

3 Numerele sunt aliniate icircn funcţie de virgulă

4 Indicii statistici sunt explicaţi sub tabel

5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană

6 Abrevierile pot fi folosite

7 Numărul de zecimale trebuie limitat la maxim două

8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel

9 Plasarea legendei este obligatorie sub tabel

10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)

Icircn cazul prezentărilor orale sau a posterelor este indicat ca

1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării

2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte

3 Folosirea de simboluri este permisă

Clasificarea tabelelor

Tabelele se clasifică după

i) conţinut

bull cu distribuţii de frecvenţe

bull de clase de frecvenţe

bull de contingenţă

ii) structura

bull cu doua coloane

bull cu subclasificări

bull ldquomasterrdquo

Tabele ce conţin distribuţii de frecvenţe

O modalitate comodă de a prezenta o mulţime de date brute este

1 Se ordonează datele in ordine crescătoare

2 Se determine frecvenţa fiecărei valori

3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane

(Tabelul 5)

Tabelul 5 Distribuţii de frecvenţă absolută

48

Tabelul claselor de frecvenţe

1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă

2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)

Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)

Tabele de contingenţă

1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a

tabelelor de contingenţă

2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a

combinaţiilor de perechi ordonate de valori

3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre

a factor de risc si

b starea sănătăţii

4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)

5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)

Tabelul 7 Tabel de contingenţă 2 x 2

49

Grafice

Există două categorii de moduri grafice sub care se pot prezenta datele

1 Ilustraţii şi fotografii

2 Grafice

1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă

pentru lucrare

2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit

Putem vorbi despre mai multe tipuri de grafice

bull Grafice pentru reprezentarea datelor cantitative

1048707 Grafic cartezian (X Y)

1048707 Histograma

1048707 Poligonul de frecvenţe

1048707 Diagrama bdquoscatterrdquo

bull Grafice pentru reprezentarea datelor calitative

1048707 Grafic cu bare

1048707 Diagrama tip bdquoboxplotrdquo

1048707 Diagrama bdquopierdquo

1048707 Cartograma

Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi

dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)

Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)

Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie

Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)

Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)

50

Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir

de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele

două variabile studiate (Figura 6)

Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2

(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2

rămacircne aproximativ constantă)

Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea

comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea

comparativă a mai multor variabile

Figura 7 Grafic calitativ cu bare

51

Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo

Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două

posibilităţi reprezentate grafic este mai frecventă (Figura 8)

Figura 8 Reprezentare tip bdquopierdquo

Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli

sau a oricărui element comparativ Se foloseşte de epidemiologi

Rezultate

Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare

Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o

manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu

explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția

bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la

ilustraţii tabele grafice

Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi

nici rezultatele care invalidează eventual ipoteza

Discuţii

Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd

cultura ştiinţifică şi inteligenţa autorilor

Acest capitol răspunde la trei obiective

Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia

calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de

selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează

rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv

52

este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn

care a fost abordată problema fără a face o revistă a literaturii

Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea

rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul

Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor

afirmaţii nesusţinute de conţinutul lucrării

Concluzii

Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate

să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie

Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de

concluzii va scădea valoarea lucrării

Bibliografia (lista referinţelor citarea icircn text)

Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn

lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente

Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli

- să conţină cele mai importante şi recente lucrări

- să includă numai lucrări publicate

- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate

Bibliografie

Elisabeta Jaba ndash Statistică Ed Economică 1998

Mihai Ţarcă ndash Statistică volI Ed UAIC 1979

Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale

Ed University Press 2009

Sorana Daniela Bolboacă ndash Metodologia cercetării curs

53

Page 30: cercetarea medicala - metodologie

χ2critic(α=005) = 384

32 lt 384 rarr acceptăm ipoteza nulă

Fumatul nu este icircn relaţie cu apariţia cancerului bronho-pulmonar

Inferenţa statistică pe date cantitative

Variabile cantitative continue

Testul z şi Student (t) (o medie sau medii perechi)

Testul z şi Student (t) (testarea a două medii)

ANOVA (ge 3 medii)

Ranguri (variabile cantitative discrete sau cantitative care nu icircndeplinesc condiţia de

normalitate)

Testul sumei rangurilor Wilcoxon

Kruskal-Wallis (ge 3 eşantioane independente)

Friedman (ge 3 eşantioane dependente)

Teste de normalitate variabile cantitative continue

Shapiro-Wilk

Kolmogorov-Smirnov

Shapiro-Wilk

Chi-Square Goodness-of-Fit

Dacă datele urmează o distribuţie normală aplicăm un test parametric

Dacă datele nu urmează o distribuţie normală aplicăm un test de comparare al rangurilor

30

Testul Z de comparare a mediei unui eşantion cu media unei populaţii

Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ

extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie

s2 care se cunoaşte

Condiţii de aplicare

1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru

compararea mediei unui eşantion cu media unei populaţii)

2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal

distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă

3 Talia eşantionului este mare ( ge 30)

Ipoteze

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media

eşantionului şi media populaţiei

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

(-yen -196 ] Egrave [196 yen)

Parametrul testului

n = volumul eşantionului

= media eşantionului

s = deviaţia standard a populaţiei

Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)

Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard

cunoscută

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi

media standard

Condiţii de aplicare

Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se

realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această

condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea

31

Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai

puternic

Numărul de grade de libertate (df) df = n-1

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

Parametrul testului

n = volumul eşantionului

micro0 = media standard

= media eşantionului

s = deviaţia standard a eşantionului

Testul ANOVA compararea mediilor a mai multe eşantioane

H0 = toate mediile sunt egale

H1 = nu toate mediile sunt egale

Condiţii de aplicare

1 Datele sunt independente unele faţă de celelalte

2 Datele fiecărui grup sunt normal distribuite

3 Deviaţia standard este aceeaşi pentru toate grupurile

Id Medicament

A B C D E F

1 5 6 7 10 5 9

2 6 8 8 11 8 8

3 7 7 9 13 6 7

4 8 9 11 12 4 5

32

5 9 10 10 9 7 6

Suma 35 40 45 55 30 35

Media 7 8 9 11 6 7

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =

= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)

Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2

F = (suma pătratelor(icircntre))(suma pătratelor(icircn))

Suma pătratelor (icircntre) = 16times5 = 80

Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60

Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn

interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare

SP df Media pătratelor F = MPicircntreMPicircn

Icircntre 80 5 = 805 = 16 = 1625 = 64

Icircn 60 24 = 6024 = 25

Total 140 29 -

Testul sumei rangurilor Wilcoxon

Aplicat pentru

Un set de observaţii provenite dintr-o valoare ipotetică comună

Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)

Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero

Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace

Suma rangurilor pentru diferenţele negative = 2+3+1 = 6

Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30

33

Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului

egal cu 8 = 0109

Icircnainte După Diferenţa Rang

64 66 -2 2

66 58 8 5

67 68 -1 3

71 65 6 4

72 75 -3 1

76 67 9 6

78 59 19 8

89 74 15 7

Testul Kruskal-Wallis (ge 3 eşantioane independente)

Test de ranguri aplicate pe mai mult de 3 eşantioane

H = parametrul testului

n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)

Tk = suma rangurilor

Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie

pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni

34

df = k-1 (k = numărul de eşantioane)

df = 3-1 = 2

Hcritic(α=005) = 599

H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie

pozitivă şi respectiv biopsie negativă

Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie

a tipului de studiu pe eşantioane perechi)

1 Definirea numărului de tratamente k

2 Obţinerea rangurilor pentru fiecare tratament

3 Sumarea rangurilor fiecărui tratament

4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)

5 Dacă Fr gt Frcritic rarr respingem H0

Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost

măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi

n = 9 k = 3 T12 = 225 T2

2 = 38025 T32 = 38025

Frcritic = 599

Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de

prostată

35

De reţinut

Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei

Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-

of-Fit

Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z

Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t

Compararea mediilor a 3 sau mai multe eşantioane ANOVA

Compararea mediilor a două populaţii (σ) testul Z

Compararea mediilor a două eşantioane (s) testul t

Compararea mediilor a două eşantioane perechi (s) testul t

ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi

cu cel pentru compararea a două eşantioane perechi

Ranguri

Distribuţia datelor nu are importanţă

Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)

Trei sau mai multe eşantioane Kruskal-Wallis

Trei sau mai multe eşantioane perechi Friedman

Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia

Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a

datelor)

Variabile nominale

Un singur eşantion sau eşantioane perechi

Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte

Eşantioane perechi testul Mc Nemar

Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2

Icircn analiza proporţiilor există teste diferite pentru

Compararea unei frecvenţe cu o frecvenţă cunoscută

Compararea a două frecvenţe

Semnificaţia statistică

Valoarea p (p value)

Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor

două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E

posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării

aleatorii

36

Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală

urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii

Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este

probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un

experiment de dimensiunea acestuia

Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că

diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii

diferite

Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca

fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă

ar fi fost adevărată

Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă

1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe

baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De

fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001

2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie

3 Se aplică testul statistic aferent pentru a calcula valoarea p

4 Se compară valoarea p cu valoarea ndash prag

5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe

semnificativă dpdv statisticrdquo

6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e

semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să

conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă

Teste de semnificaţie

Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului

populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)

Testarea ipotezelor implică posibile erori

Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile

sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui

grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul

icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005

ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există

37

nici o diferenţă

Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ

statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de

ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost

ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau

dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă

cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă

semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe

ipotetice variate icircn cazul icircn care ele există

Măsuri ale frecvenţei

Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)

Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate

Generic formula pe care se bazează toate cele trei este

unde x şi y sunt cantităţile de comparat

Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea

unei frecvenţe pe grupe de sex vacircrstă etc

Proporţia implică icircn mod necesar ca x să fie inclus icircn y

Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară

frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp

Pentru calcularea unei rate trebuie ţinut cont de trei aspecte

bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin

bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp

bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo

Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un

tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei

populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei

aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)

38

Indicatori

Rata de incidenţă

Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă

icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii

Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o

perioadă de timp

Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de

timp x

Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei

susceptibili de a dezvolta icircmbolnăvirea studiată

Numitorul poate fi

bull Numărul mediu al populaţiei icircn perioada de timp studiată

bull Mărimea populaţiei icircn mijlocul perioadei de studiu

bull Mărimea populaţiei la icircnceputul studiului

Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă

Este obligatorie menţionarea perioadei de timp

Prevalenţa

Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la

un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă

schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa

momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)

39

Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include

numai cazuri noi respectiv include cazuri noi şi vechi

Rata de atac

Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este

folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp

raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori

Rata persoană-timp

Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din

momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte

migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost

observate

Riscul relativ (RR)

Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment

legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele

prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două

grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la

bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la

bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai

mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo

Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2

Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn

cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă

(Tabelul 1)

Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR

Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la

neexpuşi

40

Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de

culegere a datelor

Odds ratio (OR)

Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin

raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general

studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)

Tabelul 2 Tabelul 2 x 2 pentru calcularea OR

Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală

Rate de mortalitate

Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp

specificată Există mai multe tipuri de rate de mortalitate

o Mortalitate specifică pe sex

o Mortalitate specifică pe rasă

o Mortalitate specifică pe boală

o Mortalitate neonatală

o Mortalitate postneonatală

o Mortalitate infantilă

o Mortalitate maternă

Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP

41

Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de

viaţă şi vacircrsta la care survine decesul dacă este prematur

Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu

Ani de viaţă pierduţi datorat dizabilităţii

Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt

utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru

cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite

grupuri

Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de

risc şi o boală se folosesc riscul relativ şi odds ratio

35 Analiza şi interpretarea datelor

După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date

trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul

Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor

colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului

studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu

plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde

prezenţa biostatisticianului este necesară

Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu

elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat

iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului

iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate

depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori

testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere

clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza

Interpretarea rezultatelor statistice

Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne

motive (număr mic de date) acceptarea ei să fie falsă

Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine

gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia

ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument

de decizie Intervalul de confidenţă

42

Interpretarea statistica ne interpretarea clinică

Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă

Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice

obţinute pe eşantionul studiat

Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare

Ce interpretăm Rezultatele

personale obţinute icircn urma studiului

care au fost prezentate icircn secţiunea bdquoRezultaterdquo

Explicăm rezultatele obţinute

Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale

Interpretarea trebuie să se realizeze icircn

lumina limitelor studiului

contextul cultural social şi educaţional al locului unde s-a realizat cercetarea

contextul a ceea ce se cunoaşte din literatura de specialitate

Interpretăm doar rezultatele personale obţinute icircn urma studiului

Interpretarea statistică nu este tot una cu interpretarea clinică

Interpretarea statistică este importantă

Interpretarea clinică este foarte importantă

Intervalul de confidenţă

Media calculată pe baza unui eşantion nu va echivala media populaţiei

Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului

Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a

populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a

populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)

pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru

orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare

dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de

confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de

date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de

5

Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel

Dacă valoarea p este mică

Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare

aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o

medie diferită Diferenţa este semnificativă dpdv statistic

43

Icircn continuare

Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa

reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică

pentru a fi interesante din punct de vedere ştiinţific

Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC

oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care

este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a

obţine o concluzie clară

Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o

diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că

datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din

punct de vedere ştiinţific

Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul

detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat

Erorile studiilor medicale

Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura

anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară

caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea

asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri

legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias

Erorile potenţiale icircn studiile epidemiologice

1 Erori icircntacircmplătoare

2 Erori sistematice

3 Confuzia

4 Validitatea

1 Erori icircntacircmplătoare

Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a

parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel

de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot

fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii

(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor

de măsură (eroarea de măsurare)

44

2 Erori sistematice

Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate

care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu

acurateţe mare Acurateţea nu este afectată de mărimea eşantionului

Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de

experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea

dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus

şi greu de cuantificat (consum de alcool personalitate etc)

Principalele tipuri de erori din această categorie sunt

bull Biasul de selecţie

bull Biasul de informaţie

Biasul de selecţie

Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul

trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion

inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale

persoanelor incluse

Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se

ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia

Biasul de informaţie

Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de

instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze

expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere

nesemnificativă sau chiar să nu şi-o amintească de loc

3 Confuzia

Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune

prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este

cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă

de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte

important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor

protector

4 Validitatea

Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă

Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte

estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional

Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă

45

conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se

demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)

Validitatea externă se poate realiza numai dacă studiul este valid intern

Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii

studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de

studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt

laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi

validă din punct de vedere intern)

3 6 Prezentarea rezultatelor

După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite

Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor

icircntr-o formă bdquodigerabilărdquo este necesară

Scopul prezentării datelor

1 Transmiterea concluziilor studiului

a Datele corecte şi importante merită comunicate

b Datele trebuie să confirme sau să infirme ipoteza studiului

c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală

2 Acordarea posibilităţii altor cercetători să aprecieze studiul

a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti

b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor

prezentate

Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru

fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie

statistică

Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de

valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras

(Tabel 3)

Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)

46

Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct

numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor

precum şi prezentarea acestora sub formă inteligibilă

Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care

convin cercetătorului

Prezentarea datelor se poate face

1 Figuri şi tabele icircn articole scrise

2 Figuri şi tabele icircn prezentări orale

3 Figuri şi tabele icircn postere

4 Text scris sau incluse icircn text

5 Site-uri de WEB

Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor

Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie

Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele

exprimacircnd exact ceea ce acestea exprimă

Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate

anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel

să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se

acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca

mai sus sugestive sunt formatele simple şi puţin icircncărcate

Dacă nu există reguli impuse se respectă

1 Mesaj simplu fără falsificarea datelor

2 De obicei este necesar atacirct tabelul cacirct şi graficul

3 Să fie simplu şi clar

Tabele

Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile

coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică

elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de

1 Se folosesc doar linii orizontale

2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn

evidenţi prin linie de separare (Tabelul 4)

Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland

Noua Zeelandă)

(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)

47

3 Numerele sunt aliniate icircn funcţie de virgulă

4 Indicii statistici sunt explicaţi sub tabel

5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană

6 Abrevierile pot fi folosite

7 Numărul de zecimale trebuie limitat la maxim două

8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel

9 Plasarea legendei este obligatorie sub tabel

10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)

Icircn cazul prezentărilor orale sau a posterelor este indicat ca

1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării

2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte

3 Folosirea de simboluri este permisă

Clasificarea tabelelor

Tabelele se clasifică după

i) conţinut

bull cu distribuţii de frecvenţe

bull de clase de frecvenţe

bull de contingenţă

ii) structura

bull cu doua coloane

bull cu subclasificări

bull ldquomasterrdquo

Tabele ce conţin distribuţii de frecvenţe

O modalitate comodă de a prezenta o mulţime de date brute este

1 Se ordonează datele in ordine crescătoare

2 Se determine frecvenţa fiecărei valori

3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane

(Tabelul 5)

Tabelul 5 Distribuţii de frecvenţă absolută

48

Tabelul claselor de frecvenţe

1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă

2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)

Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)

Tabele de contingenţă

1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a

tabelelor de contingenţă

2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a

combinaţiilor de perechi ordonate de valori

3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre

a factor de risc si

b starea sănătăţii

4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)

5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)

Tabelul 7 Tabel de contingenţă 2 x 2

49

Grafice

Există două categorii de moduri grafice sub care se pot prezenta datele

1 Ilustraţii şi fotografii

2 Grafice

1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă

pentru lucrare

2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit

Putem vorbi despre mai multe tipuri de grafice

bull Grafice pentru reprezentarea datelor cantitative

1048707 Grafic cartezian (X Y)

1048707 Histograma

1048707 Poligonul de frecvenţe

1048707 Diagrama bdquoscatterrdquo

bull Grafice pentru reprezentarea datelor calitative

1048707 Grafic cu bare

1048707 Diagrama tip bdquoboxplotrdquo

1048707 Diagrama bdquopierdquo

1048707 Cartograma

Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi

dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)

Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)

Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie

Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)

Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)

50

Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir

de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele

două variabile studiate (Figura 6)

Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2

(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2

rămacircne aproximativ constantă)

Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea

comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea

comparativă a mai multor variabile

Figura 7 Grafic calitativ cu bare

51

Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo

Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două

posibilităţi reprezentate grafic este mai frecventă (Figura 8)

Figura 8 Reprezentare tip bdquopierdquo

Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli

sau a oricărui element comparativ Se foloseşte de epidemiologi

Rezultate

Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare

Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o

manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu

explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția

bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la

ilustraţii tabele grafice

Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi

nici rezultatele care invalidează eventual ipoteza

Discuţii

Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd

cultura ştiinţifică şi inteligenţa autorilor

Acest capitol răspunde la trei obiective

Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia

calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de

selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează

rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv

52

este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn

care a fost abordată problema fără a face o revistă a literaturii

Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea

rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul

Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor

afirmaţii nesusţinute de conţinutul lucrării

Concluzii

Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate

să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie

Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de

concluzii va scădea valoarea lucrării

Bibliografia (lista referinţelor citarea icircn text)

Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn

lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente

Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli

- să conţină cele mai importante şi recente lucrări

- să includă numai lucrări publicate

- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate

Bibliografie

Elisabeta Jaba ndash Statistică Ed Economică 1998

Mihai Ţarcă ndash Statistică volI Ed UAIC 1979

Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale

Ed University Press 2009

Sorana Daniela Bolboacă ndash Metodologia cercetării curs

53

Page 31: cercetarea medicala - metodologie

Testul Z de comparare a mediei unui eşantion cu media unei populaţii

Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ

extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie

s2 care se cunoaşte

Condiţii de aplicare

1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru

compararea mediei unui eşantion cu media unei populaţii)

2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal

distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă

3 Talia eşantionului este mare ( ge 30)

Ipoteze

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media

eşantionului şi media populaţiei

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

(-yen -196 ] Egrave [196 yen)

Parametrul testului

n = volumul eşantionului

= media eşantionului

s = deviaţia standard a populaţiei

Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)

Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard

cunoscută

Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard

Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi

media standard

Condiţii de aplicare

Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se

realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această

condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea

31

Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai

puternic

Numărul de grade de libertate (df) df = n-1

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

Parametrul testului

n = volumul eşantionului

micro0 = media standard

= media eşantionului

s = deviaţia standard a eşantionului

Testul ANOVA compararea mediilor a mai multe eşantioane

H0 = toate mediile sunt egale

H1 = nu toate mediile sunt egale

Condiţii de aplicare

1 Datele sunt independente unele faţă de celelalte

2 Datele fiecărui grup sunt normal distribuite

3 Deviaţia standard este aceeaşi pentru toate grupurile

Id Medicament

A B C D E F

1 5 6 7 10 5 9

2 6 8 8 11 8 8

3 7 7 9 13 6 7

4 8 9 11 12 4 5

32

5 9 10 10 9 7 6

Suma 35 40 45 55 30 35

Media 7 8 9 11 6 7

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =

= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)

Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2

F = (suma pătratelor(icircntre))(suma pătratelor(icircn))

Suma pătratelor (icircntre) = 16times5 = 80

Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60

Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn

interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare

SP df Media pătratelor F = MPicircntreMPicircn

Icircntre 80 5 = 805 = 16 = 1625 = 64

Icircn 60 24 = 6024 = 25

Total 140 29 -

Testul sumei rangurilor Wilcoxon

Aplicat pentru

Un set de observaţii provenite dintr-o valoare ipotetică comună

Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)

Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero

Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace

Suma rangurilor pentru diferenţele negative = 2+3+1 = 6

Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30

33

Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului

egal cu 8 = 0109

Icircnainte După Diferenţa Rang

64 66 -2 2

66 58 8 5

67 68 -1 3

71 65 6 4

72 75 -3 1

76 67 9 6

78 59 19 8

89 74 15 7

Testul Kruskal-Wallis (ge 3 eşantioane independente)

Test de ranguri aplicate pe mai mult de 3 eşantioane

H = parametrul testului

n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)

Tk = suma rangurilor

Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie

pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni

34

df = k-1 (k = numărul de eşantioane)

df = 3-1 = 2

Hcritic(α=005) = 599

H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie

pozitivă şi respectiv biopsie negativă

Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie

a tipului de studiu pe eşantioane perechi)

1 Definirea numărului de tratamente k

2 Obţinerea rangurilor pentru fiecare tratament

3 Sumarea rangurilor fiecărui tratament

4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)

5 Dacă Fr gt Frcritic rarr respingem H0

Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost

măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi

n = 9 k = 3 T12 = 225 T2

2 = 38025 T32 = 38025

Frcritic = 599

Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de

prostată

35

De reţinut

Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei

Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-

of-Fit

Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z

Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t

Compararea mediilor a 3 sau mai multe eşantioane ANOVA

Compararea mediilor a două populaţii (σ) testul Z

Compararea mediilor a două eşantioane (s) testul t

Compararea mediilor a două eşantioane perechi (s) testul t

ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi

cu cel pentru compararea a două eşantioane perechi

Ranguri

Distribuţia datelor nu are importanţă

Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)

Trei sau mai multe eşantioane Kruskal-Wallis

Trei sau mai multe eşantioane perechi Friedman

Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia

Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a

datelor)

Variabile nominale

Un singur eşantion sau eşantioane perechi

Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte

Eşantioane perechi testul Mc Nemar

Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2

Icircn analiza proporţiilor există teste diferite pentru

Compararea unei frecvenţe cu o frecvenţă cunoscută

Compararea a două frecvenţe

Semnificaţia statistică

Valoarea p (p value)

Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor

două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E

posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării

aleatorii

36

Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală

urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii

Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este

probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un

experiment de dimensiunea acestuia

Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că

diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii

diferite

Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca

fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă

ar fi fost adevărată

Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă

1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe

baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De

fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001

2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie

3 Se aplică testul statistic aferent pentru a calcula valoarea p

4 Se compară valoarea p cu valoarea ndash prag

5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe

semnificativă dpdv statisticrdquo

6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e

semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să

conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă

Teste de semnificaţie

Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului

populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)

Testarea ipotezelor implică posibile erori

Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile

sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui

grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul

icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005

ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există

37

nici o diferenţă

Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ

statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de

ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost

ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau

dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă

cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă

semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe

ipotetice variate icircn cazul icircn care ele există

Măsuri ale frecvenţei

Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)

Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate

Generic formula pe care se bazează toate cele trei este

unde x şi y sunt cantităţile de comparat

Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea

unei frecvenţe pe grupe de sex vacircrstă etc

Proporţia implică icircn mod necesar ca x să fie inclus icircn y

Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară

frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp

Pentru calcularea unei rate trebuie ţinut cont de trei aspecte

bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin

bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp

bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo

Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un

tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei

populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei

aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)

38

Indicatori

Rata de incidenţă

Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă

icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii

Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o

perioadă de timp

Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de

timp x

Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei

susceptibili de a dezvolta icircmbolnăvirea studiată

Numitorul poate fi

bull Numărul mediu al populaţiei icircn perioada de timp studiată

bull Mărimea populaţiei icircn mijlocul perioadei de studiu

bull Mărimea populaţiei la icircnceputul studiului

Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă

Este obligatorie menţionarea perioadei de timp

Prevalenţa

Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la

un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă

schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa

momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)

39

Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include

numai cazuri noi respectiv include cazuri noi şi vechi

Rata de atac

Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este

folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp

raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori

Rata persoană-timp

Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din

momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte

migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost

observate

Riscul relativ (RR)

Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment

legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele

prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două

grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la

bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la

bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai

mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo

Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2

Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn

cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă

(Tabelul 1)

Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR

Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la

neexpuşi

40

Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de

culegere a datelor

Odds ratio (OR)

Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin

raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general

studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)

Tabelul 2 Tabelul 2 x 2 pentru calcularea OR

Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală

Rate de mortalitate

Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp

specificată Există mai multe tipuri de rate de mortalitate

o Mortalitate specifică pe sex

o Mortalitate specifică pe rasă

o Mortalitate specifică pe boală

o Mortalitate neonatală

o Mortalitate postneonatală

o Mortalitate infantilă

o Mortalitate maternă

Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP

41

Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de

viaţă şi vacircrsta la care survine decesul dacă este prematur

Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu

Ani de viaţă pierduţi datorat dizabilităţii

Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt

utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru

cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite

grupuri

Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de

risc şi o boală se folosesc riscul relativ şi odds ratio

35 Analiza şi interpretarea datelor

După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date

trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul

Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor

colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului

studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu

plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde

prezenţa biostatisticianului este necesară

Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu

elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat

iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului

iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate

depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori

testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere

clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza

Interpretarea rezultatelor statistice

Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne

motive (număr mic de date) acceptarea ei să fie falsă

Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine

gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia

ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument

de decizie Intervalul de confidenţă

42

Interpretarea statistica ne interpretarea clinică

Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă

Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice

obţinute pe eşantionul studiat

Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare

Ce interpretăm Rezultatele

personale obţinute icircn urma studiului

care au fost prezentate icircn secţiunea bdquoRezultaterdquo

Explicăm rezultatele obţinute

Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale

Interpretarea trebuie să se realizeze icircn

lumina limitelor studiului

contextul cultural social şi educaţional al locului unde s-a realizat cercetarea

contextul a ceea ce se cunoaşte din literatura de specialitate

Interpretăm doar rezultatele personale obţinute icircn urma studiului

Interpretarea statistică nu este tot una cu interpretarea clinică

Interpretarea statistică este importantă

Interpretarea clinică este foarte importantă

Intervalul de confidenţă

Media calculată pe baza unui eşantion nu va echivala media populaţiei

Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului

Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a

populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a

populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)

pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru

orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare

dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de

confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de

date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de

5

Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel

Dacă valoarea p este mică

Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare

aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o

medie diferită Diferenţa este semnificativă dpdv statistic

43

Icircn continuare

Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa

reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică

pentru a fi interesante din punct de vedere ştiinţific

Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC

oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care

este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a

obţine o concluzie clară

Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o

diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că

datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din

punct de vedere ştiinţific

Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul

detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat

Erorile studiilor medicale

Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura

anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară

caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea

asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri

legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias

Erorile potenţiale icircn studiile epidemiologice

1 Erori icircntacircmplătoare

2 Erori sistematice

3 Confuzia

4 Validitatea

1 Erori icircntacircmplătoare

Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a

parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel

de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot

fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii

(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor

de măsură (eroarea de măsurare)

44

2 Erori sistematice

Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate

care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu

acurateţe mare Acurateţea nu este afectată de mărimea eşantionului

Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de

experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea

dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus

şi greu de cuantificat (consum de alcool personalitate etc)

Principalele tipuri de erori din această categorie sunt

bull Biasul de selecţie

bull Biasul de informaţie

Biasul de selecţie

Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul

trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion

inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale

persoanelor incluse

Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se

ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia

Biasul de informaţie

Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de

instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze

expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere

nesemnificativă sau chiar să nu şi-o amintească de loc

3 Confuzia

Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune

prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este

cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă

de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte

important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor

protector

4 Validitatea

Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă

Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte

estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional

Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă

45

conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se

demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)

Validitatea externă se poate realiza numai dacă studiul este valid intern

Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii

studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de

studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt

laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi

validă din punct de vedere intern)

3 6 Prezentarea rezultatelor

După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite

Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor

icircntr-o formă bdquodigerabilărdquo este necesară

Scopul prezentării datelor

1 Transmiterea concluziilor studiului

a Datele corecte şi importante merită comunicate

b Datele trebuie să confirme sau să infirme ipoteza studiului

c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală

2 Acordarea posibilităţii altor cercetători să aprecieze studiul

a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti

b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor

prezentate

Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru

fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie

statistică

Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de

valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras

(Tabel 3)

Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)

46

Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct

numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor

precum şi prezentarea acestora sub formă inteligibilă

Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care

convin cercetătorului

Prezentarea datelor se poate face

1 Figuri şi tabele icircn articole scrise

2 Figuri şi tabele icircn prezentări orale

3 Figuri şi tabele icircn postere

4 Text scris sau incluse icircn text

5 Site-uri de WEB

Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor

Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie

Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele

exprimacircnd exact ceea ce acestea exprimă

Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate

anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel

să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se

acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca

mai sus sugestive sunt formatele simple şi puţin icircncărcate

Dacă nu există reguli impuse se respectă

1 Mesaj simplu fără falsificarea datelor

2 De obicei este necesar atacirct tabelul cacirct şi graficul

3 Să fie simplu şi clar

Tabele

Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile

coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică

elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de

1 Se folosesc doar linii orizontale

2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn

evidenţi prin linie de separare (Tabelul 4)

Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland

Noua Zeelandă)

(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)

47

3 Numerele sunt aliniate icircn funcţie de virgulă

4 Indicii statistici sunt explicaţi sub tabel

5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană

6 Abrevierile pot fi folosite

7 Numărul de zecimale trebuie limitat la maxim două

8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel

9 Plasarea legendei este obligatorie sub tabel

10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)

Icircn cazul prezentărilor orale sau a posterelor este indicat ca

1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării

2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte

3 Folosirea de simboluri este permisă

Clasificarea tabelelor

Tabelele se clasifică după

i) conţinut

bull cu distribuţii de frecvenţe

bull de clase de frecvenţe

bull de contingenţă

ii) structura

bull cu doua coloane

bull cu subclasificări

bull ldquomasterrdquo

Tabele ce conţin distribuţii de frecvenţe

O modalitate comodă de a prezenta o mulţime de date brute este

1 Se ordonează datele in ordine crescătoare

2 Se determine frecvenţa fiecărei valori

3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane

(Tabelul 5)

Tabelul 5 Distribuţii de frecvenţă absolută

48

Tabelul claselor de frecvenţe

1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă

2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)

Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)

Tabele de contingenţă

1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a

tabelelor de contingenţă

2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a

combinaţiilor de perechi ordonate de valori

3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre

a factor de risc si

b starea sănătăţii

4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)

5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)

Tabelul 7 Tabel de contingenţă 2 x 2

49

Grafice

Există două categorii de moduri grafice sub care se pot prezenta datele

1 Ilustraţii şi fotografii

2 Grafice

1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă

pentru lucrare

2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit

Putem vorbi despre mai multe tipuri de grafice

bull Grafice pentru reprezentarea datelor cantitative

1048707 Grafic cartezian (X Y)

1048707 Histograma

1048707 Poligonul de frecvenţe

1048707 Diagrama bdquoscatterrdquo

bull Grafice pentru reprezentarea datelor calitative

1048707 Grafic cu bare

1048707 Diagrama tip bdquoboxplotrdquo

1048707 Diagrama bdquopierdquo

1048707 Cartograma

Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi

dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)

Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)

Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie

Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)

Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)

50

Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir

de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele

două variabile studiate (Figura 6)

Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2

(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2

rămacircne aproximativ constantă)

Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea

comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea

comparativă a mai multor variabile

Figura 7 Grafic calitativ cu bare

51

Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo

Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două

posibilităţi reprezentate grafic este mai frecventă (Figura 8)

Figura 8 Reprezentare tip bdquopierdquo

Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli

sau a oricărui element comparativ Se foloseşte de epidemiologi

Rezultate

Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare

Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o

manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu

explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția

bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la

ilustraţii tabele grafice

Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi

nici rezultatele care invalidează eventual ipoteza

Discuţii

Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd

cultura ştiinţifică şi inteligenţa autorilor

Acest capitol răspunde la trei obiective

Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia

calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de

selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează

rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv

52

este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn

care a fost abordată problema fără a face o revistă a literaturii

Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea

rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul

Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor

afirmaţii nesusţinute de conţinutul lucrării

Concluzii

Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate

să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie

Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de

concluzii va scădea valoarea lucrării

Bibliografia (lista referinţelor citarea icircn text)

Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn

lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente

Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli

- să conţină cele mai importante şi recente lucrări

- să includă numai lucrări publicate

- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate

Bibliografie

Elisabeta Jaba ndash Statistică Ed Economică 1998

Mihai Ţarcă ndash Statistică volI Ed UAIC 1979

Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale

Ed University Press 2009

Sorana Daniela Bolboacă ndash Metodologia cercetării curs

53

Page 32: cercetarea medicala - metodologie

Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai

puternic

Numărul de grade de libertate (df) df = n-1

Pragul de semnificaţie a = 005

Regiunea critică pentru testul bilateral este

Parametrul testului

n = volumul eşantionului

micro0 = media standard

= media eşantionului

s = deviaţia standard a eşantionului

Testul ANOVA compararea mediilor a mai multe eşantioane

H0 = toate mediile sunt egale

H1 = nu toate mediile sunt egale

Condiţii de aplicare

1 Datele sunt independente unele faţă de celelalte

2 Datele fiecărui grup sunt normal distribuite

3 Deviaţia standard este aceeaşi pentru toate grupurile

Id Medicament

A B C D E F

1 5 6 7 10 5 9

2 6 8 8 11 8 8

3 7 7 9 13 6 7

4 8 9 11 12 4 5

32

5 9 10 10 9 7 6

Suma 35 40 45 55 30 35

Media 7 8 9 11 6 7

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =

= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)

Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2

F = (suma pătratelor(icircntre))(suma pătratelor(icircn))

Suma pătratelor (icircntre) = 16times5 = 80

Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60

Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn

interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare

SP df Media pătratelor F = MPicircntreMPicircn

Icircntre 80 5 = 805 = 16 = 1625 = 64

Icircn 60 24 = 6024 = 25

Total 140 29 -

Testul sumei rangurilor Wilcoxon

Aplicat pentru

Un set de observaţii provenite dintr-o valoare ipotetică comună

Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)

Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero

Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace

Suma rangurilor pentru diferenţele negative = 2+3+1 = 6

Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30

33

Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului

egal cu 8 = 0109

Icircnainte După Diferenţa Rang

64 66 -2 2

66 58 8 5

67 68 -1 3

71 65 6 4

72 75 -3 1

76 67 9 6

78 59 19 8

89 74 15 7

Testul Kruskal-Wallis (ge 3 eşantioane independente)

Test de ranguri aplicate pe mai mult de 3 eşantioane

H = parametrul testului

n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)

Tk = suma rangurilor

Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie

pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni

34

df = k-1 (k = numărul de eşantioane)

df = 3-1 = 2

Hcritic(α=005) = 599

H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie

pozitivă şi respectiv biopsie negativă

Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie

a tipului de studiu pe eşantioane perechi)

1 Definirea numărului de tratamente k

2 Obţinerea rangurilor pentru fiecare tratament

3 Sumarea rangurilor fiecărui tratament

4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)

5 Dacă Fr gt Frcritic rarr respingem H0

Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost

măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi

n = 9 k = 3 T12 = 225 T2

2 = 38025 T32 = 38025

Frcritic = 599

Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de

prostată

35

De reţinut

Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei

Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-

of-Fit

Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z

Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t

Compararea mediilor a 3 sau mai multe eşantioane ANOVA

Compararea mediilor a două populaţii (σ) testul Z

Compararea mediilor a două eşantioane (s) testul t

Compararea mediilor a două eşantioane perechi (s) testul t

ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi

cu cel pentru compararea a două eşantioane perechi

Ranguri

Distribuţia datelor nu are importanţă

Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)

Trei sau mai multe eşantioane Kruskal-Wallis

Trei sau mai multe eşantioane perechi Friedman

Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia

Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a

datelor)

Variabile nominale

Un singur eşantion sau eşantioane perechi

Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte

Eşantioane perechi testul Mc Nemar

Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2

Icircn analiza proporţiilor există teste diferite pentru

Compararea unei frecvenţe cu o frecvenţă cunoscută

Compararea a două frecvenţe

Semnificaţia statistică

Valoarea p (p value)

Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor

două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E

posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării

aleatorii

36

Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală

urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii

Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este

probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un

experiment de dimensiunea acestuia

Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că

diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii

diferite

Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca

fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă

ar fi fost adevărată

Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă

1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe

baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De

fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001

2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie

3 Se aplică testul statistic aferent pentru a calcula valoarea p

4 Se compară valoarea p cu valoarea ndash prag

5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe

semnificativă dpdv statisticrdquo

6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e

semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să

conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă

Teste de semnificaţie

Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului

populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)

Testarea ipotezelor implică posibile erori

Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile

sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui

grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul

icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005

ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există

37

nici o diferenţă

Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ

statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de

ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost

ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau

dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă

cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă

semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe

ipotetice variate icircn cazul icircn care ele există

Măsuri ale frecvenţei

Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)

Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate

Generic formula pe care se bazează toate cele trei este

unde x şi y sunt cantităţile de comparat

Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea

unei frecvenţe pe grupe de sex vacircrstă etc

Proporţia implică icircn mod necesar ca x să fie inclus icircn y

Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară

frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp

Pentru calcularea unei rate trebuie ţinut cont de trei aspecte

bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin

bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp

bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo

Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un

tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei

populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei

aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)

38

Indicatori

Rata de incidenţă

Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă

icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii

Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o

perioadă de timp

Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de

timp x

Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei

susceptibili de a dezvolta icircmbolnăvirea studiată

Numitorul poate fi

bull Numărul mediu al populaţiei icircn perioada de timp studiată

bull Mărimea populaţiei icircn mijlocul perioadei de studiu

bull Mărimea populaţiei la icircnceputul studiului

Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă

Este obligatorie menţionarea perioadei de timp

Prevalenţa

Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la

un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă

schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa

momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)

39

Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include

numai cazuri noi respectiv include cazuri noi şi vechi

Rata de atac

Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este

folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp

raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori

Rata persoană-timp

Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din

momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte

migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost

observate

Riscul relativ (RR)

Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment

legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele

prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două

grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la

bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la

bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai

mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo

Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2

Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn

cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă

(Tabelul 1)

Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR

Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la

neexpuşi

40

Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de

culegere a datelor

Odds ratio (OR)

Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin

raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general

studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)

Tabelul 2 Tabelul 2 x 2 pentru calcularea OR

Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală

Rate de mortalitate

Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp

specificată Există mai multe tipuri de rate de mortalitate

o Mortalitate specifică pe sex

o Mortalitate specifică pe rasă

o Mortalitate specifică pe boală

o Mortalitate neonatală

o Mortalitate postneonatală

o Mortalitate infantilă

o Mortalitate maternă

Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP

41

Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de

viaţă şi vacircrsta la care survine decesul dacă este prematur

Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu

Ani de viaţă pierduţi datorat dizabilităţii

Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt

utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru

cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite

grupuri

Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de

risc şi o boală se folosesc riscul relativ şi odds ratio

35 Analiza şi interpretarea datelor

După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date

trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul

Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor

colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului

studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu

plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde

prezenţa biostatisticianului este necesară

Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu

elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat

iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului

iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate

depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori

testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere

clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza

Interpretarea rezultatelor statistice

Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne

motive (număr mic de date) acceptarea ei să fie falsă

Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine

gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia

ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument

de decizie Intervalul de confidenţă

42

Interpretarea statistica ne interpretarea clinică

Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă

Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice

obţinute pe eşantionul studiat

Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare

Ce interpretăm Rezultatele

personale obţinute icircn urma studiului

care au fost prezentate icircn secţiunea bdquoRezultaterdquo

Explicăm rezultatele obţinute

Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale

Interpretarea trebuie să se realizeze icircn

lumina limitelor studiului

contextul cultural social şi educaţional al locului unde s-a realizat cercetarea

contextul a ceea ce se cunoaşte din literatura de specialitate

Interpretăm doar rezultatele personale obţinute icircn urma studiului

Interpretarea statistică nu este tot una cu interpretarea clinică

Interpretarea statistică este importantă

Interpretarea clinică este foarte importantă

Intervalul de confidenţă

Media calculată pe baza unui eşantion nu va echivala media populaţiei

Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului

Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a

populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a

populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)

pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru

orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare

dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de

confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de

date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de

5

Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel

Dacă valoarea p este mică

Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare

aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o

medie diferită Diferenţa este semnificativă dpdv statistic

43

Icircn continuare

Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa

reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică

pentru a fi interesante din punct de vedere ştiinţific

Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC

oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care

este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a

obţine o concluzie clară

Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o

diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că

datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din

punct de vedere ştiinţific

Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul

detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat

Erorile studiilor medicale

Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura

anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară

caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea

asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri

legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias

Erorile potenţiale icircn studiile epidemiologice

1 Erori icircntacircmplătoare

2 Erori sistematice

3 Confuzia

4 Validitatea

1 Erori icircntacircmplătoare

Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a

parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel

de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot

fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii

(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor

de măsură (eroarea de măsurare)

44

2 Erori sistematice

Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate

care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu

acurateţe mare Acurateţea nu este afectată de mărimea eşantionului

Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de

experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea

dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus

şi greu de cuantificat (consum de alcool personalitate etc)

Principalele tipuri de erori din această categorie sunt

bull Biasul de selecţie

bull Biasul de informaţie

Biasul de selecţie

Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul

trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion

inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale

persoanelor incluse

Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se

ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia

Biasul de informaţie

Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de

instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze

expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere

nesemnificativă sau chiar să nu şi-o amintească de loc

3 Confuzia

Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune

prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este

cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă

de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte

important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor

protector

4 Validitatea

Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă

Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte

estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional

Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă

45

conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se

demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)

Validitatea externă se poate realiza numai dacă studiul este valid intern

Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii

studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de

studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt

laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi

validă din punct de vedere intern)

3 6 Prezentarea rezultatelor

După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite

Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor

icircntr-o formă bdquodigerabilărdquo este necesară

Scopul prezentării datelor

1 Transmiterea concluziilor studiului

a Datele corecte şi importante merită comunicate

b Datele trebuie să confirme sau să infirme ipoteza studiului

c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală

2 Acordarea posibilităţii altor cercetători să aprecieze studiul

a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti

b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor

prezentate

Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru

fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie

statistică

Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de

valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras

(Tabel 3)

Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)

46

Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct

numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor

precum şi prezentarea acestora sub formă inteligibilă

Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care

convin cercetătorului

Prezentarea datelor se poate face

1 Figuri şi tabele icircn articole scrise

2 Figuri şi tabele icircn prezentări orale

3 Figuri şi tabele icircn postere

4 Text scris sau incluse icircn text

5 Site-uri de WEB

Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor

Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie

Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele

exprimacircnd exact ceea ce acestea exprimă

Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate

anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel

să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se

acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca

mai sus sugestive sunt formatele simple şi puţin icircncărcate

Dacă nu există reguli impuse se respectă

1 Mesaj simplu fără falsificarea datelor

2 De obicei este necesar atacirct tabelul cacirct şi graficul

3 Să fie simplu şi clar

Tabele

Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile

coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică

elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de

1 Se folosesc doar linii orizontale

2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn

evidenţi prin linie de separare (Tabelul 4)

Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland

Noua Zeelandă)

(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)

47

3 Numerele sunt aliniate icircn funcţie de virgulă

4 Indicii statistici sunt explicaţi sub tabel

5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană

6 Abrevierile pot fi folosite

7 Numărul de zecimale trebuie limitat la maxim două

8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel

9 Plasarea legendei este obligatorie sub tabel

10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)

Icircn cazul prezentărilor orale sau a posterelor este indicat ca

1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării

2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte

3 Folosirea de simboluri este permisă

Clasificarea tabelelor

Tabelele se clasifică după

i) conţinut

bull cu distribuţii de frecvenţe

bull de clase de frecvenţe

bull de contingenţă

ii) structura

bull cu doua coloane

bull cu subclasificări

bull ldquomasterrdquo

Tabele ce conţin distribuţii de frecvenţe

O modalitate comodă de a prezenta o mulţime de date brute este

1 Se ordonează datele in ordine crescătoare

2 Se determine frecvenţa fiecărei valori

3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane

(Tabelul 5)

Tabelul 5 Distribuţii de frecvenţă absolută

48

Tabelul claselor de frecvenţe

1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă

2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)

Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)

Tabele de contingenţă

1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a

tabelelor de contingenţă

2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a

combinaţiilor de perechi ordonate de valori

3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre

a factor de risc si

b starea sănătăţii

4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)

5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)

Tabelul 7 Tabel de contingenţă 2 x 2

49

Grafice

Există două categorii de moduri grafice sub care se pot prezenta datele

1 Ilustraţii şi fotografii

2 Grafice

1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă

pentru lucrare

2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit

Putem vorbi despre mai multe tipuri de grafice

bull Grafice pentru reprezentarea datelor cantitative

1048707 Grafic cartezian (X Y)

1048707 Histograma

1048707 Poligonul de frecvenţe

1048707 Diagrama bdquoscatterrdquo

bull Grafice pentru reprezentarea datelor calitative

1048707 Grafic cu bare

1048707 Diagrama tip bdquoboxplotrdquo

1048707 Diagrama bdquopierdquo

1048707 Cartograma

Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi

dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)

Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)

Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie

Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)

Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)

50

Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir

de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele

două variabile studiate (Figura 6)

Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2

(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2

rămacircne aproximativ constantă)

Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea

comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea

comparativă a mai multor variabile

Figura 7 Grafic calitativ cu bare

51

Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo

Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două

posibilităţi reprezentate grafic este mai frecventă (Figura 8)

Figura 8 Reprezentare tip bdquopierdquo

Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli

sau a oricărui element comparativ Se foloseşte de epidemiologi

Rezultate

Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare

Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o

manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu

explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția

bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la

ilustraţii tabele grafice

Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi

nici rezultatele care invalidează eventual ipoteza

Discuţii

Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd

cultura ştiinţifică şi inteligenţa autorilor

Acest capitol răspunde la trei obiective

Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia

calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de

selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează

rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv

52

este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn

care a fost abordată problema fără a face o revistă a literaturii

Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea

rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul

Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor

afirmaţii nesusţinute de conţinutul lucrării

Concluzii

Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate

să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie

Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de

concluzii va scădea valoarea lucrării

Bibliografia (lista referinţelor citarea icircn text)

Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn

lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente

Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli

- să conţină cele mai importante şi recente lucrări

- să includă numai lucrări publicate

- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate

Bibliografie

Elisabeta Jaba ndash Statistică Ed Economică 1998

Mihai Ţarcă ndash Statistică volI Ed UAIC 1979

Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale

Ed University Press 2009

Sorana Daniela Bolboacă ndash Metodologia cercetării curs

53

Page 33: cercetarea medicala - metodologie

5 9 10 10 9 7 6

Suma 35 40 45 55 30 35

Media 7 8 9 11 6 7

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

m=(7+8+9+11+6+7)6

m=8

(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =

= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16

Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)

Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2

F = (suma pătratelor(icircntre))(suma pătratelor(icircn))

Suma pătratelor (icircntre) = 16times5 = 80

Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60

Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn

interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare

SP df Media pătratelor F = MPicircntreMPicircn

Icircntre 80 5 = 805 = 16 = 1625 = 64

Icircn 60 24 = 6024 = 25

Total 140 29 -

Testul sumei rangurilor Wilcoxon

Aplicat pentru

Un set de observaţii provenite dintr-o valoare ipotetică comună

Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)

Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero

Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace

Suma rangurilor pentru diferenţele negative = 2+3+1 = 6

Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30

33

Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului

egal cu 8 = 0109

Icircnainte După Diferenţa Rang

64 66 -2 2

66 58 8 5

67 68 -1 3

71 65 6 4

72 75 -3 1

76 67 9 6

78 59 19 8

89 74 15 7

Testul Kruskal-Wallis (ge 3 eşantioane independente)

Test de ranguri aplicate pe mai mult de 3 eşantioane

H = parametrul testului

n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)

Tk = suma rangurilor

Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie

pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni

34

df = k-1 (k = numărul de eşantioane)

df = 3-1 = 2

Hcritic(α=005) = 599

H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie

pozitivă şi respectiv biopsie negativă

Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie

a tipului de studiu pe eşantioane perechi)

1 Definirea numărului de tratamente k

2 Obţinerea rangurilor pentru fiecare tratament

3 Sumarea rangurilor fiecărui tratament

4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)

5 Dacă Fr gt Frcritic rarr respingem H0

Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost

măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi

n = 9 k = 3 T12 = 225 T2

2 = 38025 T32 = 38025

Frcritic = 599

Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de

prostată

35

De reţinut

Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei

Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-

of-Fit

Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z

Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t

Compararea mediilor a 3 sau mai multe eşantioane ANOVA

Compararea mediilor a două populaţii (σ) testul Z

Compararea mediilor a două eşantioane (s) testul t

Compararea mediilor a două eşantioane perechi (s) testul t

ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi

cu cel pentru compararea a două eşantioane perechi

Ranguri

Distribuţia datelor nu are importanţă

Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)

Trei sau mai multe eşantioane Kruskal-Wallis

Trei sau mai multe eşantioane perechi Friedman

Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia

Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a

datelor)

Variabile nominale

Un singur eşantion sau eşantioane perechi

Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte

Eşantioane perechi testul Mc Nemar

Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2

Icircn analiza proporţiilor există teste diferite pentru

Compararea unei frecvenţe cu o frecvenţă cunoscută

Compararea a două frecvenţe

Semnificaţia statistică

Valoarea p (p value)

Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor

două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E

posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării

aleatorii

36

Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală

urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii

Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este

probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un

experiment de dimensiunea acestuia

Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că

diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii

diferite

Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca

fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă

ar fi fost adevărată

Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă

1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe

baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De

fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001

2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie

3 Se aplică testul statistic aferent pentru a calcula valoarea p

4 Se compară valoarea p cu valoarea ndash prag

5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe

semnificativă dpdv statisticrdquo

6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e

semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să

conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă

Teste de semnificaţie

Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului

populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)

Testarea ipotezelor implică posibile erori

Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile

sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui

grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul

icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005

ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există

37

nici o diferenţă

Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ

statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de

ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost

ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau

dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă

cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă

semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe

ipotetice variate icircn cazul icircn care ele există

Măsuri ale frecvenţei

Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)

Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate

Generic formula pe care se bazează toate cele trei este

unde x şi y sunt cantităţile de comparat

Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea

unei frecvenţe pe grupe de sex vacircrstă etc

Proporţia implică icircn mod necesar ca x să fie inclus icircn y

Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară

frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp

Pentru calcularea unei rate trebuie ţinut cont de trei aspecte

bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin

bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp

bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo

Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un

tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei

populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei

aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)

38

Indicatori

Rata de incidenţă

Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă

icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii

Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o

perioadă de timp

Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de

timp x

Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei

susceptibili de a dezvolta icircmbolnăvirea studiată

Numitorul poate fi

bull Numărul mediu al populaţiei icircn perioada de timp studiată

bull Mărimea populaţiei icircn mijlocul perioadei de studiu

bull Mărimea populaţiei la icircnceputul studiului

Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă

Este obligatorie menţionarea perioadei de timp

Prevalenţa

Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la

un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă

schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa

momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)

39

Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include

numai cazuri noi respectiv include cazuri noi şi vechi

Rata de atac

Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este

folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp

raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori

Rata persoană-timp

Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din

momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte

migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost

observate

Riscul relativ (RR)

Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment

legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele

prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două

grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la

bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la

bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai

mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo

Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2

Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn

cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă

(Tabelul 1)

Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR

Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la

neexpuşi

40

Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de

culegere a datelor

Odds ratio (OR)

Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin

raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general

studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)

Tabelul 2 Tabelul 2 x 2 pentru calcularea OR

Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală

Rate de mortalitate

Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp

specificată Există mai multe tipuri de rate de mortalitate

o Mortalitate specifică pe sex

o Mortalitate specifică pe rasă

o Mortalitate specifică pe boală

o Mortalitate neonatală

o Mortalitate postneonatală

o Mortalitate infantilă

o Mortalitate maternă

Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP

41

Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de

viaţă şi vacircrsta la care survine decesul dacă este prematur

Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu

Ani de viaţă pierduţi datorat dizabilităţii

Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt

utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru

cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite

grupuri

Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de

risc şi o boală se folosesc riscul relativ şi odds ratio

35 Analiza şi interpretarea datelor

După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date

trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul

Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor

colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului

studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu

plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde

prezenţa biostatisticianului este necesară

Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu

elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat

iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului

iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate

depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori

testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere

clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza

Interpretarea rezultatelor statistice

Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne

motive (număr mic de date) acceptarea ei să fie falsă

Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine

gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia

ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument

de decizie Intervalul de confidenţă

42

Interpretarea statistica ne interpretarea clinică

Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă

Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice

obţinute pe eşantionul studiat

Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare

Ce interpretăm Rezultatele

personale obţinute icircn urma studiului

care au fost prezentate icircn secţiunea bdquoRezultaterdquo

Explicăm rezultatele obţinute

Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale

Interpretarea trebuie să se realizeze icircn

lumina limitelor studiului

contextul cultural social şi educaţional al locului unde s-a realizat cercetarea

contextul a ceea ce se cunoaşte din literatura de specialitate

Interpretăm doar rezultatele personale obţinute icircn urma studiului

Interpretarea statistică nu este tot una cu interpretarea clinică

Interpretarea statistică este importantă

Interpretarea clinică este foarte importantă

Intervalul de confidenţă

Media calculată pe baza unui eşantion nu va echivala media populaţiei

Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului

Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a

populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a

populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)

pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru

orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare

dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de

confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de

date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de

5

Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel

Dacă valoarea p este mică

Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare

aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o

medie diferită Diferenţa este semnificativă dpdv statistic

43

Icircn continuare

Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa

reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică

pentru a fi interesante din punct de vedere ştiinţific

Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC

oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care

este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a

obţine o concluzie clară

Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o

diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că

datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din

punct de vedere ştiinţific

Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul

detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat

Erorile studiilor medicale

Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura

anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară

caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea

asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri

legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias

Erorile potenţiale icircn studiile epidemiologice

1 Erori icircntacircmplătoare

2 Erori sistematice

3 Confuzia

4 Validitatea

1 Erori icircntacircmplătoare

Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a

parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel

de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot

fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii

(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor

de măsură (eroarea de măsurare)

44

2 Erori sistematice

Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate

care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu

acurateţe mare Acurateţea nu este afectată de mărimea eşantionului

Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de

experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea

dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus

şi greu de cuantificat (consum de alcool personalitate etc)

Principalele tipuri de erori din această categorie sunt

bull Biasul de selecţie

bull Biasul de informaţie

Biasul de selecţie

Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul

trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion

inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale

persoanelor incluse

Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se

ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia

Biasul de informaţie

Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de

instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze

expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere

nesemnificativă sau chiar să nu şi-o amintească de loc

3 Confuzia

Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune

prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este

cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă

de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte

important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor

protector

4 Validitatea

Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă

Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte

estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional

Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă

45

conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se

demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)

Validitatea externă se poate realiza numai dacă studiul este valid intern

Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii

studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de

studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt

laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi

validă din punct de vedere intern)

3 6 Prezentarea rezultatelor

După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite

Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor

icircntr-o formă bdquodigerabilărdquo este necesară

Scopul prezentării datelor

1 Transmiterea concluziilor studiului

a Datele corecte şi importante merită comunicate

b Datele trebuie să confirme sau să infirme ipoteza studiului

c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală

2 Acordarea posibilităţii altor cercetători să aprecieze studiul

a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti

b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor

prezentate

Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru

fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie

statistică

Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de

valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras

(Tabel 3)

Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)

46

Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct

numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor

precum şi prezentarea acestora sub formă inteligibilă

Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care

convin cercetătorului

Prezentarea datelor se poate face

1 Figuri şi tabele icircn articole scrise

2 Figuri şi tabele icircn prezentări orale

3 Figuri şi tabele icircn postere

4 Text scris sau incluse icircn text

5 Site-uri de WEB

Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor

Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie

Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele

exprimacircnd exact ceea ce acestea exprimă

Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate

anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel

să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se

acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca

mai sus sugestive sunt formatele simple şi puţin icircncărcate

Dacă nu există reguli impuse se respectă

1 Mesaj simplu fără falsificarea datelor

2 De obicei este necesar atacirct tabelul cacirct şi graficul

3 Să fie simplu şi clar

Tabele

Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile

coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică

elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de

1 Se folosesc doar linii orizontale

2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn

evidenţi prin linie de separare (Tabelul 4)

Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland

Noua Zeelandă)

(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)

47

3 Numerele sunt aliniate icircn funcţie de virgulă

4 Indicii statistici sunt explicaţi sub tabel

5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană

6 Abrevierile pot fi folosite

7 Numărul de zecimale trebuie limitat la maxim două

8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel

9 Plasarea legendei este obligatorie sub tabel

10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)

Icircn cazul prezentărilor orale sau a posterelor este indicat ca

1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării

2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte

3 Folosirea de simboluri este permisă

Clasificarea tabelelor

Tabelele se clasifică după

i) conţinut

bull cu distribuţii de frecvenţe

bull de clase de frecvenţe

bull de contingenţă

ii) structura

bull cu doua coloane

bull cu subclasificări

bull ldquomasterrdquo

Tabele ce conţin distribuţii de frecvenţe

O modalitate comodă de a prezenta o mulţime de date brute este

1 Se ordonează datele in ordine crescătoare

2 Se determine frecvenţa fiecărei valori

3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane

(Tabelul 5)

Tabelul 5 Distribuţii de frecvenţă absolută

48

Tabelul claselor de frecvenţe

1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă

2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)

Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)

Tabele de contingenţă

1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a

tabelelor de contingenţă

2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a

combinaţiilor de perechi ordonate de valori

3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre

a factor de risc si

b starea sănătăţii

4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)

5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)

Tabelul 7 Tabel de contingenţă 2 x 2

49

Grafice

Există două categorii de moduri grafice sub care se pot prezenta datele

1 Ilustraţii şi fotografii

2 Grafice

1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă

pentru lucrare

2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit

Putem vorbi despre mai multe tipuri de grafice

bull Grafice pentru reprezentarea datelor cantitative

1048707 Grafic cartezian (X Y)

1048707 Histograma

1048707 Poligonul de frecvenţe

1048707 Diagrama bdquoscatterrdquo

bull Grafice pentru reprezentarea datelor calitative

1048707 Grafic cu bare

1048707 Diagrama tip bdquoboxplotrdquo

1048707 Diagrama bdquopierdquo

1048707 Cartograma

Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi

dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)

Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)

Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie

Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)

Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)

50

Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir

de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele

două variabile studiate (Figura 6)

Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2

(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2

rămacircne aproximativ constantă)

Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea

comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea

comparativă a mai multor variabile

Figura 7 Grafic calitativ cu bare

51

Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo

Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două

posibilităţi reprezentate grafic este mai frecventă (Figura 8)

Figura 8 Reprezentare tip bdquopierdquo

Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli

sau a oricărui element comparativ Se foloseşte de epidemiologi

Rezultate

Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare

Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o

manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu

explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția

bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la

ilustraţii tabele grafice

Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi

nici rezultatele care invalidează eventual ipoteza

Discuţii

Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd

cultura ştiinţifică şi inteligenţa autorilor

Acest capitol răspunde la trei obiective

Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia

calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de

selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează

rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv

52

este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn

care a fost abordată problema fără a face o revistă a literaturii

Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea

rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul

Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor

afirmaţii nesusţinute de conţinutul lucrării

Concluzii

Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate

să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie

Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de

concluzii va scădea valoarea lucrării

Bibliografia (lista referinţelor citarea icircn text)

Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn

lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente

Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli

- să conţină cele mai importante şi recente lucrări

- să includă numai lucrări publicate

- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate

Bibliografie

Elisabeta Jaba ndash Statistică Ed Economică 1998

Mihai Ţarcă ndash Statistică volI Ed UAIC 1979

Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale

Ed University Press 2009

Sorana Daniela Bolboacă ndash Metodologia cercetării curs

53

Page 34: cercetarea medicala - metodologie

Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului

egal cu 8 = 0109

Icircnainte După Diferenţa Rang

64 66 -2 2

66 58 8 5

67 68 -1 3

71 65 6 4

72 75 -3 1

76 67 9 6

78 59 19 8

89 74 15 7

Testul Kruskal-Wallis (ge 3 eşantioane independente)

Test de ranguri aplicate pe mai mult de 3 eşantioane

H = parametrul testului

n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)

Tk = suma rangurilor

Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie

pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni

34

df = k-1 (k = numărul de eşantioane)

df = 3-1 = 2

Hcritic(α=005) = 599

H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie

pozitivă şi respectiv biopsie negativă

Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie

a tipului de studiu pe eşantioane perechi)

1 Definirea numărului de tratamente k

2 Obţinerea rangurilor pentru fiecare tratament

3 Sumarea rangurilor fiecărui tratament

4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)

5 Dacă Fr gt Frcritic rarr respingem H0

Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost

măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi

n = 9 k = 3 T12 = 225 T2

2 = 38025 T32 = 38025

Frcritic = 599

Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de

prostată

35

De reţinut

Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei

Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-

of-Fit

Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z

Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t

Compararea mediilor a 3 sau mai multe eşantioane ANOVA

Compararea mediilor a două populaţii (σ) testul Z

Compararea mediilor a două eşantioane (s) testul t

Compararea mediilor a două eşantioane perechi (s) testul t

ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi

cu cel pentru compararea a două eşantioane perechi

Ranguri

Distribuţia datelor nu are importanţă

Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)

Trei sau mai multe eşantioane Kruskal-Wallis

Trei sau mai multe eşantioane perechi Friedman

Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia

Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a

datelor)

Variabile nominale

Un singur eşantion sau eşantioane perechi

Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte

Eşantioane perechi testul Mc Nemar

Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2

Icircn analiza proporţiilor există teste diferite pentru

Compararea unei frecvenţe cu o frecvenţă cunoscută

Compararea a două frecvenţe

Semnificaţia statistică

Valoarea p (p value)

Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor

două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E

posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării

aleatorii

36

Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală

urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii

Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este

probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un

experiment de dimensiunea acestuia

Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că

diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii

diferite

Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca

fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă

ar fi fost adevărată

Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă

1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe

baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De

fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001

2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie

3 Se aplică testul statistic aferent pentru a calcula valoarea p

4 Se compară valoarea p cu valoarea ndash prag

5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe

semnificativă dpdv statisticrdquo

6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e

semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să

conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă

Teste de semnificaţie

Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului

populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)

Testarea ipotezelor implică posibile erori

Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile

sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui

grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul

icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005

ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există

37

nici o diferenţă

Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ

statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de

ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost

ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau

dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă

cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă

semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe

ipotetice variate icircn cazul icircn care ele există

Măsuri ale frecvenţei

Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)

Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate

Generic formula pe care se bazează toate cele trei este

unde x şi y sunt cantităţile de comparat

Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea

unei frecvenţe pe grupe de sex vacircrstă etc

Proporţia implică icircn mod necesar ca x să fie inclus icircn y

Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară

frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp

Pentru calcularea unei rate trebuie ţinut cont de trei aspecte

bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin

bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp

bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo

Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un

tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei

populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei

aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)

38

Indicatori

Rata de incidenţă

Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă

icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii

Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o

perioadă de timp

Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de

timp x

Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei

susceptibili de a dezvolta icircmbolnăvirea studiată

Numitorul poate fi

bull Numărul mediu al populaţiei icircn perioada de timp studiată

bull Mărimea populaţiei icircn mijlocul perioadei de studiu

bull Mărimea populaţiei la icircnceputul studiului

Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă

Este obligatorie menţionarea perioadei de timp

Prevalenţa

Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la

un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă

schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa

momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)

39

Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include

numai cazuri noi respectiv include cazuri noi şi vechi

Rata de atac

Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este

folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp

raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori

Rata persoană-timp

Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din

momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte

migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost

observate

Riscul relativ (RR)

Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment

legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele

prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două

grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la

bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la

bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai

mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo

Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2

Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn

cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă

(Tabelul 1)

Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR

Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la

neexpuşi

40

Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de

culegere a datelor

Odds ratio (OR)

Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin

raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general

studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)

Tabelul 2 Tabelul 2 x 2 pentru calcularea OR

Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală

Rate de mortalitate

Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp

specificată Există mai multe tipuri de rate de mortalitate

o Mortalitate specifică pe sex

o Mortalitate specifică pe rasă

o Mortalitate specifică pe boală

o Mortalitate neonatală

o Mortalitate postneonatală

o Mortalitate infantilă

o Mortalitate maternă

Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP

41

Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de

viaţă şi vacircrsta la care survine decesul dacă este prematur

Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu

Ani de viaţă pierduţi datorat dizabilităţii

Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt

utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru

cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite

grupuri

Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de

risc şi o boală se folosesc riscul relativ şi odds ratio

35 Analiza şi interpretarea datelor

După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date

trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul

Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor

colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului

studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu

plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde

prezenţa biostatisticianului este necesară

Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu

elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat

iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului

iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate

depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori

testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere

clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza

Interpretarea rezultatelor statistice

Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne

motive (număr mic de date) acceptarea ei să fie falsă

Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine

gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia

ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument

de decizie Intervalul de confidenţă

42

Interpretarea statistica ne interpretarea clinică

Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă

Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice

obţinute pe eşantionul studiat

Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare

Ce interpretăm Rezultatele

personale obţinute icircn urma studiului

care au fost prezentate icircn secţiunea bdquoRezultaterdquo

Explicăm rezultatele obţinute

Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale

Interpretarea trebuie să se realizeze icircn

lumina limitelor studiului

contextul cultural social şi educaţional al locului unde s-a realizat cercetarea

contextul a ceea ce se cunoaşte din literatura de specialitate

Interpretăm doar rezultatele personale obţinute icircn urma studiului

Interpretarea statistică nu este tot una cu interpretarea clinică

Interpretarea statistică este importantă

Interpretarea clinică este foarte importantă

Intervalul de confidenţă

Media calculată pe baza unui eşantion nu va echivala media populaţiei

Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului

Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a

populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a

populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)

pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru

orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare

dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de

confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de

date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de

5

Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel

Dacă valoarea p este mică

Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare

aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o

medie diferită Diferenţa este semnificativă dpdv statistic

43

Icircn continuare

Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa

reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică

pentru a fi interesante din punct de vedere ştiinţific

Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC

oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care

este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a

obţine o concluzie clară

Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o

diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că

datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din

punct de vedere ştiinţific

Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul

detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat

Erorile studiilor medicale

Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura

anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară

caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea

asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri

legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias

Erorile potenţiale icircn studiile epidemiologice

1 Erori icircntacircmplătoare

2 Erori sistematice

3 Confuzia

4 Validitatea

1 Erori icircntacircmplătoare

Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a

parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel

de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot

fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii

(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor

de măsură (eroarea de măsurare)

44

2 Erori sistematice

Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate

care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu

acurateţe mare Acurateţea nu este afectată de mărimea eşantionului

Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de

experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea

dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus

şi greu de cuantificat (consum de alcool personalitate etc)

Principalele tipuri de erori din această categorie sunt

bull Biasul de selecţie

bull Biasul de informaţie

Biasul de selecţie

Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul

trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion

inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale

persoanelor incluse

Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se

ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia

Biasul de informaţie

Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de

instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze

expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere

nesemnificativă sau chiar să nu şi-o amintească de loc

3 Confuzia

Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune

prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este

cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă

de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte

important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor

protector

4 Validitatea

Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă

Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte

estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional

Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă

45

conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se

demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)

Validitatea externă se poate realiza numai dacă studiul este valid intern

Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii

studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de

studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt

laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi

validă din punct de vedere intern)

3 6 Prezentarea rezultatelor

După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite

Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor

icircntr-o formă bdquodigerabilărdquo este necesară

Scopul prezentării datelor

1 Transmiterea concluziilor studiului

a Datele corecte şi importante merită comunicate

b Datele trebuie să confirme sau să infirme ipoteza studiului

c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală

2 Acordarea posibilităţii altor cercetători să aprecieze studiul

a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti

b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor

prezentate

Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru

fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie

statistică

Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de

valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras

(Tabel 3)

Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)

46

Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct

numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor

precum şi prezentarea acestora sub formă inteligibilă

Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care

convin cercetătorului

Prezentarea datelor se poate face

1 Figuri şi tabele icircn articole scrise

2 Figuri şi tabele icircn prezentări orale

3 Figuri şi tabele icircn postere

4 Text scris sau incluse icircn text

5 Site-uri de WEB

Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor

Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie

Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele

exprimacircnd exact ceea ce acestea exprimă

Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate

anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel

să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se

acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca

mai sus sugestive sunt formatele simple şi puţin icircncărcate

Dacă nu există reguli impuse se respectă

1 Mesaj simplu fără falsificarea datelor

2 De obicei este necesar atacirct tabelul cacirct şi graficul

3 Să fie simplu şi clar

Tabele

Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile

coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică

elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de

1 Se folosesc doar linii orizontale

2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn

evidenţi prin linie de separare (Tabelul 4)

Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland

Noua Zeelandă)

(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)

47

3 Numerele sunt aliniate icircn funcţie de virgulă

4 Indicii statistici sunt explicaţi sub tabel

5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană

6 Abrevierile pot fi folosite

7 Numărul de zecimale trebuie limitat la maxim două

8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel

9 Plasarea legendei este obligatorie sub tabel

10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)

Icircn cazul prezentărilor orale sau a posterelor este indicat ca

1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării

2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte

3 Folosirea de simboluri este permisă

Clasificarea tabelelor

Tabelele se clasifică după

i) conţinut

bull cu distribuţii de frecvenţe

bull de clase de frecvenţe

bull de contingenţă

ii) structura

bull cu doua coloane

bull cu subclasificări

bull ldquomasterrdquo

Tabele ce conţin distribuţii de frecvenţe

O modalitate comodă de a prezenta o mulţime de date brute este

1 Se ordonează datele in ordine crescătoare

2 Se determine frecvenţa fiecărei valori

3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane

(Tabelul 5)

Tabelul 5 Distribuţii de frecvenţă absolută

48

Tabelul claselor de frecvenţe

1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă

2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)

Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)

Tabele de contingenţă

1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a

tabelelor de contingenţă

2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a

combinaţiilor de perechi ordonate de valori

3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre

a factor de risc si

b starea sănătăţii

4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)

5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)

Tabelul 7 Tabel de contingenţă 2 x 2

49

Grafice

Există două categorii de moduri grafice sub care se pot prezenta datele

1 Ilustraţii şi fotografii

2 Grafice

1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă

pentru lucrare

2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit

Putem vorbi despre mai multe tipuri de grafice

bull Grafice pentru reprezentarea datelor cantitative

1048707 Grafic cartezian (X Y)

1048707 Histograma

1048707 Poligonul de frecvenţe

1048707 Diagrama bdquoscatterrdquo

bull Grafice pentru reprezentarea datelor calitative

1048707 Grafic cu bare

1048707 Diagrama tip bdquoboxplotrdquo

1048707 Diagrama bdquopierdquo

1048707 Cartograma

Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi

dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)

Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)

Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie

Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)

Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)

50

Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir

de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele

două variabile studiate (Figura 6)

Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2

(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2

rămacircne aproximativ constantă)

Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea

comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea

comparativă a mai multor variabile

Figura 7 Grafic calitativ cu bare

51

Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo

Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două

posibilităţi reprezentate grafic este mai frecventă (Figura 8)

Figura 8 Reprezentare tip bdquopierdquo

Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli

sau a oricărui element comparativ Se foloseşte de epidemiologi

Rezultate

Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare

Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o

manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu

explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția

bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la

ilustraţii tabele grafice

Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi

nici rezultatele care invalidează eventual ipoteza

Discuţii

Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd

cultura ştiinţifică şi inteligenţa autorilor

Acest capitol răspunde la trei obiective

Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia

calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de

selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează

rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv

52

este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn

care a fost abordată problema fără a face o revistă a literaturii

Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea

rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul

Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor

afirmaţii nesusţinute de conţinutul lucrării

Concluzii

Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate

să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie

Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de

concluzii va scădea valoarea lucrării

Bibliografia (lista referinţelor citarea icircn text)

Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn

lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente

Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli

- să conţină cele mai importante şi recente lucrări

- să includă numai lucrări publicate

- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate

Bibliografie

Elisabeta Jaba ndash Statistică Ed Economică 1998

Mihai Ţarcă ndash Statistică volI Ed UAIC 1979

Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale

Ed University Press 2009

Sorana Daniela Bolboacă ndash Metodologia cercetării curs

53

Page 35: cercetarea medicala - metodologie

df = k-1 (k = numărul de eşantioane)

df = 3-1 = 2

Hcritic(α=005) = 599

H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie

pozitivă şi respectiv biopsie negativă

Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie

a tipului de studiu pe eşantioane perechi)

1 Definirea numărului de tratamente k

2 Obţinerea rangurilor pentru fiecare tratament

3 Sumarea rangurilor fiecărui tratament

4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)

5 Dacă Fr gt Frcritic rarr respingem H0

Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost

măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi

n = 9 k = 3 T12 = 225 T2

2 = 38025 T32 = 38025

Frcritic = 599

Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de

prostată

35

De reţinut

Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei

Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-

of-Fit

Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z

Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t

Compararea mediilor a 3 sau mai multe eşantioane ANOVA

Compararea mediilor a două populaţii (σ) testul Z

Compararea mediilor a două eşantioane (s) testul t

Compararea mediilor a două eşantioane perechi (s) testul t

ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi

cu cel pentru compararea a două eşantioane perechi

Ranguri

Distribuţia datelor nu are importanţă

Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)

Trei sau mai multe eşantioane Kruskal-Wallis

Trei sau mai multe eşantioane perechi Friedman

Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia

Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a

datelor)

Variabile nominale

Un singur eşantion sau eşantioane perechi

Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte

Eşantioane perechi testul Mc Nemar

Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2

Icircn analiza proporţiilor există teste diferite pentru

Compararea unei frecvenţe cu o frecvenţă cunoscută

Compararea a două frecvenţe

Semnificaţia statistică

Valoarea p (p value)

Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor

două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E

posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării

aleatorii

36

Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală

urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii

Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este

probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un

experiment de dimensiunea acestuia

Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că

diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii

diferite

Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca

fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă

ar fi fost adevărată

Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă

1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe

baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De

fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001

2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie

3 Se aplică testul statistic aferent pentru a calcula valoarea p

4 Se compară valoarea p cu valoarea ndash prag

5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe

semnificativă dpdv statisticrdquo

6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e

semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să

conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă

Teste de semnificaţie

Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului

populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)

Testarea ipotezelor implică posibile erori

Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile

sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui

grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul

icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005

ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există

37

nici o diferenţă

Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ

statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de

ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost

ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau

dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă

cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă

semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe

ipotetice variate icircn cazul icircn care ele există

Măsuri ale frecvenţei

Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)

Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate

Generic formula pe care se bazează toate cele trei este

unde x şi y sunt cantităţile de comparat

Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea

unei frecvenţe pe grupe de sex vacircrstă etc

Proporţia implică icircn mod necesar ca x să fie inclus icircn y

Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară

frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp

Pentru calcularea unei rate trebuie ţinut cont de trei aspecte

bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin

bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp

bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo

Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un

tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei

populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei

aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)

38

Indicatori

Rata de incidenţă

Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă

icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii

Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o

perioadă de timp

Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de

timp x

Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei

susceptibili de a dezvolta icircmbolnăvirea studiată

Numitorul poate fi

bull Numărul mediu al populaţiei icircn perioada de timp studiată

bull Mărimea populaţiei icircn mijlocul perioadei de studiu

bull Mărimea populaţiei la icircnceputul studiului

Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă

Este obligatorie menţionarea perioadei de timp

Prevalenţa

Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la

un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă

schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa

momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)

39

Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include

numai cazuri noi respectiv include cazuri noi şi vechi

Rata de atac

Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este

folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp

raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori

Rata persoană-timp

Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din

momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte

migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost

observate

Riscul relativ (RR)

Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment

legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele

prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două

grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la

bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la

bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai

mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo

Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2

Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn

cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă

(Tabelul 1)

Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR

Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la

neexpuşi

40

Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de

culegere a datelor

Odds ratio (OR)

Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin

raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general

studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)

Tabelul 2 Tabelul 2 x 2 pentru calcularea OR

Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală

Rate de mortalitate

Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp

specificată Există mai multe tipuri de rate de mortalitate

o Mortalitate specifică pe sex

o Mortalitate specifică pe rasă

o Mortalitate specifică pe boală

o Mortalitate neonatală

o Mortalitate postneonatală

o Mortalitate infantilă

o Mortalitate maternă

Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP

41

Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de

viaţă şi vacircrsta la care survine decesul dacă este prematur

Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu

Ani de viaţă pierduţi datorat dizabilităţii

Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt

utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru

cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite

grupuri

Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de

risc şi o boală se folosesc riscul relativ şi odds ratio

35 Analiza şi interpretarea datelor

După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date

trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul

Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor

colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului

studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu

plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde

prezenţa biostatisticianului este necesară

Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu

elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat

iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului

iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate

depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori

testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere

clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza

Interpretarea rezultatelor statistice

Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne

motive (număr mic de date) acceptarea ei să fie falsă

Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine

gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia

ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument

de decizie Intervalul de confidenţă

42

Interpretarea statistica ne interpretarea clinică

Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă

Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice

obţinute pe eşantionul studiat

Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare

Ce interpretăm Rezultatele

personale obţinute icircn urma studiului

care au fost prezentate icircn secţiunea bdquoRezultaterdquo

Explicăm rezultatele obţinute

Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale

Interpretarea trebuie să se realizeze icircn

lumina limitelor studiului

contextul cultural social şi educaţional al locului unde s-a realizat cercetarea

contextul a ceea ce se cunoaşte din literatura de specialitate

Interpretăm doar rezultatele personale obţinute icircn urma studiului

Interpretarea statistică nu este tot una cu interpretarea clinică

Interpretarea statistică este importantă

Interpretarea clinică este foarte importantă

Intervalul de confidenţă

Media calculată pe baza unui eşantion nu va echivala media populaţiei

Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului

Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a

populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a

populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)

pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru

orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare

dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de

confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de

date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de

5

Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel

Dacă valoarea p este mică

Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare

aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o

medie diferită Diferenţa este semnificativă dpdv statistic

43

Icircn continuare

Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa

reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică

pentru a fi interesante din punct de vedere ştiinţific

Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC

oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care

este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a

obţine o concluzie clară

Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o

diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că

datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din

punct de vedere ştiinţific

Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul

detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat

Erorile studiilor medicale

Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura

anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară

caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea

asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri

legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias

Erorile potenţiale icircn studiile epidemiologice

1 Erori icircntacircmplătoare

2 Erori sistematice

3 Confuzia

4 Validitatea

1 Erori icircntacircmplătoare

Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a

parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel

de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot

fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii

(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor

de măsură (eroarea de măsurare)

44

2 Erori sistematice

Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate

care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu

acurateţe mare Acurateţea nu este afectată de mărimea eşantionului

Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de

experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea

dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus

şi greu de cuantificat (consum de alcool personalitate etc)

Principalele tipuri de erori din această categorie sunt

bull Biasul de selecţie

bull Biasul de informaţie

Biasul de selecţie

Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul

trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion

inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale

persoanelor incluse

Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se

ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia

Biasul de informaţie

Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de

instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze

expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere

nesemnificativă sau chiar să nu şi-o amintească de loc

3 Confuzia

Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune

prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este

cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă

de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte

important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor

protector

4 Validitatea

Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă

Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte

estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional

Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă

45

conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se

demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)

Validitatea externă se poate realiza numai dacă studiul este valid intern

Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii

studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de

studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt

laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi

validă din punct de vedere intern)

3 6 Prezentarea rezultatelor

După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite

Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor

icircntr-o formă bdquodigerabilărdquo este necesară

Scopul prezentării datelor

1 Transmiterea concluziilor studiului

a Datele corecte şi importante merită comunicate

b Datele trebuie să confirme sau să infirme ipoteza studiului

c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală

2 Acordarea posibilităţii altor cercetători să aprecieze studiul

a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti

b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor

prezentate

Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru

fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie

statistică

Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de

valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras

(Tabel 3)

Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)

46

Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct

numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor

precum şi prezentarea acestora sub formă inteligibilă

Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care

convin cercetătorului

Prezentarea datelor se poate face

1 Figuri şi tabele icircn articole scrise

2 Figuri şi tabele icircn prezentări orale

3 Figuri şi tabele icircn postere

4 Text scris sau incluse icircn text

5 Site-uri de WEB

Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor

Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie

Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele

exprimacircnd exact ceea ce acestea exprimă

Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate

anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel

să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se

acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca

mai sus sugestive sunt formatele simple şi puţin icircncărcate

Dacă nu există reguli impuse se respectă

1 Mesaj simplu fără falsificarea datelor

2 De obicei este necesar atacirct tabelul cacirct şi graficul

3 Să fie simplu şi clar

Tabele

Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile

coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică

elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de

1 Se folosesc doar linii orizontale

2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn

evidenţi prin linie de separare (Tabelul 4)

Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland

Noua Zeelandă)

(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)

47

3 Numerele sunt aliniate icircn funcţie de virgulă

4 Indicii statistici sunt explicaţi sub tabel

5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană

6 Abrevierile pot fi folosite

7 Numărul de zecimale trebuie limitat la maxim două

8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel

9 Plasarea legendei este obligatorie sub tabel

10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)

Icircn cazul prezentărilor orale sau a posterelor este indicat ca

1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării

2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte

3 Folosirea de simboluri este permisă

Clasificarea tabelelor

Tabelele se clasifică după

i) conţinut

bull cu distribuţii de frecvenţe

bull de clase de frecvenţe

bull de contingenţă

ii) structura

bull cu doua coloane

bull cu subclasificări

bull ldquomasterrdquo

Tabele ce conţin distribuţii de frecvenţe

O modalitate comodă de a prezenta o mulţime de date brute este

1 Se ordonează datele in ordine crescătoare

2 Se determine frecvenţa fiecărei valori

3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane

(Tabelul 5)

Tabelul 5 Distribuţii de frecvenţă absolută

48

Tabelul claselor de frecvenţe

1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă

2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)

Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)

Tabele de contingenţă

1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a

tabelelor de contingenţă

2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a

combinaţiilor de perechi ordonate de valori

3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre

a factor de risc si

b starea sănătăţii

4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)

5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)

Tabelul 7 Tabel de contingenţă 2 x 2

49

Grafice

Există două categorii de moduri grafice sub care se pot prezenta datele

1 Ilustraţii şi fotografii

2 Grafice

1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă

pentru lucrare

2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit

Putem vorbi despre mai multe tipuri de grafice

bull Grafice pentru reprezentarea datelor cantitative

1048707 Grafic cartezian (X Y)

1048707 Histograma

1048707 Poligonul de frecvenţe

1048707 Diagrama bdquoscatterrdquo

bull Grafice pentru reprezentarea datelor calitative

1048707 Grafic cu bare

1048707 Diagrama tip bdquoboxplotrdquo

1048707 Diagrama bdquopierdquo

1048707 Cartograma

Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi

dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)

Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)

Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie

Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)

Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)

50

Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir

de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele

două variabile studiate (Figura 6)

Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2

(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2

rămacircne aproximativ constantă)

Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea

comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea

comparativă a mai multor variabile

Figura 7 Grafic calitativ cu bare

51

Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo

Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două

posibilităţi reprezentate grafic este mai frecventă (Figura 8)

Figura 8 Reprezentare tip bdquopierdquo

Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli

sau a oricărui element comparativ Se foloseşte de epidemiologi

Rezultate

Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare

Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o

manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu

explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția

bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la

ilustraţii tabele grafice

Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi

nici rezultatele care invalidează eventual ipoteza

Discuţii

Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd

cultura ştiinţifică şi inteligenţa autorilor

Acest capitol răspunde la trei obiective

Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia

calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de

selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează

rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv

52

este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn

care a fost abordată problema fără a face o revistă a literaturii

Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea

rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul

Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor

afirmaţii nesusţinute de conţinutul lucrării

Concluzii

Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate

să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie

Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de

concluzii va scădea valoarea lucrării

Bibliografia (lista referinţelor citarea icircn text)

Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn

lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente

Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli

- să conţină cele mai importante şi recente lucrări

- să includă numai lucrări publicate

- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate

Bibliografie

Elisabeta Jaba ndash Statistică Ed Economică 1998

Mihai Ţarcă ndash Statistică volI Ed UAIC 1979

Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale

Ed University Press 2009

Sorana Daniela Bolboacă ndash Metodologia cercetării curs

53

Page 36: cercetarea medicala - metodologie

De reţinut

Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei

Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-

of-Fit

Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z

Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t

Compararea mediilor a 3 sau mai multe eşantioane ANOVA

Compararea mediilor a două populaţii (σ) testul Z

Compararea mediilor a două eşantioane (s) testul t

Compararea mediilor a două eşantioane perechi (s) testul t

ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi

cu cel pentru compararea a două eşantioane perechi

Ranguri

Distribuţia datelor nu are importanţă

Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)

Trei sau mai multe eşantioane Kruskal-Wallis

Trei sau mai multe eşantioane perechi Friedman

Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia

Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a

datelor)

Variabile nominale

Un singur eşantion sau eşantioane perechi

Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte

Eşantioane perechi testul Mc Nemar

Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2

Icircn analiza proporţiilor există teste diferite pentru

Compararea unei frecvenţe cu o frecvenţă cunoscută

Compararea a două frecvenţe

Semnificaţia statistică

Valoarea p (p value)

Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor

două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E

posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării

aleatorii

36

Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală

urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii

Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este

probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un

experiment de dimensiunea acestuia

Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că

diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii

diferite

Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca

fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă

ar fi fost adevărată

Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă

1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe

baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De

fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001

2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie

3 Se aplică testul statistic aferent pentru a calcula valoarea p

4 Se compară valoarea p cu valoarea ndash prag

5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe

semnificativă dpdv statisticrdquo

6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e

semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să

conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă

Teste de semnificaţie

Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului

populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)

Testarea ipotezelor implică posibile erori

Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile

sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui

grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul

icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005

ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există

37

nici o diferenţă

Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ

statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de

ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost

ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau

dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă

cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă

semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe

ipotetice variate icircn cazul icircn care ele există

Măsuri ale frecvenţei

Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)

Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate

Generic formula pe care se bazează toate cele trei este

unde x şi y sunt cantităţile de comparat

Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea

unei frecvenţe pe grupe de sex vacircrstă etc

Proporţia implică icircn mod necesar ca x să fie inclus icircn y

Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară

frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp

Pentru calcularea unei rate trebuie ţinut cont de trei aspecte

bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin

bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp

bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo

Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un

tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei

populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei

aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)

38

Indicatori

Rata de incidenţă

Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă

icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii

Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o

perioadă de timp

Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de

timp x

Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei

susceptibili de a dezvolta icircmbolnăvirea studiată

Numitorul poate fi

bull Numărul mediu al populaţiei icircn perioada de timp studiată

bull Mărimea populaţiei icircn mijlocul perioadei de studiu

bull Mărimea populaţiei la icircnceputul studiului

Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă

Este obligatorie menţionarea perioadei de timp

Prevalenţa

Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la

un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă

schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa

momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)

39

Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include

numai cazuri noi respectiv include cazuri noi şi vechi

Rata de atac

Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este

folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp

raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori

Rata persoană-timp

Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din

momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte

migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost

observate

Riscul relativ (RR)

Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment

legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele

prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două

grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la

bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la

bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai

mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo

Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2

Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn

cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă

(Tabelul 1)

Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR

Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la

neexpuşi

40

Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de

culegere a datelor

Odds ratio (OR)

Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin

raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general

studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)

Tabelul 2 Tabelul 2 x 2 pentru calcularea OR

Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală

Rate de mortalitate

Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp

specificată Există mai multe tipuri de rate de mortalitate

o Mortalitate specifică pe sex

o Mortalitate specifică pe rasă

o Mortalitate specifică pe boală

o Mortalitate neonatală

o Mortalitate postneonatală

o Mortalitate infantilă

o Mortalitate maternă

Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP

41

Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de

viaţă şi vacircrsta la care survine decesul dacă este prematur

Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu

Ani de viaţă pierduţi datorat dizabilităţii

Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt

utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru

cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite

grupuri

Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de

risc şi o boală se folosesc riscul relativ şi odds ratio

35 Analiza şi interpretarea datelor

După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date

trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul

Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor

colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului

studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu

plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde

prezenţa biostatisticianului este necesară

Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu

elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat

iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului

iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate

depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori

testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere

clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza

Interpretarea rezultatelor statistice

Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne

motive (număr mic de date) acceptarea ei să fie falsă

Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine

gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia

ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument

de decizie Intervalul de confidenţă

42

Interpretarea statistica ne interpretarea clinică

Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă

Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice

obţinute pe eşantionul studiat

Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare

Ce interpretăm Rezultatele

personale obţinute icircn urma studiului

care au fost prezentate icircn secţiunea bdquoRezultaterdquo

Explicăm rezultatele obţinute

Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale

Interpretarea trebuie să se realizeze icircn

lumina limitelor studiului

contextul cultural social şi educaţional al locului unde s-a realizat cercetarea

contextul a ceea ce se cunoaşte din literatura de specialitate

Interpretăm doar rezultatele personale obţinute icircn urma studiului

Interpretarea statistică nu este tot una cu interpretarea clinică

Interpretarea statistică este importantă

Interpretarea clinică este foarte importantă

Intervalul de confidenţă

Media calculată pe baza unui eşantion nu va echivala media populaţiei

Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului

Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a

populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a

populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)

pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru

orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare

dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de

confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de

date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de

5

Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel

Dacă valoarea p este mică

Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare

aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o

medie diferită Diferenţa este semnificativă dpdv statistic

43

Icircn continuare

Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa

reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică

pentru a fi interesante din punct de vedere ştiinţific

Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC

oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care

este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a

obţine o concluzie clară

Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o

diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că

datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din

punct de vedere ştiinţific

Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul

detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat

Erorile studiilor medicale

Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura

anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară

caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea

asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri

legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias

Erorile potenţiale icircn studiile epidemiologice

1 Erori icircntacircmplătoare

2 Erori sistematice

3 Confuzia

4 Validitatea

1 Erori icircntacircmplătoare

Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a

parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel

de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot

fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii

(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor

de măsură (eroarea de măsurare)

44

2 Erori sistematice

Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate

care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu

acurateţe mare Acurateţea nu este afectată de mărimea eşantionului

Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de

experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea

dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus

şi greu de cuantificat (consum de alcool personalitate etc)

Principalele tipuri de erori din această categorie sunt

bull Biasul de selecţie

bull Biasul de informaţie

Biasul de selecţie

Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul

trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion

inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale

persoanelor incluse

Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se

ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia

Biasul de informaţie

Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de

instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze

expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere

nesemnificativă sau chiar să nu şi-o amintească de loc

3 Confuzia

Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune

prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este

cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă

de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte

important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor

protector

4 Validitatea

Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă

Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte

estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional

Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă

45

conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se

demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)

Validitatea externă se poate realiza numai dacă studiul este valid intern

Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii

studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de

studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt

laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi

validă din punct de vedere intern)

3 6 Prezentarea rezultatelor

După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite

Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor

icircntr-o formă bdquodigerabilărdquo este necesară

Scopul prezentării datelor

1 Transmiterea concluziilor studiului

a Datele corecte şi importante merită comunicate

b Datele trebuie să confirme sau să infirme ipoteza studiului

c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală

2 Acordarea posibilităţii altor cercetători să aprecieze studiul

a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti

b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor

prezentate

Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru

fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie

statistică

Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de

valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras

(Tabel 3)

Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)

46

Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct

numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor

precum şi prezentarea acestora sub formă inteligibilă

Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care

convin cercetătorului

Prezentarea datelor se poate face

1 Figuri şi tabele icircn articole scrise

2 Figuri şi tabele icircn prezentări orale

3 Figuri şi tabele icircn postere

4 Text scris sau incluse icircn text

5 Site-uri de WEB

Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor

Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie

Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele

exprimacircnd exact ceea ce acestea exprimă

Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate

anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel

să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se

acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca

mai sus sugestive sunt formatele simple şi puţin icircncărcate

Dacă nu există reguli impuse se respectă

1 Mesaj simplu fără falsificarea datelor

2 De obicei este necesar atacirct tabelul cacirct şi graficul

3 Să fie simplu şi clar

Tabele

Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile

coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică

elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de

1 Se folosesc doar linii orizontale

2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn

evidenţi prin linie de separare (Tabelul 4)

Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland

Noua Zeelandă)

(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)

47

3 Numerele sunt aliniate icircn funcţie de virgulă

4 Indicii statistici sunt explicaţi sub tabel

5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană

6 Abrevierile pot fi folosite

7 Numărul de zecimale trebuie limitat la maxim două

8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel

9 Plasarea legendei este obligatorie sub tabel

10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)

Icircn cazul prezentărilor orale sau a posterelor este indicat ca

1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării

2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte

3 Folosirea de simboluri este permisă

Clasificarea tabelelor

Tabelele se clasifică după

i) conţinut

bull cu distribuţii de frecvenţe

bull de clase de frecvenţe

bull de contingenţă

ii) structura

bull cu doua coloane

bull cu subclasificări

bull ldquomasterrdquo

Tabele ce conţin distribuţii de frecvenţe

O modalitate comodă de a prezenta o mulţime de date brute este

1 Se ordonează datele in ordine crescătoare

2 Se determine frecvenţa fiecărei valori

3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane

(Tabelul 5)

Tabelul 5 Distribuţii de frecvenţă absolută

48

Tabelul claselor de frecvenţe

1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă

2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)

Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)

Tabele de contingenţă

1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a

tabelelor de contingenţă

2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a

combinaţiilor de perechi ordonate de valori

3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre

a factor de risc si

b starea sănătăţii

4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)

5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)

Tabelul 7 Tabel de contingenţă 2 x 2

49

Grafice

Există două categorii de moduri grafice sub care se pot prezenta datele

1 Ilustraţii şi fotografii

2 Grafice

1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă

pentru lucrare

2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit

Putem vorbi despre mai multe tipuri de grafice

bull Grafice pentru reprezentarea datelor cantitative

1048707 Grafic cartezian (X Y)

1048707 Histograma

1048707 Poligonul de frecvenţe

1048707 Diagrama bdquoscatterrdquo

bull Grafice pentru reprezentarea datelor calitative

1048707 Grafic cu bare

1048707 Diagrama tip bdquoboxplotrdquo

1048707 Diagrama bdquopierdquo

1048707 Cartograma

Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi

dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)

Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)

Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie

Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)

Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)

50

Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir

de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele

două variabile studiate (Figura 6)

Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2

(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2

rămacircne aproximativ constantă)

Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea

comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea

comparativă a mai multor variabile

Figura 7 Grafic calitativ cu bare

51

Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo

Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două

posibilităţi reprezentate grafic este mai frecventă (Figura 8)

Figura 8 Reprezentare tip bdquopierdquo

Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli

sau a oricărui element comparativ Se foloseşte de epidemiologi

Rezultate

Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare

Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o

manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu

explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția

bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la

ilustraţii tabele grafice

Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi

nici rezultatele care invalidează eventual ipoteza

Discuţii

Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd

cultura ştiinţifică şi inteligenţa autorilor

Acest capitol răspunde la trei obiective

Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia

calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de

selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează

rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv

52

este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn

care a fost abordată problema fără a face o revistă a literaturii

Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea

rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul

Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor

afirmaţii nesusţinute de conţinutul lucrării

Concluzii

Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate

să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie

Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de

concluzii va scădea valoarea lucrării

Bibliografia (lista referinţelor citarea icircn text)

Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn

lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente

Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli

- să conţină cele mai importante şi recente lucrări

- să includă numai lucrări publicate

- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate

Bibliografie

Elisabeta Jaba ndash Statistică Ed Economică 1998

Mihai Ţarcă ndash Statistică volI Ed UAIC 1979

Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale

Ed University Press 2009

Sorana Daniela Bolboacă ndash Metodologia cercetării curs

53

Page 37: cercetarea medicala - metodologie

Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală

urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii

Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este

probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un

experiment de dimensiunea acestuia

Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că

diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii

diferite

Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca

fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă

ar fi fost adevărată

Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă

1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe

baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De

fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001

2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie

3 Se aplică testul statistic aferent pentru a calcula valoarea p

4 Se compară valoarea p cu valoarea ndash prag

5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe

semnificativă dpdv statisticrdquo

6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e

semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să

conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă

Teste de semnificaţie

Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului

populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)

Testarea ipotezelor implică posibile erori

Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile

sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui

grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul

icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005

ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există

37

nici o diferenţă

Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ

statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de

ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost

ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau

dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă

cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă

semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe

ipotetice variate icircn cazul icircn care ele există

Măsuri ale frecvenţei

Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)

Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate

Generic formula pe care se bazează toate cele trei este

unde x şi y sunt cantităţile de comparat

Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea

unei frecvenţe pe grupe de sex vacircrstă etc

Proporţia implică icircn mod necesar ca x să fie inclus icircn y

Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară

frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp

Pentru calcularea unei rate trebuie ţinut cont de trei aspecte

bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin

bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp

bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo

Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un

tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei

populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei

aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)

38

Indicatori

Rata de incidenţă

Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă

icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii

Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o

perioadă de timp

Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de

timp x

Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei

susceptibili de a dezvolta icircmbolnăvirea studiată

Numitorul poate fi

bull Numărul mediu al populaţiei icircn perioada de timp studiată

bull Mărimea populaţiei icircn mijlocul perioadei de studiu

bull Mărimea populaţiei la icircnceputul studiului

Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă

Este obligatorie menţionarea perioadei de timp

Prevalenţa

Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la

un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă

schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa

momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)

39

Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include

numai cazuri noi respectiv include cazuri noi şi vechi

Rata de atac

Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este

folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp

raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori

Rata persoană-timp

Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din

momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte

migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost

observate

Riscul relativ (RR)

Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment

legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele

prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două

grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la

bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la

bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai

mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo

Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2

Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn

cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă

(Tabelul 1)

Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR

Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la

neexpuşi

40

Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de

culegere a datelor

Odds ratio (OR)

Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin

raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general

studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)

Tabelul 2 Tabelul 2 x 2 pentru calcularea OR

Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală

Rate de mortalitate

Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp

specificată Există mai multe tipuri de rate de mortalitate

o Mortalitate specifică pe sex

o Mortalitate specifică pe rasă

o Mortalitate specifică pe boală

o Mortalitate neonatală

o Mortalitate postneonatală

o Mortalitate infantilă

o Mortalitate maternă

Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP

41

Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de

viaţă şi vacircrsta la care survine decesul dacă este prematur

Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu

Ani de viaţă pierduţi datorat dizabilităţii

Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt

utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru

cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite

grupuri

Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de

risc şi o boală se folosesc riscul relativ şi odds ratio

35 Analiza şi interpretarea datelor

După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date

trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul

Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor

colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului

studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu

plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde

prezenţa biostatisticianului este necesară

Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu

elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat

iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului

iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate

depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori

testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere

clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza

Interpretarea rezultatelor statistice

Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne

motive (număr mic de date) acceptarea ei să fie falsă

Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine

gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia

ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument

de decizie Intervalul de confidenţă

42

Interpretarea statistica ne interpretarea clinică

Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă

Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice

obţinute pe eşantionul studiat

Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare

Ce interpretăm Rezultatele

personale obţinute icircn urma studiului

care au fost prezentate icircn secţiunea bdquoRezultaterdquo

Explicăm rezultatele obţinute

Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale

Interpretarea trebuie să se realizeze icircn

lumina limitelor studiului

contextul cultural social şi educaţional al locului unde s-a realizat cercetarea

contextul a ceea ce se cunoaşte din literatura de specialitate

Interpretăm doar rezultatele personale obţinute icircn urma studiului

Interpretarea statistică nu este tot una cu interpretarea clinică

Interpretarea statistică este importantă

Interpretarea clinică este foarte importantă

Intervalul de confidenţă

Media calculată pe baza unui eşantion nu va echivala media populaţiei

Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului

Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a

populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a

populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)

pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru

orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare

dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de

confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de

date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de

5

Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel

Dacă valoarea p este mică

Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare

aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o

medie diferită Diferenţa este semnificativă dpdv statistic

43

Icircn continuare

Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa

reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică

pentru a fi interesante din punct de vedere ştiinţific

Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC

oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care

este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a

obţine o concluzie clară

Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o

diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că

datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din

punct de vedere ştiinţific

Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul

detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat

Erorile studiilor medicale

Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura

anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară

caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea

asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri

legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias

Erorile potenţiale icircn studiile epidemiologice

1 Erori icircntacircmplătoare

2 Erori sistematice

3 Confuzia

4 Validitatea

1 Erori icircntacircmplătoare

Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a

parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel

de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot

fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii

(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor

de măsură (eroarea de măsurare)

44

2 Erori sistematice

Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate

care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu

acurateţe mare Acurateţea nu este afectată de mărimea eşantionului

Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de

experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea

dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus

şi greu de cuantificat (consum de alcool personalitate etc)

Principalele tipuri de erori din această categorie sunt

bull Biasul de selecţie

bull Biasul de informaţie

Biasul de selecţie

Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul

trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion

inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale

persoanelor incluse

Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se

ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia

Biasul de informaţie

Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de

instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze

expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere

nesemnificativă sau chiar să nu şi-o amintească de loc

3 Confuzia

Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune

prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este

cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă

de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte

important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor

protector

4 Validitatea

Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă

Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte

estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional

Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă

45

conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se

demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)

Validitatea externă se poate realiza numai dacă studiul este valid intern

Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii

studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de

studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt

laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi

validă din punct de vedere intern)

3 6 Prezentarea rezultatelor

După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite

Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor

icircntr-o formă bdquodigerabilărdquo este necesară

Scopul prezentării datelor

1 Transmiterea concluziilor studiului

a Datele corecte şi importante merită comunicate

b Datele trebuie să confirme sau să infirme ipoteza studiului

c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală

2 Acordarea posibilităţii altor cercetători să aprecieze studiul

a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti

b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor

prezentate

Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru

fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie

statistică

Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de

valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras

(Tabel 3)

Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)

46

Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct

numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor

precum şi prezentarea acestora sub formă inteligibilă

Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care

convin cercetătorului

Prezentarea datelor se poate face

1 Figuri şi tabele icircn articole scrise

2 Figuri şi tabele icircn prezentări orale

3 Figuri şi tabele icircn postere

4 Text scris sau incluse icircn text

5 Site-uri de WEB

Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor

Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie

Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele

exprimacircnd exact ceea ce acestea exprimă

Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate

anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel

să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se

acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca

mai sus sugestive sunt formatele simple şi puţin icircncărcate

Dacă nu există reguli impuse se respectă

1 Mesaj simplu fără falsificarea datelor

2 De obicei este necesar atacirct tabelul cacirct şi graficul

3 Să fie simplu şi clar

Tabele

Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile

coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică

elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de

1 Se folosesc doar linii orizontale

2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn

evidenţi prin linie de separare (Tabelul 4)

Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland

Noua Zeelandă)

(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)

47

3 Numerele sunt aliniate icircn funcţie de virgulă

4 Indicii statistici sunt explicaţi sub tabel

5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană

6 Abrevierile pot fi folosite

7 Numărul de zecimale trebuie limitat la maxim două

8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel

9 Plasarea legendei este obligatorie sub tabel

10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)

Icircn cazul prezentărilor orale sau a posterelor este indicat ca

1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării

2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte

3 Folosirea de simboluri este permisă

Clasificarea tabelelor

Tabelele se clasifică după

i) conţinut

bull cu distribuţii de frecvenţe

bull de clase de frecvenţe

bull de contingenţă

ii) structura

bull cu doua coloane

bull cu subclasificări

bull ldquomasterrdquo

Tabele ce conţin distribuţii de frecvenţe

O modalitate comodă de a prezenta o mulţime de date brute este

1 Se ordonează datele in ordine crescătoare

2 Se determine frecvenţa fiecărei valori

3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane

(Tabelul 5)

Tabelul 5 Distribuţii de frecvenţă absolută

48

Tabelul claselor de frecvenţe

1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă

2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)

Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)

Tabele de contingenţă

1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a

tabelelor de contingenţă

2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a

combinaţiilor de perechi ordonate de valori

3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre

a factor de risc si

b starea sănătăţii

4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)

5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)

Tabelul 7 Tabel de contingenţă 2 x 2

49

Grafice

Există două categorii de moduri grafice sub care se pot prezenta datele

1 Ilustraţii şi fotografii

2 Grafice

1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă

pentru lucrare

2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit

Putem vorbi despre mai multe tipuri de grafice

bull Grafice pentru reprezentarea datelor cantitative

1048707 Grafic cartezian (X Y)

1048707 Histograma

1048707 Poligonul de frecvenţe

1048707 Diagrama bdquoscatterrdquo

bull Grafice pentru reprezentarea datelor calitative

1048707 Grafic cu bare

1048707 Diagrama tip bdquoboxplotrdquo

1048707 Diagrama bdquopierdquo

1048707 Cartograma

Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi

dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)

Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)

Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie

Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)

Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)

50

Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir

de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele

două variabile studiate (Figura 6)

Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2

(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2

rămacircne aproximativ constantă)

Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea

comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea

comparativă a mai multor variabile

Figura 7 Grafic calitativ cu bare

51

Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo

Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două

posibilităţi reprezentate grafic este mai frecventă (Figura 8)

Figura 8 Reprezentare tip bdquopierdquo

Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli

sau a oricărui element comparativ Se foloseşte de epidemiologi

Rezultate

Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare

Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o

manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu

explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția

bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la

ilustraţii tabele grafice

Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi

nici rezultatele care invalidează eventual ipoteza

Discuţii

Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd

cultura ştiinţifică şi inteligenţa autorilor

Acest capitol răspunde la trei obiective

Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia

calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de

selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează

rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv

52

este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn

care a fost abordată problema fără a face o revistă a literaturii

Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea

rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul

Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor

afirmaţii nesusţinute de conţinutul lucrării

Concluzii

Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate

să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie

Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de

concluzii va scădea valoarea lucrării

Bibliografia (lista referinţelor citarea icircn text)

Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn

lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente

Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli

- să conţină cele mai importante şi recente lucrări

- să includă numai lucrări publicate

- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate

Bibliografie

Elisabeta Jaba ndash Statistică Ed Economică 1998

Mihai Ţarcă ndash Statistică volI Ed UAIC 1979

Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale

Ed University Press 2009

Sorana Daniela Bolboacă ndash Metodologia cercetării curs

53

Page 38: cercetarea medicala - metodologie

nici o diferenţă

Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ

statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de

ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost

ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau

dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă

cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă

semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe

ipotetice variate icircn cazul icircn care ele există

Măsuri ale frecvenţei

Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)

Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate

Generic formula pe care se bazează toate cele trei este

unde x şi y sunt cantităţile de comparat

Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea

unei frecvenţe pe grupe de sex vacircrstă etc

Proporţia implică icircn mod necesar ca x să fie inclus icircn y

Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară

frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp

Pentru calcularea unei rate trebuie ţinut cont de trei aspecte

bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin

bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp

bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo

Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un

tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei

populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei

aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)

38

Indicatori

Rata de incidenţă

Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă

icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii

Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o

perioadă de timp

Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de

timp x

Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei

susceptibili de a dezvolta icircmbolnăvirea studiată

Numitorul poate fi

bull Numărul mediu al populaţiei icircn perioada de timp studiată

bull Mărimea populaţiei icircn mijlocul perioadei de studiu

bull Mărimea populaţiei la icircnceputul studiului

Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă

Este obligatorie menţionarea perioadei de timp

Prevalenţa

Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la

un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă

schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa

momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)

39

Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include

numai cazuri noi respectiv include cazuri noi şi vechi

Rata de atac

Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este

folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp

raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori

Rata persoană-timp

Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din

momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte

migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost

observate

Riscul relativ (RR)

Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment

legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele

prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două

grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la

bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la

bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai

mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo

Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2

Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn

cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă

(Tabelul 1)

Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR

Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la

neexpuşi

40

Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de

culegere a datelor

Odds ratio (OR)

Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin

raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general

studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)

Tabelul 2 Tabelul 2 x 2 pentru calcularea OR

Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală

Rate de mortalitate

Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp

specificată Există mai multe tipuri de rate de mortalitate

o Mortalitate specifică pe sex

o Mortalitate specifică pe rasă

o Mortalitate specifică pe boală

o Mortalitate neonatală

o Mortalitate postneonatală

o Mortalitate infantilă

o Mortalitate maternă

Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP

41

Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de

viaţă şi vacircrsta la care survine decesul dacă este prematur

Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu

Ani de viaţă pierduţi datorat dizabilităţii

Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt

utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru

cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite

grupuri

Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de

risc şi o boală se folosesc riscul relativ şi odds ratio

35 Analiza şi interpretarea datelor

După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date

trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul

Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor

colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului

studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu

plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde

prezenţa biostatisticianului este necesară

Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu

elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat

iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului

iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate

depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori

testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere

clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza

Interpretarea rezultatelor statistice

Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne

motive (număr mic de date) acceptarea ei să fie falsă

Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine

gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia

ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument

de decizie Intervalul de confidenţă

42

Interpretarea statistica ne interpretarea clinică

Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă

Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice

obţinute pe eşantionul studiat

Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare

Ce interpretăm Rezultatele

personale obţinute icircn urma studiului

care au fost prezentate icircn secţiunea bdquoRezultaterdquo

Explicăm rezultatele obţinute

Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale

Interpretarea trebuie să se realizeze icircn

lumina limitelor studiului

contextul cultural social şi educaţional al locului unde s-a realizat cercetarea

contextul a ceea ce se cunoaşte din literatura de specialitate

Interpretăm doar rezultatele personale obţinute icircn urma studiului

Interpretarea statistică nu este tot una cu interpretarea clinică

Interpretarea statistică este importantă

Interpretarea clinică este foarte importantă

Intervalul de confidenţă

Media calculată pe baza unui eşantion nu va echivala media populaţiei

Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului

Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a

populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a

populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)

pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru

orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare

dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de

confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de

date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de

5

Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel

Dacă valoarea p este mică

Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare

aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o

medie diferită Diferenţa este semnificativă dpdv statistic

43

Icircn continuare

Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa

reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică

pentru a fi interesante din punct de vedere ştiinţific

Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC

oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care

este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a

obţine o concluzie clară

Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o

diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că

datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din

punct de vedere ştiinţific

Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul

detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat

Erorile studiilor medicale

Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura

anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară

caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea

asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri

legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias

Erorile potenţiale icircn studiile epidemiologice

1 Erori icircntacircmplătoare

2 Erori sistematice

3 Confuzia

4 Validitatea

1 Erori icircntacircmplătoare

Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a

parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel

de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot

fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii

(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor

de măsură (eroarea de măsurare)

44

2 Erori sistematice

Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate

care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu

acurateţe mare Acurateţea nu este afectată de mărimea eşantionului

Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de

experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea

dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus

şi greu de cuantificat (consum de alcool personalitate etc)

Principalele tipuri de erori din această categorie sunt

bull Biasul de selecţie

bull Biasul de informaţie

Biasul de selecţie

Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul

trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion

inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale

persoanelor incluse

Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se

ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia

Biasul de informaţie

Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de

instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze

expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere

nesemnificativă sau chiar să nu şi-o amintească de loc

3 Confuzia

Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune

prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este

cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă

de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte

important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor

protector

4 Validitatea

Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă

Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte

estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional

Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă

45

conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se

demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)

Validitatea externă se poate realiza numai dacă studiul este valid intern

Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii

studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de

studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt

laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi

validă din punct de vedere intern)

3 6 Prezentarea rezultatelor

După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite

Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor

icircntr-o formă bdquodigerabilărdquo este necesară

Scopul prezentării datelor

1 Transmiterea concluziilor studiului

a Datele corecte şi importante merită comunicate

b Datele trebuie să confirme sau să infirme ipoteza studiului

c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală

2 Acordarea posibilităţii altor cercetători să aprecieze studiul

a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti

b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor

prezentate

Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru

fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie

statistică

Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de

valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras

(Tabel 3)

Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)

46

Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct

numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor

precum şi prezentarea acestora sub formă inteligibilă

Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care

convin cercetătorului

Prezentarea datelor se poate face

1 Figuri şi tabele icircn articole scrise

2 Figuri şi tabele icircn prezentări orale

3 Figuri şi tabele icircn postere

4 Text scris sau incluse icircn text

5 Site-uri de WEB

Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor

Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie

Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele

exprimacircnd exact ceea ce acestea exprimă

Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate

anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel

să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se

acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca

mai sus sugestive sunt formatele simple şi puţin icircncărcate

Dacă nu există reguli impuse se respectă

1 Mesaj simplu fără falsificarea datelor

2 De obicei este necesar atacirct tabelul cacirct şi graficul

3 Să fie simplu şi clar

Tabele

Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile

coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică

elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de

1 Se folosesc doar linii orizontale

2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn

evidenţi prin linie de separare (Tabelul 4)

Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland

Noua Zeelandă)

(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)

47

3 Numerele sunt aliniate icircn funcţie de virgulă

4 Indicii statistici sunt explicaţi sub tabel

5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană

6 Abrevierile pot fi folosite

7 Numărul de zecimale trebuie limitat la maxim două

8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel

9 Plasarea legendei este obligatorie sub tabel

10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)

Icircn cazul prezentărilor orale sau a posterelor este indicat ca

1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării

2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte

3 Folosirea de simboluri este permisă

Clasificarea tabelelor

Tabelele se clasifică după

i) conţinut

bull cu distribuţii de frecvenţe

bull de clase de frecvenţe

bull de contingenţă

ii) structura

bull cu doua coloane

bull cu subclasificări

bull ldquomasterrdquo

Tabele ce conţin distribuţii de frecvenţe

O modalitate comodă de a prezenta o mulţime de date brute este

1 Se ordonează datele in ordine crescătoare

2 Se determine frecvenţa fiecărei valori

3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane

(Tabelul 5)

Tabelul 5 Distribuţii de frecvenţă absolută

48

Tabelul claselor de frecvenţe

1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă

2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)

Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)

Tabele de contingenţă

1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a

tabelelor de contingenţă

2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a

combinaţiilor de perechi ordonate de valori

3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre

a factor de risc si

b starea sănătăţii

4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)

5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)

Tabelul 7 Tabel de contingenţă 2 x 2

49

Grafice

Există două categorii de moduri grafice sub care se pot prezenta datele

1 Ilustraţii şi fotografii

2 Grafice

1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă

pentru lucrare

2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit

Putem vorbi despre mai multe tipuri de grafice

bull Grafice pentru reprezentarea datelor cantitative

1048707 Grafic cartezian (X Y)

1048707 Histograma

1048707 Poligonul de frecvenţe

1048707 Diagrama bdquoscatterrdquo

bull Grafice pentru reprezentarea datelor calitative

1048707 Grafic cu bare

1048707 Diagrama tip bdquoboxplotrdquo

1048707 Diagrama bdquopierdquo

1048707 Cartograma

Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi

dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)

Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)

Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie

Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)

Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)

50

Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir

de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele

două variabile studiate (Figura 6)

Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2

(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2

rămacircne aproximativ constantă)

Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea

comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea

comparativă a mai multor variabile

Figura 7 Grafic calitativ cu bare

51

Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo

Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două

posibilităţi reprezentate grafic este mai frecventă (Figura 8)

Figura 8 Reprezentare tip bdquopierdquo

Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli

sau a oricărui element comparativ Se foloseşte de epidemiologi

Rezultate

Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare

Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o

manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu

explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția

bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la

ilustraţii tabele grafice

Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi

nici rezultatele care invalidează eventual ipoteza

Discuţii

Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd

cultura ştiinţifică şi inteligenţa autorilor

Acest capitol răspunde la trei obiective

Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia

calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de

selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează

rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv

52

este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn

care a fost abordată problema fără a face o revistă a literaturii

Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea

rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul

Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor

afirmaţii nesusţinute de conţinutul lucrării

Concluzii

Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate

să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie

Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de

concluzii va scădea valoarea lucrării

Bibliografia (lista referinţelor citarea icircn text)

Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn

lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente

Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli

- să conţină cele mai importante şi recente lucrări

- să includă numai lucrări publicate

- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate

Bibliografie

Elisabeta Jaba ndash Statistică Ed Economică 1998

Mihai Ţarcă ndash Statistică volI Ed UAIC 1979

Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale

Ed University Press 2009

Sorana Daniela Bolboacă ndash Metodologia cercetării curs

53

Page 39: cercetarea medicala - metodologie

Indicatori

Rata de incidenţă

Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă

icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii

Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o

perioadă de timp

Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de

timp x

Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei

susceptibili de a dezvolta icircmbolnăvirea studiată

Numitorul poate fi

bull Numărul mediu al populaţiei icircn perioada de timp studiată

bull Mărimea populaţiei icircn mijlocul perioadei de studiu

bull Mărimea populaţiei la icircnceputul studiului

Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă

Este obligatorie menţionarea perioadei de timp

Prevalenţa

Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la

un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă

schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa

momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)

39

Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include

numai cazuri noi respectiv include cazuri noi şi vechi

Rata de atac

Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este

folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp

raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori

Rata persoană-timp

Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din

momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte

migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost

observate

Riscul relativ (RR)

Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment

legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele

prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două

grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la

bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la

bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai

mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo

Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2

Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn

cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă

(Tabelul 1)

Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR

Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la

neexpuşi

40

Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de

culegere a datelor

Odds ratio (OR)

Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin

raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general

studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)

Tabelul 2 Tabelul 2 x 2 pentru calcularea OR

Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală

Rate de mortalitate

Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp

specificată Există mai multe tipuri de rate de mortalitate

o Mortalitate specifică pe sex

o Mortalitate specifică pe rasă

o Mortalitate specifică pe boală

o Mortalitate neonatală

o Mortalitate postneonatală

o Mortalitate infantilă

o Mortalitate maternă

Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP

41

Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de

viaţă şi vacircrsta la care survine decesul dacă este prematur

Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu

Ani de viaţă pierduţi datorat dizabilităţii

Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt

utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru

cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite

grupuri

Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de

risc şi o boală se folosesc riscul relativ şi odds ratio

35 Analiza şi interpretarea datelor

După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date

trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul

Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor

colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului

studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu

plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde

prezenţa biostatisticianului este necesară

Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu

elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat

iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului

iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate

depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori

testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere

clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza

Interpretarea rezultatelor statistice

Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne

motive (număr mic de date) acceptarea ei să fie falsă

Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine

gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia

ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument

de decizie Intervalul de confidenţă

42

Interpretarea statistica ne interpretarea clinică

Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă

Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice

obţinute pe eşantionul studiat

Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare

Ce interpretăm Rezultatele

personale obţinute icircn urma studiului

care au fost prezentate icircn secţiunea bdquoRezultaterdquo

Explicăm rezultatele obţinute

Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale

Interpretarea trebuie să se realizeze icircn

lumina limitelor studiului

contextul cultural social şi educaţional al locului unde s-a realizat cercetarea

contextul a ceea ce se cunoaşte din literatura de specialitate

Interpretăm doar rezultatele personale obţinute icircn urma studiului

Interpretarea statistică nu este tot una cu interpretarea clinică

Interpretarea statistică este importantă

Interpretarea clinică este foarte importantă

Intervalul de confidenţă

Media calculată pe baza unui eşantion nu va echivala media populaţiei

Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului

Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a

populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a

populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)

pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru

orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare

dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de

confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de

date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de

5

Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel

Dacă valoarea p este mică

Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare

aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o

medie diferită Diferenţa este semnificativă dpdv statistic

43

Icircn continuare

Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa

reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică

pentru a fi interesante din punct de vedere ştiinţific

Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC

oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care

este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a

obţine o concluzie clară

Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o

diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că

datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din

punct de vedere ştiinţific

Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul

detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat

Erorile studiilor medicale

Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura

anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară

caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea

asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri

legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias

Erorile potenţiale icircn studiile epidemiologice

1 Erori icircntacircmplătoare

2 Erori sistematice

3 Confuzia

4 Validitatea

1 Erori icircntacircmplătoare

Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a

parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel

de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot

fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii

(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor

de măsură (eroarea de măsurare)

44

2 Erori sistematice

Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate

care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu

acurateţe mare Acurateţea nu este afectată de mărimea eşantionului

Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de

experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea

dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus

şi greu de cuantificat (consum de alcool personalitate etc)

Principalele tipuri de erori din această categorie sunt

bull Biasul de selecţie

bull Biasul de informaţie

Biasul de selecţie

Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul

trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion

inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale

persoanelor incluse

Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se

ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia

Biasul de informaţie

Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de

instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze

expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere

nesemnificativă sau chiar să nu şi-o amintească de loc

3 Confuzia

Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune

prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este

cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă

de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte

important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor

protector

4 Validitatea

Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă

Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte

estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional

Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă

45

conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se

demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)

Validitatea externă se poate realiza numai dacă studiul este valid intern

Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii

studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de

studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt

laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi

validă din punct de vedere intern)

3 6 Prezentarea rezultatelor

După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite

Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor

icircntr-o formă bdquodigerabilărdquo este necesară

Scopul prezentării datelor

1 Transmiterea concluziilor studiului

a Datele corecte şi importante merită comunicate

b Datele trebuie să confirme sau să infirme ipoteza studiului

c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală

2 Acordarea posibilităţii altor cercetători să aprecieze studiul

a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti

b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor

prezentate

Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru

fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie

statistică

Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de

valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras

(Tabel 3)

Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)

46

Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct

numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor

precum şi prezentarea acestora sub formă inteligibilă

Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care

convin cercetătorului

Prezentarea datelor se poate face

1 Figuri şi tabele icircn articole scrise

2 Figuri şi tabele icircn prezentări orale

3 Figuri şi tabele icircn postere

4 Text scris sau incluse icircn text

5 Site-uri de WEB

Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor

Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie

Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele

exprimacircnd exact ceea ce acestea exprimă

Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate

anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel

să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se

acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca

mai sus sugestive sunt formatele simple şi puţin icircncărcate

Dacă nu există reguli impuse se respectă

1 Mesaj simplu fără falsificarea datelor

2 De obicei este necesar atacirct tabelul cacirct şi graficul

3 Să fie simplu şi clar

Tabele

Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile

coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică

elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de

1 Se folosesc doar linii orizontale

2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn

evidenţi prin linie de separare (Tabelul 4)

Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland

Noua Zeelandă)

(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)

47

3 Numerele sunt aliniate icircn funcţie de virgulă

4 Indicii statistici sunt explicaţi sub tabel

5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană

6 Abrevierile pot fi folosite

7 Numărul de zecimale trebuie limitat la maxim două

8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel

9 Plasarea legendei este obligatorie sub tabel

10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)

Icircn cazul prezentărilor orale sau a posterelor este indicat ca

1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării

2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte

3 Folosirea de simboluri este permisă

Clasificarea tabelelor

Tabelele se clasifică după

i) conţinut

bull cu distribuţii de frecvenţe

bull de clase de frecvenţe

bull de contingenţă

ii) structura

bull cu doua coloane

bull cu subclasificări

bull ldquomasterrdquo

Tabele ce conţin distribuţii de frecvenţe

O modalitate comodă de a prezenta o mulţime de date brute este

1 Se ordonează datele in ordine crescătoare

2 Se determine frecvenţa fiecărei valori

3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane

(Tabelul 5)

Tabelul 5 Distribuţii de frecvenţă absolută

48

Tabelul claselor de frecvenţe

1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă

2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)

Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)

Tabele de contingenţă

1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a

tabelelor de contingenţă

2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a

combinaţiilor de perechi ordonate de valori

3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre

a factor de risc si

b starea sănătăţii

4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)

5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)

Tabelul 7 Tabel de contingenţă 2 x 2

49

Grafice

Există două categorii de moduri grafice sub care se pot prezenta datele

1 Ilustraţii şi fotografii

2 Grafice

1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă

pentru lucrare

2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit

Putem vorbi despre mai multe tipuri de grafice

bull Grafice pentru reprezentarea datelor cantitative

1048707 Grafic cartezian (X Y)

1048707 Histograma

1048707 Poligonul de frecvenţe

1048707 Diagrama bdquoscatterrdquo

bull Grafice pentru reprezentarea datelor calitative

1048707 Grafic cu bare

1048707 Diagrama tip bdquoboxplotrdquo

1048707 Diagrama bdquopierdquo

1048707 Cartograma

Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi

dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)

Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)

Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie

Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)

Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)

50

Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir

de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele

două variabile studiate (Figura 6)

Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2

(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2

rămacircne aproximativ constantă)

Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea

comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea

comparativă a mai multor variabile

Figura 7 Grafic calitativ cu bare

51

Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo

Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două

posibilităţi reprezentate grafic este mai frecventă (Figura 8)

Figura 8 Reprezentare tip bdquopierdquo

Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli

sau a oricărui element comparativ Se foloseşte de epidemiologi

Rezultate

Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare

Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o

manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu

explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția

bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la

ilustraţii tabele grafice

Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi

nici rezultatele care invalidează eventual ipoteza

Discuţii

Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd

cultura ştiinţifică şi inteligenţa autorilor

Acest capitol răspunde la trei obiective

Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia

calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de

selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează

rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv

52

este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn

care a fost abordată problema fără a face o revistă a literaturii

Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea

rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul

Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor

afirmaţii nesusţinute de conţinutul lucrării

Concluzii

Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate

să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie

Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de

concluzii va scădea valoarea lucrării

Bibliografia (lista referinţelor citarea icircn text)

Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn

lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente

Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli

- să conţină cele mai importante şi recente lucrări

- să includă numai lucrări publicate

- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate

Bibliografie

Elisabeta Jaba ndash Statistică Ed Economică 1998

Mihai Ţarcă ndash Statistică volI Ed UAIC 1979

Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale

Ed University Press 2009

Sorana Daniela Bolboacă ndash Metodologia cercetării curs

53

Page 40: cercetarea medicala - metodologie

Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include

numai cazuri noi respectiv include cazuri noi şi vechi

Rata de atac

Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este

folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp

raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori

Rata persoană-timp

Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din

momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte

migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost

observate

Riscul relativ (RR)

Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment

legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele

prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două

grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la

bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la

bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai

mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo

Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2

Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn

cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă

(Tabelul 1)

Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR

Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la

neexpuşi

40

Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de

culegere a datelor

Odds ratio (OR)

Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin

raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general

studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)

Tabelul 2 Tabelul 2 x 2 pentru calcularea OR

Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală

Rate de mortalitate

Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp

specificată Există mai multe tipuri de rate de mortalitate

o Mortalitate specifică pe sex

o Mortalitate specifică pe rasă

o Mortalitate specifică pe boală

o Mortalitate neonatală

o Mortalitate postneonatală

o Mortalitate infantilă

o Mortalitate maternă

Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP

41

Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de

viaţă şi vacircrsta la care survine decesul dacă este prematur

Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu

Ani de viaţă pierduţi datorat dizabilităţii

Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt

utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru

cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite

grupuri

Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de

risc şi o boală se folosesc riscul relativ şi odds ratio

35 Analiza şi interpretarea datelor

După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date

trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul

Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor

colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului

studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu

plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde

prezenţa biostatisticianului este necesară

Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu

elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat

iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului

iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate

depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori

testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere

clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza

Interpretarea rezultatelor statistice

Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne

motive (număr mic de date) acceptarea ei să fie falsă

Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine

gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia

ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument

de decizie Intervalul de confidenţă

42

Interpretarea statistica ne interpretarea clinică

Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă

Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice

obţinute pe eşantionul studiat

Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare

Ce interpretăm Rezultatele

personale obţinute icircn urma studiului

care au fost prezentate icircn secţiunea bdquoRezultaterdquo

Explicăm rezultatele obţinute

Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale

Interpretarea trebuie să se realizeze icircn

lumina limitelor studiului

contextul cultural social şi educaţional al locului unde s-a realizat cercetarea

contextul a ceea ce se cunoaşte din literatura de specialitate

Interpretăm doar rezultatele personale obţinute icircn urma studiului

Interpretarea statistică nu este tot una cu interpretarea clinică

Interpretarea statistică este importantă

Interpretarea clinică este foarte importantă

Intervalul de confidenţă

Media calculată pe baza unui eşantion nu va echivala media populaţiei

Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului

Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a

populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a

populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)

pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru

orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare

dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de

confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de

date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de

5

Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel

Dacă valoarea p este mică

Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare

aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o

medie diferită Diferenţa este semnificativă dpdv statistic

43

Icircn continuare

Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa

reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică

pentru a fi interesante din punct de vedere ştiinţific

Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC

oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care

este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a

obţine o concluzie clară

Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o

diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că

datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din

punct de vedere ştiinţific

Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul

detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat

Erorile studiilor medicale

Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura

anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară

caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea

asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri

legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias

Erorile potenţiale icircn studiile epidemiologice

1 Erori icircntacircmplătoare

2 Erori sistematice

3 Confuzia

4 Validitatea

1 Erori icircntacircmplătoare

Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a

parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel

de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot

fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii

(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor

de măsură (eroarea de măsurare)

44

2 Erori sistematice

Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate

care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu

acurateţe mare Acurateţea nu este afectată de mărimea eşantionului

Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de

experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea

dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus

şi greu de cuantificat (consum de alcool personalitate etc)

Principalele tipuri de erori din această categorie sunt

bull Biasul de selecţie

bull Biasul de informaţie

Biasul de selecţie

Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul

trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion

inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale

persoanelor incluse

Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se

ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia

Biasul de informaţie

Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de

instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze

expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere

nesemnificativă sau chiar să nu şi-o amintească de loc

3 Confuzia

Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune

prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este

cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă

de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte

important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor

protector

4 Validitatea

Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă

Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte

estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional

Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă

45

conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se

demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)

Validitatea externă se poate realiza numai dacă studiul este valid intern

Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii

studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de

studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt

laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi

validă din punct de vedere intern)

3 6 Prezentarea rezultatelor

După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite

Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor

icircntr-o formă bdquodigerabilărdquo este necesară

Scopul prezentării datelor

1 Transmiterea concluziilor studiului

a Datele corecte şi importante merită comunicate

b Datele trebuie să confirme sau să infirme ipoteza studiului

c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală

2 Acordarea posibilităţii altor cercetători să aprecieze studiul

a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti

b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor

prezentate

Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru

fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie

statistică

Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de

valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras

(Tabel 3)

Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)

46

Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct

numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor

precum şi prezentarea acestora sub formă inteligibilă

Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care

convin cercetătorului

Prezentarea datelor se poate face

1 Figuri şi tabele icircn articole scrise

2 Figuri şi tabele icircn prezentări orale

3 Figuri şi tabele icircn postere

4 Text scris sau incluse icircn text

5 Site-uri de WEB

Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor

Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie

Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele

exprimacircnd exact ceea ce acestea exprimă

Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate

anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel

să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se

acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca

mai sus sugestive sunt formatele simple şi puţin icircncărcate

Dacă nu există reguli impuse se respectă

1 Mesaj simplu fără falsificarea datelor

2 De obicei este necesar atacirct tabelul cacirct şi graficul

3 Să fie simplu şi clar

Tabele

Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile

coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică

elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de

1 Se folosesc doar linii orizontale

2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn

evidenţi prin linie de separare (Tabelul 4)

Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland

Noua Zeelandă)

(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)

47

3 Numerele sunt aliniate icircn funcţie de virgulă

4 Indicii statistici sunt explicaţi sub tabel

5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană

6 Abrevierile pot fi folosite

7 Numărul de zecimale trebuie limitat la maxim două

8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel

9 Plasarea legendei este obligatorie sub tabel

10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)

Icircn cazul prezentărilor orale sau a posterelor este indicat ca

1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării

2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte

3 Folosirea de simboluri este permisă

Clasificarea tabelelor

Tabelele se clasifică după

i) conţinut

bull cu distribuţii de frecvenţe

bull de clase de frecvenţe

bull de contingenţă

ii) structura

bull cu doua coloane

bull cu subclasificări

bull ldquomasterrdquo

Tabele ce conţin distribuţii de frecvenţe

O modalitate comodă de a prezenta o mulţime de date brute este

1 Se ordonează datele in ordine crescătoare

2 Se determine frecvenţa fiecărei valori

3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane

(Tabelul 5)

Tabelul 5 Distribuţii de frecvenţă absolută

48

Tabelul claselor de frecvenţe

1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă

2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)

Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)

Tabele de contingenţă

1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a

tabelelor de contingenţă

2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a

combinaţiilor de perechi ordonate de valori

3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre

a factor de risc si

b starea sănătăţii

4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)

5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)

Tabelul 7 Tabel de contingenţă 2 x 2

49

Grafice

Există două categorii de moduri grafice sub care se pot prezenta datele

1 Ilustraţii şi fotografii

2 Grafice

1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă

pentru lucrare

2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit

Putem vorbi despre mai multe tipuri de grafice

bull Grafice pentru reprezentarea datelor cantitative

1048707 Grafic cartezian (X Y)

1048707 Histograma

1048707 Poligonul de frecvenţe

1048707 Diagrama bdquoscatterrdquo

bull Grafice pentru reprezentarea datelor calitative

1048707 Grafic cu bare

1048707 Diagrama tip bdquoboxplotrdquo

1048707 Diagrama bdquopierdquo

1048707 Cartograma

Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi

dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)

Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)

Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie

Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)

Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)

50

Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir

de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele

două variabile studiate (Figura 6)

Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2

(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2

rămacircne aproximativ constantă)

Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea

comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea

comparativă a mai multor variabile

Figura 7 Grafic calitativ cu bare

51

Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo

Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două

posibilităţi reprezentate grafic este mai frecventă (Figura 8)

Figura 8 Reprezentare tip bdquopierdquo

Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli

sau a oricărui element comparativ Se foloseşte de epidemiologi

Rezultate

Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare

Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o

manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu

explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția

bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la

ilustraţii tabele grafice

Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi

nici rezultatele care invalidează eventual ipoteza

Discuţii

Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd

cultura ştiinţifică şi inteligenţa autorilor

Acest capitol răspunde la trei obiective

Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia

calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de

selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează

rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv

52

este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn

care a fost abordată problema fără a face o revistă a literaturii

Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea

rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul

Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor

afirmaţii nesusţinute de conţinutul lucrării

Concluzii

Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate

să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie

Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de

concluzii va scădea valoarea lucrării

Bibliografia (lista referinţelor citarea icircn text)

Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn

lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente

Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli

- să conţină cele mai importante şi recente lucrări

- să includă numai lucrări publicate

- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate

Bibliografie

Elisabeta Jaba ndash Statistică Ed Economică 1998

Mihai Ţarcă ndash Statistică volI Ed UAIC 1979

Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale

Ed University Press 2009

Sorana Daniela Bolboacă ndash Metodologia cercetării curs

53

Page 41: cercetarea medicala - metodologie

Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de

culegere a datelor

Odds ratio (OR)

Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin

raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general

studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)

Tabelul 2 Tabelul 2 x 2 pentru calcularea OR

Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală

Rate de mortalitate

Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp

specificată Există mai multe tipuri de rate de mortalitate

o Mortalitate specifică pe sex

o Mortalitate specifică pe rasă

o Mortalitate specifică pe boală

o Mortalitate neonatală

o Mortalitate postneonatală

o Mortalitate infantilă

o Mortalitate maternă

Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP

41

Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de

viaţă şi vacircrsta la care survine decesul dacă este prematur

Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu

Ani de viaţă pierduţi datorat dizabilităţii

Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt

utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru

cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite

grupuri

Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de

risc şi o boală se folosesc riscul relativ şi odds ratio

35 Analiza şi interpretarea datelor

După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date

trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul

Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor

colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului

studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu

plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde

prezenţa biostatisticianului este necesară

Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu

elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat

iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului

iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate

depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori

testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere

clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza

Interpretarea rezultatelor statistice

Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne

motive (număr mic de date) acceptarea ei să fie falsă

Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine

gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia

ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument

de decizie Intervalul de confidenţă

42

Interpretarea statistica ne interpretarea clinică

Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă

Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice

obţinute pe eşantionul studiat

Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare

Ce interpretăm Rezultatele

personale obţinute icircn urma studiului

care au fost prezentate icircn secţiunea bdquoRezultaterdquo

Explicăm rezultatele obţinute

Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale

Interpretarea trebuie să se realizeze icircn

lumina limitelor studiului

contextul cultural social şi educaţional al locului unde s-a realizat cercetarea

contextul a ceea ce se cunoaşte din literatura de specialitate

Interpretăm doar rezultatele personale obţinute icircn urma studiului

Interpretarea statistică nu este tot una cu interpretarea clinică

Interpretarea statistică este importantă

Interpretarea clinică este foarte importantă

Intervalul de confidenţă

Media calculată pe baza unui eşantion nu va echivala media populaţiei

Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului

Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a

populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a

populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)

pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru

orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare

dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de

confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de

date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de

5

Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel

Dacă valoarea p este mică

Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare

aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o

medie diferită Diferenţa este semnificativă dpdv statistic

43

Icircn continuare

Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa

reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică

pentru a fi interesante din punct de vedere ştiinţific

Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC

oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care

este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a

obţine o concluzie clară

Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o

diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că

datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din

punct de vedere ştiinţific

Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul

detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat

Erorile studiilor medicale

Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura

anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară

caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea

asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri

legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias

Erorile potenţiale icircn studiile epidemiologice

1 Erori icircntacircmplătoare

2 Erori sistematice

3 Confuzia

4 Validitatea

1 Erori icircntacircmplătoare

Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a

parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel

de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot

fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii

(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor

de măsură (eroarea de măsurare)

44

2 Erori sistematice

Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate

care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu

acurateţe mare Acurateţea nu este afectată de mărimea eşantionului

Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de

experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea

dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus

şi greu de cuantificat (consum de alcool personalitate etc)

Principalele tipuri de erori din această categorie sunt

bull Biasul de selecţie

bull Biasul de informaţie

Biasul de selecţie

Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul

trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion

inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale

persoanelor incluse

Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se

ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia

Biasul de informaţie

Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de

instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze

expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere

nesemnificativă sau chiar să nu şi-o amintească de loc

3 Confuzia

Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune

prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este

cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă

de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte

important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor

protector

4 Validitatea

Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă

Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte

estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional

Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă

45

conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se

demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)

Validitatea externă se poate realiza numai dacă studiul este valid intern

Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii

studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de

studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt

laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi

validă din punct de vedere intern)

3 6 Prezentarea rezultatelor

După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite

Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor

icircntr-o formă bdquodigerabilărdquo este necesară

Scopul prezentării datelor

1 Transmiterea concluziilor studiului

a Datele corecte şi importante merită comunicate

b Datele trebuie să confirme sau să infirme ipoteza studiului

c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală

2 Acordarea posibilităţii altor cercetători să aprecieze studiul

a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti

b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor

prezentate

Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru

fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie

statistică

Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de

valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras

(Tabel 3)

Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)

46

Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct

numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor

precum şi prezentarea acestora sub formă inteligibilă

Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care

convin cercetătorului

Prezentarea datelor se poate face

1 Figuri şi tabele icircn articole scrise

2 Figuri şi tabele icircn prezentări orale

3 Figuri şi tabele icircn postere

4 Text scris sau incluse icircn text

5 Site-uri de WEB

Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor

Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie

Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele

exprimacircnd exact ceea ce acestea exprimă

Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate

anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel

să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se

acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca

mai sus sugestive sunt formatele simple şi puţin icircncărcate

Dacă nu există reguli impuse se respectă

1 Mesaj simplu fără falsificarea datelor

2 De obicei este necesar atacirct tabelul cacirct şi graficul

3 Să fie simplu şi clar

Tabele

Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile

coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică

elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de

1 Se folosesc doar linii orizontale

2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn

evidenţi prin linie de separare (Tabelul 4)

Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland

Noua Zeelandă)

(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)

47

3 Numerele sunt aliniate icircn funcţie de virgulă

4 Indicii statistici sunt explicaţi sub tabel

5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană

6 Abrevierile pot fi folosite

7 Numărul de zecimale trebuie limitat la maxim două

8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel

9 Plasarea legendei este obligatorie sub tabel

10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)

Icircn cazul prezentărilor orale sau a posterelor este indicat ca

1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării

2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte

3 Folosirea de simboluri este permisă

Clasificarea tabelelor

Tabelele se clasifică după

i) conţinut

bull cu distribuţii de frecvenţe

bull de clase de frecvenţe

bull de contingenţă

ii) structura

bull cu doua coloane

bull cu subclasificări

bull ldquomasterrdquo

Tabele ce conţin distribuţii de frecvenţe

O modalitate comodă de a prezenta o mulţime de date brute este

1 Se ordonează datele in ordine crescătoare

2 Se determine frecvenţa fiecărei valori

3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane

(Tabelul 5)

Tabelul 5 Distribuţii de frecvenţă absolută

48

Tabelul claselor de frecvenţe

1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă

2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)

Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)

Tabele de contingenţă

1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a

tabelelor de contingenţă

2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a

combinaţiilor de perechi ordonate de valori

3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre

a factor de risc si

b starea sănătăţii

4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)

5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)

Tabelul 7 Tabel de contingenţă 2 x 2

49

Grafice

Există două categorii de moduri grafice sub care se pot prezenta datele

1 Ilustraţii şi fotografii

2 Grafice

1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă

pentru lucrare

2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit

Putem vorbi despre mai multe tipuri de grafice

bull Grafice pentru reprezentarea datelor cantitative

1048707 Grafic cartezian (X Y)

1048707 Histograma

1048707 Poligonul de frecvenţe

1048707 Diagrama bdquoscatterrdquo

bull Grafice pentru reprezentarea datelor calitative

1048707 Grafic cu bare

1048707 Diagrama tip bdquoboxplotrdquo

1048707 Diagrama bdquopierdquo

1048707 Cartograma

Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi

dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)

Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)

Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie

Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)

Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)

50

Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir

de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele

două variabile studiate (Figura 6)

Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2

(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2

rămacircne aproximativ constantă)

Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea

comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea

comparativă a mai multor variabile

Figura 7 Grafic calitativ cu bare

51

Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo

Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două

posibilităţi reprezentate grafic este mai frecventă (Figura 8)

Figura 8 Reprezentare tip bdquopierdquo

Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli

sau a oricărui element comparativ Se foloseşte de epidemiologi

Rezultate

Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare

Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o

manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu

explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția

bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la

ilustraţii tabele grafice

Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi

nici rezultatele care invalidează eventual ipoteza

Discuţii

Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd

cultura ştiinţifică şi inteligenţa autorilor

Acest capitol răspunde la trei obiective

Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia

calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de

selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează

rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv

52

este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn

care a fost abordată problema fără a face o revistă a literaturii

Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea

rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul

Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor

afirmaţii nesusţinute de conţinutul lucrării

Concluzii

Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate

să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie

Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de

concluzii va scădea valoarea lucrării

Bibliografia (lista referinţelor citarea icircn text)

Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn

lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente

Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli

- să conţină cele mai importante şi recente lucrări

- să includă numai lucrări publicate

- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate

Bibliografie

Elisabeta Jaba ndash Statistică Ed Economică 1998

Mihai Ţarcă ndash Statistică volI Ed UAIC 1979

Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale

Ed University Press 2009

Sorana Daniela Bolboacă ndash Metodologia cercetării curs

53

Page 42: cercetarea medicala - metodologie

Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de

viaţă şi vacircrsta la care survine decesul dacă este prematur

Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu

Ani de viaţă pierduţi datorat dizabilităţii

Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt

utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru

cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite

grupuri

Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de

risc şi o boală se folosesc riscul relativ şi odds ratio

35 Analiza şi interpretarea datelor

După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date

trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul

Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor

colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului

studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu

plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde

prezenţa biostatisticianului este necesară

Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu

elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat

iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului

iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate

depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori

testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere

clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza

Interpretarea rezultatelor statistice

Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne

motive (număr mic de date) acceptarea ei să fie falsă

Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine

gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia

ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument

de decizie Intervalul de confidenţă

42

Interpretarea statistica ne interpretarea clinică

Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă

Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice

obţinute pe eşantionul studiat

Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare

Ce interpretăm Rezultatele

personale obţinute icircn urma studiului

care au fost prezentate icircn secţiunea bdquoRezultaterdquo

Explicăm rezultatele obţinute

Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale

Interpretarea trebuie să se realizeze icircn

lumina limitelor studiului

contextul cultural social şi educaţional al locului unde s-a realizat cercetarea

contextul a ceea ce se cunoaşte din literatura de specialitate

Interpretăm doar rezultatele personale obţinute icircn urma studiului

Interpretarea statistică nu este tot una cu interpretarea clinică

Interpretarea statistică este importantă

Interpretarea clinică este foarte importantă

Intervalul de confidenţă

Media calculată pe baza unui eşantion nu va echivala media populaţiei

Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului

Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a

populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a

populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)

pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru

orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare

dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de

confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de

date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de

5

Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel

Dacă valoarea p este mică

Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare

aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o

medie diferită Diferenţa este semnificativă dpdv statistic

43

Icircn continuare

Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa

reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică

pentru a fi interesante din punct de vedere ştiinţific

Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC

oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care

este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a

obţine o concluzie clară

Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o

diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că

datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din

punct de vedere ştiinţific

Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul

detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat

Erorile studiilor medicale

Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura

anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară

caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea

asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri

legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias

Erorile potenţiale icircn studiile epidemiologice

1 Erori icircntacircmplătoare

2 Erori sistematice

3 Confuzia

4 Validitatea

1 Erori icircntacircmplătoare

Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a

parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel

de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot

fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii

(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor

de măsură (eroarea de măsurare)

44

2 Erori sistematice

Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate

care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu

acurateţe mare Acurateţea nu este afectată de mărimea eşantionului

Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de

experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea

dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus

şi greu de cuantificat (consum de alcool personalitate etc)

Principalele tipuri de erori din această categorie sunt

bull Biasul de selecţie

bull Biasul de informaţie

Biasul de selecţie

Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul

trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion

inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale

persoanelor incluse

Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se

ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia

Biasul de informaţie

Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de

instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze

expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere

nesemnificativă sau chiar să nu şi-o amintească de loc

3 Confuzia

Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune

prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este

cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă

de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte

important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor

protector

4 Validitatea

Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă

Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte

estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional

Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă

45

conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se

demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)

Validitatea externă se poate realiza numai dacă studiul este valid intern

Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii

studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de

studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt

laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi

validă din punct de vedere intern)

3 6 Prezentarea rezultatelor

După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite

Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor

icircntr-o formă bdquodigerabilărdquo este necesară

Scopul prezentării datelor

1 Transmiterea concluziilor studiului

a Datele corecte şi importante merită comunicate

b Datele trebuie să confirme sau să infirme ipoteza studiului

c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală

2 Acordarea posibilităţii altor cercetători să aprecieze studiul

a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti

b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor

prezentate

Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru

fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie

statistică

Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de

valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras

(Tabel 3)

Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)

46

Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct

numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor

precum şi prezentarea acestora sub formă inteligibilă

Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care

convin cercetătorului

Prezentarea datelor se poate face

1 Figuri şi tabele icircn articole scrise

2 Figuri şi tabele icircn prezentări orale

3 Figuri şi tabele icircn postere

4 Text scris sau incluse icircn text

5 Site-uri de WEB

Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor

Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie

Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele

exprimacircnd exact ceea ce acestea exprimă

Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate

anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel

să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se

acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca

mai sus sugestive sunt formatele simple şi puţin icircncărcate

Dacă nu există reguli impuse se respectă

1 Mesaj simplu fără falsificarea datelor

2 De obicei este necesar atacirct tabelul cacirct şi graficul

3 Să fie simplu şi clar

Tabele

Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile

coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică

elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de

1 Se folosesc doar linii orizontale

2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn

evidenţi prin linie de separare (Tabelul 4)

Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland

Noua Zeelandă)

(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)

47

3 Numerele sunt aliniate icircn funcţie de virgulă

4 Indicii statistici sunt explicaţi sub tabel

5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană

6 Abrevierile pot fi folosite

7 Numărul de zecimale trebuie limitat la maxim două

8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel

9 Plasarea legendei este obligatorie sub tabel

10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)

Icircn cazul prezentărilor orale sau a posterelor este indicat ca

1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării

2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte

3 Folosirea de simboluri este permisă

Clasificarea tabelelor

Tabelele se clasifică după

i) conţinut

bull cu distribuţii de frecvenţe

bull de clase de frecvenţe

bull de contingenţă

ii) structura

bull cu doua coloane

bull cu subclasificări

bull ldquomasterrdquo

Tabele ce conţin distribuţii de frecvenţe

O modalitate comodă de a prezenta o mulţime de date brute este

1 Se ordonează datele in ordine crescătoare

2 Se determine frecvenţa fiecărei valori

3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane

(Tabelul 5)

Tabelul 5 Distribuţii de frecvenţă absolută

48

Tabelul claselor de frecvenţe

1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă

2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)

Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)

Tabele de contingenţă

1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a

tabelelor de contingenţă

2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a

combinaţiilor de perechi ordonate de valori

3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre

a factor de risc si

b starea sănătăţii

4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)

5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)

Tabelul 7 Tabel de contingenţă 2 x 2

49

Grafice

Există două categorii de moduri grafice sub care se pot prezenta datele

1 Ilustraţii şi fotografii

2 Grafice

1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă

pentru lucrare

2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit

Putem vorbi despre mai multe tipuri de grafice

bull Grafice pentru reprezentarea datelor cantitative

1048707 Grafic cartezian (X Y)

1048707 Histograma

1048707 Poligonul de frecvenţe

1048707 Diagrama bdquoscatterrdquo

bull Grafice pentru reprezentarea datelor calitative

1048707 Grafic cu bare

1048707 Diagrama tip bdquoboxplotrdquo

1048707 Diagrama bdquopierdquo

1048707 Cartograma

Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi

dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)

Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)

Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie

Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)

Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)

50

Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir

de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele

două variabile studiate (Figura 6)

Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2

(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2

rămacircne aproximativ constantă)

Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea

comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea

comparativă a mai multor variabile

Figura 7 Grafic calitativ cu bare

51

Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo

Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două

posibilităţi reprezentate grafic este mai frecventă (Figura 8)

Figura 8 Reprezentare tip bdquopierdquo

Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli

sau a oricărui element comparativ Se foloseşte de epidemiologi

Rezultate

Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare

Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o

manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu

explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția

bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la

ilustraţii tabele grafice

Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi

nici rezultatele care invalidează eventual ipoteza

Discuţii

Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd

cultura ştiinţifică şi inteligenţa autorilor

Acest capitol răspunde la trei obiective

Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia

calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de

selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează

rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv

52

este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn

care a fost abordată problema fără a face o revistă a literaturii

Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea

rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul

Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor

afirmaţii nesusţinute de conţinutul lucrării

Concluzii

Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate

să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie

Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de

concluzii va scădea valoarea lucrării

Bibliografia (lista referinţelor citarea icircn text)

Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn

lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente

Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli

- să conţină cele mai importante şi recente lucrări

- să includă numai lucrări publicate

- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate

Bibliografie

Elisabeta Jaba ndash Statistică Ed Economică 1998

Mihai Ţarcă ndash Statistică volI Ed UAIC 1979

Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale

Ed University Press 2009

Sorana Daniela Bolboacă ndash Metodologia cercetării curs

53

Page 43: cercetarea medicala - metodologie

Interpretarea statistica ne interpretarea clinică

Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă

Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice

obţinute pe eşantionul studiat

Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare

Ce interpretăm Rezultatele

personale obţinute icircn urma studiului

care au fost prezentate icircn secţiunea bdquoRezultaterdquo

Explicăm rezultatele obţinute

Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale

Interpretarea trebuie să se realizeze icircn

lumina limitelor studiului

contextul cultural social şi educaţional al locului unde s-a realizat cercetarea

contextul a ceea ce se cunoaşte din literatura de specialitate

Interpretăm doar rezultatele personale obţinute icircn urma studiului

Interpretarea statistică nu este tot una cu interpretarea clinică

Interpretarea statistică este importantă

Interpretarea clinică este foarte importantă

Intervalul de confidenţă

Media calculată pe baza unui eşantion nu va echivala media populaţiei

Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului

Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a

populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a

populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)

pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru

orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare

dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de

confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de

date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de

5

Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel

Dacă valoarea p este mică

Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare

aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o

medie diferită Diferenţa este semnificativă dpdv statistic

43

Icircn continuare

Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa

reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică

pentru a fi interesante din punct de vedere ştiinţific

Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC

oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care

este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a

obţine o concluzie clară

Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o

diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că

datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din

punct de vedere ştiinţific

Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul

detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat

Erorile studiilor medicale

Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura

anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară

caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea

asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri

legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias

Erorile potenţiale icircn studiile epidemiologice

1 Erori icircntacircmplătoare

2 Erori sistematice

3 Confuzia

4 Validitatea

1 Erori icircntacircmplătoare

Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a

parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel

de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot

fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii

(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor

de măsură (eroarea de măsurare)

44

2 Erori sistematice

Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate

care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu

acurateţe mare Acurateţea nu este afectată de mărimea eşantionului

Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de

experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea

dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus

şi greu de cuantificat (consum de alcool personalitate etc)

Principalele tipuri de erori din această categorie sunt

bull Biasul de selecţie

bull Biasul de informaţie

Biasul de selecţie

Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul

trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion

inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale

persoanelor incluse

Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se

ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia

Biasul de informaţie

Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de

instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze

expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere

nesemnificativă sau chiar să nu şi-o amintească de loc

3 Confuzia

Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune

prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este

cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă

de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte

important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor

protector

4 Validitatea

Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă

Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte

estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional

Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă

45

conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se

demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)

Validitatea externă se poate realiza numai dacă studiul este valid intern

Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii

studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de

studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt

laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi

validă din punct de vedere intern)

3 6 Prezentarea rezultatelor

După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite

Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor

icircntr-o formă bdquodigerabilărdquo este necesară

Scopul prezentării datelor

1 Transmiterea concluziilor studiului

a Datele corecte şi importante merită comunicate

b Datele trebuie să confirme sau să infirme ipoteza studiului

c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală

2 Acordarea posibilităţii altor cercetători să aprecieze studiul

a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti

b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor

prezentate

Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru

fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie

statistică

Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de

valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras

(Tabel 3)

Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)

46

Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct

numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor

precum şi prezentarea acestora sub formă inteligibilă

Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care

convin cercetătorului

Prezentarea datelor se poate face

1 Figuri şi tabele icircn articole scrise

2 Figuri şi tabele icircn prezentări orale

3 Figuri şi tabele icircn postere

4 Text scris sau incluse icircn text

5 Site-uri de WEB

Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor

Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie

Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele

exprimacircnd exact ceea ce acestea exprimă

Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate

anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel

să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se

acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca

mai sus sugestive sunt formatele simple şi puţin icircncărcate

Dacă nu există reguli impuse se respectă

1 Mesaj simplu fără falsificarea datelor

2 De obicei este necesar atacirct tabelul cacirct şi graficul

3 Să fie simplu şi clar

Tabele

Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile

coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică

elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de

1 Se folosesc doar linii orizontale

2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn

evidenţi prin linie de separare (Tabelul 4)

Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland

Noua Zeelandă)

(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)

47

3 Numerele sunt aliniate icircn funcţie de virgulă

4 Indicii statistici sunt explicaţi sub tabel

5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană

6 Abrevierile pot fi folosite

7 Numărul de zecimale trebuie limitat la maxim două

8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel

9 Plasarea legendei este obligatorie sub tabel

10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)

Icircn cazul prezentărilor orale sau a posterelor este indicat ca

1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării

2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte

3 Folosirea de simboluri este permisă

Clasificarea tabelelor

Tabelele se clasifică după

i) conţinut

bull cu distribuţii de frecvenţe

bull de clase de frecvenţe

bull de contingenţă

ii) structura

bull cu doua coloane

bull cu subclasificări

bull ldquomasterrdquo

Tabele ce conţin distribuţii de frecvenţe

O modalitate comodă de a prezenta o mulţime de date brute este

1 Se ordonează datele in ordine crescătoare

2 Se determine frecvenţa fiecărei valori

3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane

(Tabelul 5)

Tabelul 5 Distribuţii de frecvenţă absolută

48

Tabelul claselor de frecvenţe

1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă

2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)

Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)

Tabele de contingenţă

1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a

tabelelor de contingenţă

2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a

combinaţiilor de perechi ordonate de valori

3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre

a factor de risc si

b starea sănătăţii

4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)

5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)

Tabelul 7 Tabel de contingenţă 2 x 2

49

Grafice

Există două categorii de moduri grafice sub care se pot prezenta datele

1 Ilustraţii şi fotografii

2 Grafice

1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă

pentru lucrare

2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit

Putem vorbi despre mai multe tipuri de grafice

bull Grafice pentru reprezentarea datelor cantitative

1048707 Grafic cartezian (X Y)

1048707 Histograma

1048707 Poligonul de frecvenţe

1048707 Diagrama bdquoscatterrdquo

bull Grafice pentru reprezentarea datelor calitative

1048707 Grafic cu bare

1048707 Diagrama tip bdquoboxplotrdquo

1048707 Diagrama bdquopierdquo

1048707 Cartograma

Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi

dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)

Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)

Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie

Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)

Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)

50

Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir

de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele

două variabile studiate (Figura 6)

Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2

(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2

rămacircne aproximativ constantă)

Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea

comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea

comparativă a mai multor variabile

Figura 7 Grafic calitativ cu bare

51

Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo

Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două

posibilităţi reprezentate grafic este mai frecventă (Figura 8)

Figura 8 Reprezentare tip bdquopierdquo

Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli

sau a oricărui element comparativ Se foloseşte de epidemiologi

Rezultate

Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare

Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o

manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu

explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția

bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la

ilustraţii tabele grafice

Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi

nici rezultatele care invalidează eventual ipoteza

Discuţii

Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd

cultura ştiinţifică şi inteligenţa autorilor

Acest capitol răspunde la trei obiective

Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia

calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de

selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează

rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv

52

este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn

care a fost abordată problema fără a face o revistă a literaturii

Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea

rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul

Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor

afirmaţii nesusţinute de conţinutul lucrării

Concluzii

Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate

să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie

Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de

concluzii va scădea valoarea lucrării

Bibliografia (lista referinţelor citarea icircn text)

Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn

lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente

Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli

- să conţină cele mai importante şi recente lucrări

- să includă numai lucrări publicate

- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate

Bibliografie

Elisabeta Jaba ndash Statistică Ed Economică 1998

Mihai Ţarcă ndash Statistică volI Ed UAIC 1979

Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale

Ed University Press 2009

Sorana Daniela Bolboacă ndash Metodologia cercetării curs

53

Page 44: cercetarea medicala - metodologie

Icircn continuare

Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa

reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică

pentru a fi interesante din punct de vedere ştiinţific

Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC

oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care

este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a

obţine o concluzie clară

Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o

diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că

datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din

punct de vedere ştiinţific

Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul

detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat

Erorile studiilor medicale

Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura

anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară

caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea

asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri

legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias

Erorile potenţiale icircn studiile epidemiologice

1 Erori icircntacircmplătoare

2 Erori sistematice

3 Confuzia

4 Validitatea

1 Erori icircntacircmplătoare

Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a

parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel

de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot

fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii

(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor

de măsură (eroarea de măsurare)

44

2 Erori sistematice

Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate

care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu

acurateţe mare Acurateţea nu este afectată de mărimea eşantionului

Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de

experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea

dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus

şi greu de cuantificat (consum de alcool personalitate etc)

Principalele tipuri de erori din această categorie sunt

bull Biasul de selecţie

bull Biasul de informaţie

Biasul de selecţie

Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul

trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion

inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale

persoanelor incluse

Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se

ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia

Biasul de informaţie

Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de

instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze

expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere

nesemnificativă sau chiar să nu şi-o amintească de loc

3 Confuzia

Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune

prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este

cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă

de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte

important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor

protector

4 Validitatea

Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă

Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte

estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional

Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă

45

conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se

demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)

Validitatea externă se poate realiza numai dacă studiul este valid intern

Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii

studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de

studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt

laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi

validă din punct de vedere intern)

3 6 Prezentarea rezultatelor

După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite

Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor

icircntr-o formă bdquodigerabilărdquo este necesară

Scopul prezentării datelor

1 Transmiterea concluziilor studiului

a Datele corecte şi importante merită comunicate

b Datele trebuie să confirme sau să infirme ipoteza studiului

c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală

2 Acordarea posibilităţii altor cercetători să aprecieze studiul

a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti

b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor

prezentate

Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru

fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie

statistică

Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de

valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras

(Tabel 3)

Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)

46

Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct

numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor

precum şi prezentarea acestora sub formă inteligibilă

Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care

convin cercetătorului

Prezentarea datelor se poate face

1 Figuri şi tabele icircn articole scrise

2 Figuri şi tabele icircn prezentări orale

3 Figuri şi tabele icircn postere

4 Text scris sau incluse icircn text

5 Site-uri de WEB

Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor

Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie

Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele

exprimacircnd exact ceea ce acestea exprimă

Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate

anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel

să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se

acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca

mai sus sugestive sunt formatele simple şi puţin icircncărcate

Dacă nu există reguli impuse se respectă

1 Mesaj simplu fără falsificarea datelor

2 De obicei este necesar atacirct tabelul cacirct şi graficul

3 Să fie simplu şi clar

Tabele

Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile

coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică

elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de

1 Se folosesc doar linii orizontale

2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn

evidenţi prin linie de separare (Tabelul 4)

Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland

Noua Zeelandă)

(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)

47

3 Numerele sunt aliniate icircn funcţie de virgulă

4 Indicii statistici sunt explicaţi sub tabel

5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană

6 Abrevierile pot fi folosite

7 Numărul de zecimale trebuie limitat la maxim două

8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel

9 Plasarea legendei este obligatorie sub tabel

10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)

Icircn cazul prezentărilor orale sau a posterelor este indicat ca

1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării

2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte

3 Folosirea de simboluri este permisă

Clasificarea tabelelor

Tabelele se clasifică după

i) conţinut

bull cu distribuţii de frecvenţe

bull de clase de frecvenţe

bull de contingenţă

ii) structura

bull cu doua coloane

bull cu subclasificări

bull ldquomasterrdquo

Tabele ce conţin distribuţii de frecvenţe

O modalitate comodă de a prezenta o mulţime de date brute este

1 Se ordonează datele in ordine crescătoare

2 Se determine frecvenţa fiecărei valori

3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane

(Tabelul 5)

Tabelul 5 Distribuţii de frecvenţă absolută

48

Tabelul claselor de frecvenţe

1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă

2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)

Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)

Tabele de contingenţă

1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a

tabelelor de contingenţă

2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a

combinaţiilor de perechi ordonate de valori

3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre

a factor de risc si

b starea sănătăţii

4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)

5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)

Tabelul 7 Tabel de contingenţă 2 x 2

49

Grafice

Există două categorii de moduri grafice sub care se pot prezenta datele

1 Ilustraţii şi fotografii

2 Grafice

1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă

pentru lucrare

2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit

Putem vorbi despre mai multe tipuri de grafice

bull Grafice pentru reprezentarea datelor cantitative

1048707 Grafic cartezian (X Y)

1048707 Histograma

1048707 Poligonul de frecvenţe

1048707 Diagrama bdquoscatterrdquo

bull Grafice pentru reprezentarea datelor calitative

1048707 Grafic cu bare

1048707 Diagrama tip bdquoboxplotrdquo

1048707 Diagrama bdquopierdquo

1048707 Cartograma

Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi

dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)

Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)

Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie

Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)

Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)

50

Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir

de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele

două variabile studiate (Figura 6)

Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2

(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2

rămacircne aproximativ constantă)

Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea

comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea

comparativă a mai multor variabile

Figura 7 Grafic calitativ cu bare

51

Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo

Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două

posibilităţi reprezentate grafic este mai frecventă (Figura 8)

Figura 8 Reprezentare tip bdquopierdquo

Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli

sau a oricărui element comparativ Se foloseşte de epidemiologi

Rezultate

Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare

Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o

manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu

explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția

bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la

ilustraţii tabele grafice

Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi

nici rezultatele care invalidează eventual ipoteza

Discuţii

Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd

cultura ştiinţifică şi inteligenţa autorilor

Acest capitol răspunde la trei obiective

Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia

calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de

selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează

rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv

52

este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn

care a fost abordată problema fără a face o revistă a literaturii

Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea

rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul

Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor

afirmaţii nesusţinute de conţinutul lucrării

Concluzii

Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate

să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie

Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de

concluzii va scădea valoarea lucrării

Bibliografia (lista referinţelor citarea icircn text)

Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn

lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente

Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli

- să conţină cele mai importante şi recente lucrări

- să includă numai lucrări publicate

- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate

Bibliografie

Elisabeta Jaba ndash Statistică Ed Economică 1998

Mihai Ţarcă ndash Statistică volI Ed UAIC 1979

Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale

Ed University Press 2009

Sorana Daniela Bolboacă ndash Metodologia cercetării curs

53

Page 45: cercetarea medicala - metodologie

2 Erori sistematice

Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate

care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu

acurateţe mare Acurateţea nu este afectată de mărimea eşantionului

Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de

experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea

dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus

şi greu de cuantificat (consum de alcool personalitate etc)

Principalele tipuri de erori din această categorie sunt

bull Biasul de selecţie

bull Biasul de informaţie

Biasul de selecţie

Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul

trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion

inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale

persoanelor incluse

Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se

ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia

Biasul de informaţie

Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de

instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze

expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere

nesemnificativă sau chiar să nu şi-o amintească de loc

3 Confuzia

Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune

prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este

cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă

de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte

important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor

protector

4 Validitatea

Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă

Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte

estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional

Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă

45

conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se

demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)

Validitatea externă se poate realiza numai dacă studiul este valid intern

Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii

studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de

studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt

laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi

validă din punct de vedere intern)

3 6 Prezentarea rezultatelor

După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite

Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor

icircntr-o formă bdquodigerabilărdquo este necesară

Scopul prezentării datelor

1 Transmiterea concluziilor studiului

a Datele corecte şi importante merită comunicate

b Datele trebuie să confirme sau să infirme ipoteza studiului

c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală

2 Acordarea posibilităţii altor cercetători să aprecieze studiul

a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti

b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor

prezentate

Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru

fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie

statistică

Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de

valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras

(Tabel 3)

Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)

46

Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct

numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor

precum şi prezentarea acestora sub formă inteligibilă

Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care

convin cercetătorului

Prezentarea datelor se poate face

1 Figuri şi tabele icircn articole scrise

2 Figuri şi tabele icircn prezentări orale

3 Figuri şi tabele icircn postere

4 Text scris sau incluse icircn text

5 Site-uri de WEB

Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor

Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie

Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele

exprimacircnd exact ceea ce acestea exprimă

Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate

anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel

să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se

acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca

mai sus sugestive sunt formatele simple şi puţin icircncărcate

Dacă nu există reguli impuse se respectă

1 Mesaj simplu fără falsificarea datelor

2 De obicei este necesar atacirct tabelul cacirct şi graficul

3 Să fie simplu şi clar

Tabele

Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile

coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică

elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de

1 Se folosesc doar linii orizontale

2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn

evidenţi prin linie de separare (Tabelul 4)

Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland

Noua Zeelandă)

(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)

47

3 Numerele sunt aliniate icircn funcţie de virgulă

4 Indicii statistici sunt explicaţi sub tabel

5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană

6 Abrevierile pot fi folosite

7 Numărul de zecimale trebuie limitat la maxim două

8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel

9 Plasarea legendei este obligatorie sub tabel

10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)

Icircn cazul prezentărilor orale sau a posterelor este indicat ca

1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării

2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte

3 Folosirea de simboluri este permisă

Clasificarea tabelelor

Tabelele se clasifică după

i) conţinut

bull cu distribuţii de frecvenţe

bull de clase de frecvenţe

bull de contingenţă

ii) structura

bull cu doua coloane

bull cu subclasificări

bull ldquomasterrdquo

Tabele ce conţin distribuţii de frecvenţe

O modalitate comodă de a prezenta o mulţime de date brute este

1 Se ordonează datele in ordine crescătoare

2 Se determine frecvenţa fiecărei valori

3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane

(Tabelul 5)

Tabelul 5 Distribuţii de frecvenţă absolută

48

Tabelul claselor de frecvenţe

1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă

2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)

Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)

Tabele de contingenţă

1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a

tabelelor de contingenţă

2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a

combinaţiilor de perechi ordonate de valori

3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre

a factor de risc si

b starea sănătăţii

4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)

5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)

Tabelul 7 Tabel de contingenţă 2 x 2

49

Grafice

Există două categorii de moduri grafice sub care se pot prezenta datele

1 Ilustraţii şi fotografii

2 Grafice

1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă

pentru lucrare

2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit

Putem vorbi despre mai multe tipuri de grafice

bull Grafice pentru reprezentarea datelor cantitative

1048707 Grafic cartezian (X Y)

1048707 Histograma

1048707 Poligonul de frecvenţe

1048707 Diagrama bdquoscatterrdquo

bull Grafice pentru reprezentarea datelor calitative

1048707 Grafic cu bare

1048707 Diagrama tip bdquoboxplotrdquo

1048707 Diagrama bdquopierdquo

1048707 Cartograma

Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi

dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)

Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)

Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie

Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)

Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)

50

Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir

de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele

două variabile studiate (Figura 6)

Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2

(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2

rămacircne aproximativ constantă)

Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea

comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea

comparativă a mai multor variabile

Figura 7 Grafic calitativ cu bare

51

Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo

Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două

posibilităţi reprezentate grafic este mai frecventă (Figura 8)

Figura 8 Reprezentare tip bdquopierdquo

Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli

sau a oricărui element comparativ Se foloseşte de epidemiologi

Rezultate

Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare

Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o

manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu

explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția

bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la

ilustraţii tabele grafice

Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi

nici rezultatele care invalidează eventual ipoteza

Discuţii

Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd

cultura ştiinţifică şi inteligenţa autorilor

Acest capitol răspunde la trei obiective

Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia

calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de

selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează

rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv

52

este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn

care a fost abordată problema fără a face o revistă a literaturii

Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea

rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul

Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor

afirmaţii nesusţinute de conţinutul lucrării

Concluzii

Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate

să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie

Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de

concluzii va scădea valoarea lucrării

Bibliografia (lista referinţelor citarea icircn text)

Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn

lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente

Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli

- să conţină cele mai importante şi recente lucrări

- să includă numai lucrări publicate

- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate

Bibliografie

Elisabeta Jaba ndash Statistică Ed Economică 1998

Mihai Ţarcă ndash Statistică volI Ed UAIC 1979

Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale

Ed University Press 2009

Sorana Daniela Bolboacă ndash Metodologia cercetării curs

53

Page 46: cercetarea medicala - metodologie

conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se

demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)

Validitatea externă se poate realiza numai dacă studiul este valid intern

Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii

studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de

studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt

laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi

validă din punct de vedere intern)

3 6 Prezentarea rezultatelor

După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite

Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor

icircntr-o formă bdquodigerabilărdquo este necesară

Scopul prezentării datelor

1 Transmiterea concluziilor studiului

a Datele corecte şi importante merită comunicate

b Datele trebuie să confirme sau să infirme ipoteza studiului

c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală

2 Acordarea posibilităţii altor cercetători să aprecieze studiul

a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti

b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor

prezentate

Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru

fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie

statistică

Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de

valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras

(Tabel 3)

Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)

46

Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct

numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor

precum şi prezentarea acestora sub formă inteligibilă

Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care

convin cercetătorului

Prezentarea datelor se poate face

1 Figuri şi tabele icircn articole scrise

2 Figuri şi tabele icircn prezentări orale

3 Figuri şi tabele icircn postere

4 Text scris sau incluse icircn text

5 Site-uri de WEB

Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor

Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie

Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele

exprimacircnd exact ceea ce acestea exprimă

Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate

anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel

să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se

acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca

mai sus sugestive sunt formatele simple şi puţin icircncărcate

Dacă nu există reguli impuse se respectă

1 Mesaj simplu fără falsificarea datelor

2 De obicei este necesar atacirct tabelul cacirct şi graficul

3 Să fie simplu şi clar

Tabele

Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile

coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică

elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de

1 Se folosesc doar linii orizontale

2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn

evidenţi prin linie de separare (Tabelul 4)

Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland

Noua Zeelandă)

(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)

47

3 Numerele sunt aliniate icircn funcţie de virgulă

4 Indicii statistici sunt explicaţi sub tabel

5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană

6 Abrevierile pot fi folosite

7 Numărul de zecimale trebuie limitat la maxim două

8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel

9 Plasarea legendei este obligatorie sub tabel

10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)

Icircn cazul prezentărilor orale sau a posterelor este indicat ca

1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării

2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte

3 Folosirea de simboluri este permisă

Clasificarea tabelelor

Tabelele se clasifică după

i) conţinut

bull cu distribuţii de frecvenţe

bull de clase de frecvenţe

bull de contingenţă

ii) structura

bull cu doua coloane

bull cu subclasificări

bull ldquomasterrdquo

Tabele ce conţin distribuţii de frecvenţe

O modalitate comodă de a prezenta o mulţime de date brute este

1 Se ordonează datele in ordine crescătoare

2 Se determine frecvenţa fiecărei valori

3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane

(Tabelul 5)

Tabelul 5 Distribuţii de frecvenţă absolută

48

Tabelul claselor de frecvenţe

1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă

2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)

Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)

Tabele de contingenţă

1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a

tabelelor de contingenţă

2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a

combinaţiilor de perechi ordonate de valori

3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre

a factor de risc si

b starea sănătăţii

4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)

5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)

Tabelul 7 Tabel de contingenţă 2 x 2

49

Grafice

Există două categorii de moduri grafice sub care se pot prezenta datele

1 Ilustraţii şi fotografii

2 Grafice

1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă

pentru lucrare

2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit

Putem vorbi despre mai multe tipuri de grafice

bull Grafice pentru reprezentarea datelor cantitative

1048707 Grafic cartezian (X Y)

1048707 Histograma

1048707 Poligonul de frecvenţe

1048707 Diagrama bdquoscatterrdquo

bull Grafice pentru reprezentarea datelor calitative

1048707 Grafic cu bare

1048707 Diagrama tip bdquoboxplotrdquo

1048707 Diagrama bdquopierdquo

1048707 Cartograma

Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi

dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)

Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)

Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie

Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)

Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)

50

Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir

de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele

două variabile studiate (Figura 6)

Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2

(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2

rămacircne aproximativ constantă)

Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea

comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea

comparativă a mai multor variabile

Figura 7 Grafic calitativ cu bare

51

Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo

Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două

posibilităţi reprezentate grafic este mai frecventă (Figura 8)

Figura 8 Reprezentare tip bdquopierdquo

Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli

sau a oricărui element comparativ Se foloseşte de epidemiologi

Rezultate

Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare

Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o

manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu

explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția

bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la

ilustraţii tabele grafice

Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi

nici rezultatele care invalidează eventual ipoteza

Discuţii

Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd

cultura ştiinţifică şi inteligenţa autorilor

Acest capitol răspunde la trei obiective

Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia

calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de

selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează

rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv

52

este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn

care a fost abordată problema fără a face o revistă a literaturii

Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea

rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul

Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor

afirmaţii nesusţinute de conţinutul lucrării

Concluzii

Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate

să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie

Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de

concluzii va scădea valoarea lucrării

Bibliografia (lista referinţelor citarea icircn text)

Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn

lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente

Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli

- să conţină cele mai importante şi recente lucrări

- să includă numai lucrări publicate

- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate

Bibliografie

Elisabeta Jaba ndash Statistică Ed Economică 1998

Mihai Ţarcă ndash Statistică volI Ed UAIC 1979

Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale

Ed University Press 2009

Sorana Daniela Bolboacă ndash Metodologia cercetării curs

53

Page 47: cercetarea medicala - metodologie

Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct

numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor

precum şi prezentarea acestora sub formă inteligibilă

Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care

convin cercetătorului

Prezentarea datelor se poate face

1 Figuri şi tabele icircn articole scrise

2 Figuri şi tabele icircn prezentări orale

3 Figuri şi tabele icircn postere

4 Text scris sau incluse icircn text

5 Site-uri de WEB

Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor

Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie

Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele

exprimacircnd exact ceea ce acestea exprimă

Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate

anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel

să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se

acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca

mai sus sugestive sunt formatele simple şi puţin icircncărcate

Dacă nu există reguli impuse se respectă

1 Mesaj simplu fără falsificarea datelor

2 De obicei este necesar atacirct tabelul cacirct şi graficul

3 Să fie simplu şi clar

Tabele

Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile

coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică

elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de

1 Se folosesc doar linii orizontale

2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn

evidenţi prin linie de separare (Tabelul 4)

Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland

Noua Zeelandă)

(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)

47

3 Numerele sunt aliniate icircn funcţie de virgulă

4 Indicii statistici sunt explicaţi sub tabel

5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană

6 Abrevierile pot fi folosite

7 Numărul de zecimale trebuie limitat la maxim două

8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel

9 Plasarea legendei este obligatorie sub tabel

10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)

Icircn cazul prezentărilor orale sau a posterelor este indicat ca

1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării

2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte

3 Folosirea de simboluri este permisă

Clasificarea tabelelor

Tabelele se clasifică după

i) conţinut

bull cu distribuţii de frecvenţe

bull de clase de frecvenţe

bull de contingenţă

ii) structura

bull cu doua coloane

bull cu subclasificări

bull ldquomasterrdquo

Tabele ce conţin distribuţii de frecvenţe

O modalitate comodă de a prezenta o mulţime de date brute este

1 Se ordonează datele in ordine crescătoare

2 Se determine frecvenţa fiecărei valori

3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane

(Tabelul 5)

Tabelul 5 Distribuţii de frecvenţă absolută

48

Tabelul claselor de frecvenţe

1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă

2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)

Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)

Tabele de contingenţă

1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a

tabelelor de contingenţă

2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a

combinaţiilor de perechi ordonate de valori

3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre

a factor de risc si

b starea sănătăţii

4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)

5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)

Tabelul 7 Tabel de contingenţă 2 x 2

49

Grafice

Există două categorii de moduri grafice sub care se pot prezenta datele

1 Ilustraţii şi fotografii

2 Grafice

1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă

pentru lucrare

2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit

Putem vorbi despre mai multe tipuri de grafice

bull Grafice pentru reprezentarea datelor cantitative

1048707 Grafic cartezian (X Y)

1048707 Histograma

1048707 Poligonul de frecvenţe

1048707 Diagrama bdquoscatterrdquo

bull Grafice pentru reprezentarea datelor calitative

1048707 Grafic cu bare

1048707 Diagrama tip bdquoboxplotrdquo

1048707 Diagrama bdquopierdquo

1048707 Cartograma

Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi

dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)

Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)

Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie

Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)

Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)

50

Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir

de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele

două variabile studiate (Figura 6)

Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2

(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2

rămacircne aproximativ constantă)

Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea

comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea

comparativă a mai multor variabile

Figura 7 Grafic calitativ cu bare

51

Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo

Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două

posibilităţi reprezentate grafic este mai frecventă (Figura 8)

Figura 8 Reprezentare tip bdquopierdquo

Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli

sau a oricărui element comparativ Se foloseşte de epidemiologi

Rezultate

Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare

Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o

manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu

explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția

bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la

ilustraţii tabele grafice

Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi

nici rezultatele care invalidează eventual ipoteza

Discuţii

Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd

cultura ştiinţifică şi inteligenţa autorilor

Acest capitol răspunde la trei obiective

Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia

calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de

selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează

rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv

52

este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn

care a fost abordată problema fără a face o revistă a literaturii

Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea

rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul

Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor

afirmaţii nesusţinute de conţinutul lucrării

Concluzii

Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate

să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie

Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de

concluzii va scădea valoarea lucrării

Bibliografia (lista referinţelor citarea icircn text)

Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn

lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente

Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli

- să conţină cele mai importante şi recente lucrări

- să includă numai lucrări publicate

- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate

Bibliografie

Elisabeta Jaba ndash Statistică Ed Economică 1998

Mihai Ţarcă ndash Statistică volI Ed UAIC 1979

Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale

Ed University Press 2009

Sorana Daniela Bolboacă ndash Metodologia cercetării curs

53

Page 48: cercetarea medicala - metodologie

3 Numerele sunt aliniate icircn funcţie de virgulă

4 Indicii statistici sunt explicaţi sub tabel

5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană

6 Abrevierile pot fi folosite

7 Numărul de zecimale trebuie limitat la maxim două

8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel

9 Plasarea legendei este obligatorie sub tabel

10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)

Icircn cazul prezentărilor orale sau a posterelor este indicat ca

1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării

2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte

3 Folosirea de simboluri este permisă

Clasificarea tabelelor

Tabelele se clasifică după

i) conţinut

bull cu distribuţii de frecvenţe

bull de clase de frecvenţe

bull de contingenţă

ii) structura

bull cu doua coloane

bull cu subclasificări

bull ldquomasterrdquo

Tabele ce conţin distribuţii de frecvenţe

O modalitate comodă de a prezenta o mulţime de date brute este

1 Se ordonează datele in ordine crescătoare

2 Se determine frecvenţa fiecărei valori

3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane

(Tabelul 5)

Tabelul 5 Distribuţii de frecvenţă absolută

48

Tabelul claselor de frecvenţe

1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă

2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)

Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)

Tabele de contingenţă

1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a

tabelelor de contingenţă

2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a

combinaţiilor de perechi ordonate de valori

3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre

a factor de risc si

b starea sănătăţii

4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)

5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)

Tabelul 7 Tabel de contingenţă 2 x 2

49

Grafice

Există două categorii de moduri grafice sub care se pot prezenta datele

1 Ilustraţii şi fotografii

2 Grafice

1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă

pentru lucrare

2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit

Putem vorbi despre mai multe tipuri de grafice

bull Grafice pentru reprezentarea datelor cantitative

1048707 Grafic cartezian (X Y)

1048707 Histograma

1048707 Poligonul de frecvenţe

1048707 Diagrama bdquoscatterrdquo

bull Grafice pentru reprezentarea datelor calitative

1048707 Grafic cu bare

1048707 Diagrama tip bdquoboxplotrdquo

1048707 Diagrama bdquopierdquo

1048707 Cartograma

Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi

dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)

Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)

Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie

Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)

Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)

50

Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir

de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele

două variabile studiate (Figura 6)

Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2

(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2

rămacircne aproximativ constantă)

Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea

comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea

comparativă a mai multor variabile

Figura 7 Grafic calitativ cu bare

51

Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo

Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două

posibilităţi reprezentate grafic este mai frecventă (Figura 8)

Figura 8 Reprezentare tip bdquopierdquo

Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli

sau a oricărui element comparativ Se foloseşte de epidemiologi

Rezultate

Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare

Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o

manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu

explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția

bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la

ilustraţii tabele grafice

Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi

nici rezultatele care invalidează eventual ipoteza

Discuţii

Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd

cultura ştiinţifică şi inteligenţa autorilor

Acest capitol răspunde la trei obiective

Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia

calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de

selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează

rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv

52

este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn

care a fost abordată problema fără a face o revistă a literaturii

Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea

rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul

Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor

afirmaţii nesusţinute de conţinutul lucrării

Concluzii

Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate

să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie

Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de

concluzii va scădea valoarea lucrării

Bibliografia (lista referinţelor citarea icircn text)

Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn

lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente

Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli

- să conţină cele mai importante şi recente lucrări

- să includă numai lucrări publicate

- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate

Bibliografie

Elisabeta Jaba ndash Statistică Ed Economică 1998

Mihai Ţarcă ndash Statistică volI Ed UAIC 1979

Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale

Ed University Press 2009

Sorana Daniela Bolboacă ndash Metodologia cercetării curs

53

Page 49: cercetarea medicala - metodologie

Tabelul claselor de frecvenţe

1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă

2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)

Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)

Tabele de contingenţă

1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a

tabelelor de contingenţă

2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a

combinaţiilor de perechi ordonate de valori

3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre

a factor de risc si

b starea sănătăţii

4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)

5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)

Tabelul 7 Tabel de contingenţă 2 x 2

49

Grafice

Există două categorii de moduri grafice sub care se pot prezenta datele

1 Ilustraţii şi fotografii

2 Grafice

1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă

pentru lucrare

2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit

Putem vorbi despre mai multe tipuri de grafice

bull Grafice pentru reprezentarea datelor cantitative

1048707 Grafic cartezian (X Y)

1048707 Histograma

1048707 Poligonul de frecvenţe

1048707 Diagrama bdquoscatterrdquo

bull Grafice pentru reprezentarea datelor calitative

1048707 Grafic cu bare

1048707 Diagrama tip bdquoboxplotrdquo

1048707 Diagrama bdquopierdquo

1048707 Cartograma

Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi

dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)

Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)

Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie

Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)

Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)

50

Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir

de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele

două variabile studiate (Figura 6)

Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2

(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2

rămacircne aproximativ constantă)

Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea

comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea

comparativă a mai multor variabile

Figura 7 Grafic calitativ cu bare

51

Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo

Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două

posibilităţi reprezentate grafic este mai frecventă (Figura 8)

Figura 8 Reprezentare tip bdquopierdquo

Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli

sau a oricărui element comparativ Se foloseşte de epidemiologi

Rezultate

Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare

Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o

manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu

explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția

bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la

ilustraţii tabele grafice

Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi

nici rezultatele care invalidează eventual ipoteza

Discuţii

Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd

cultura ştiinţifică şi inteligenţa autorilor

Acest capitol răspunde la trei obiective

Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia

calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de

selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează

rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv

52

este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn

care a fost abordată problema fără a face o revistă a literaturii

Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea

rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul

Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor

afirmaţii nesusţinute de conţinutul lucrării

Concluzii

Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate

să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie

Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de

concluzii va scădea valoarea lucrării

Bibliografia (lista referinţelor citarea icircn text)

Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn

lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente

Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli

- să conţină cele mai importante şi recente lucrări

- să includă numai lucrări publicate

- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate

Bibliografie

Elisabeta Jaba ndash Statistică Ed Economică 1998

Mihai Ţarcă ndash Statistică volI Ed UAIC 1979

Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale

Ed University Press 2009

Sorana Daniela Bolboacă ndash Metodologia cercetării curs

53

Page 50: cercetarea medicala - metodologie

Grafice

Există două categorii de moduri grafice sub care se pot prezenta datele

1 Ilustraţii şi fotografii

2 Grafice

1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă

pentru lucrare

2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit

Putem vorbi despre mai multe tipuri de grafice

bull Grafice pentru reprezentarea datelor cantitative

1048707 Grafic cartezian (X Y)

1048707 Histograma

1048707 Poligonul de frecvenţe

1048707 Diagrama bdquoscatterrdquo

bull Grafice pentru reprezentarea datelor calitative

1048707 Grafic cu bare

1048707 Diagrama tip bdquoboxplotrdquo

1048707 Diagrama bdquopierdquo

1048707 Cartograma

Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi

dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)

Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)

Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie

Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)

Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)

50

Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir

de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele

două variabile studiate (Figura 6)

Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2

(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2

rămacircne aproximativ constantă)

Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea

comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea

comparativă a mai multor variabile

Figura 7 Grafic calitativ cu bare

51

Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo

Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două

posibilităţi reprezentate grafic este mai frecventă (Figura 8)

Figura 8 Reprezentare tip bdquopierdquo

Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli

sau a oricărui element comparativ Se foloseşte de epidemiologi

Rezultate

Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare

Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o

manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu

explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția

bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la

ilustraţii tabele grafice

Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi

nici rezultatele care invalidează eventual ipoteza

Discuţii

Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd

cultura ştiinţifică şi inteligenţa autorilor

Acest capitol răspunde la trei obiective

Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia

calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de

selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează

rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv

52

este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn

care a fost abordată problema fără a face o revistă a literaturii

Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea

rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul

Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor

afirmaţii nesusţinute de conţinutul lucrării

Concluzii

Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate

să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie

Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de

concluzii va scădea valoarea lucrării

Bibliografia (lista referinţelor citarea icircn text)

Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn

lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente

Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli

- să conţină cele mai importante şi recente lucrări

- să includă numai lucrări publicate

- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate

Bibliografie

Elisabeta Jaba ndash Statistică Ed Economică 1998

Mihai Ţarcă ndash Statistică volI Ed UAIC 1979

Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale

Ed University Press 2009

Sorana Daniela Bolboacă ndash Metodologia cercetării curs

53

Page 51: cercetarea medicala - metodologie

Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir

de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele

două variabile studiate (Figura 6)

Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2

(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2

rămacircne aproximativ constantă)

Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea

comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea

comparativă a mai multor variabile

Figura 7 Grafic calitativ cu bare

51

Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo

Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două

posibilităţi reprezentate grafic este mai frecventă (Figura 8)

Figura 8 Reprezentare tip bdquopierdquo

Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli

sau a oricărui element comparativ Se foloseşte de epidemiologi

Rezultate

Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare

Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o

manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu

explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția

bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la

ilustraţii tabele grafice

Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi

nici rezultatele care invalidează eventual ipoteza

Discuţii

Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd

cultura ştiinţifică şi inteligenţa autorilor

Acest capitol răspunde la trei obiective

Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia

calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de

selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează

rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv

52

este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn

care a fost abordată problema fără a face o revistă a literaturii

Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea

rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul

Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor

afirmaţii nesusţinute de conţinutul lucrării

Concluzii

Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate

să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie

Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de

concluzii va scădea valoarea lucrării

Bibliografia (lista referinţelor citarea icircn text)

Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn

lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente

Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli

- să conţină cele mai importante şi recente lucrări

- să includă numai lucrări publicate

- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate

Bibliografie

Elisabeta Jaba ndash Statistică Ed Economică 1998

Mihai Ţarcă ndash Statistică volI Ed UAIC 1979

Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale

Ed University Press 2009

Sorana Daniela Bolboacă ndash Metodologia cercetării curs

53

Page 52: cercetarea medicala - metodologie

Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo

Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două

posibilităţi reprezentate grafic este mai frecventă (Figura 8)

Figura 8 Reprezentare tip bdquopierdquo

Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli

sau a oricărui element comparativ Se foloseşte de epidemiologi

Rezultate

Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare

Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o

manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu

explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția

bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la

ilustraţii tabele grafice

Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi

nici rezultatele care invalidează eventual ipoteza

Discuţii

Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd

cultura ştiinţifică şi inteligenţa autorilor

Acest capitol răspunde la trei obiective

Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia

calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de

selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează

rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv

52

este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn

care a fost abordată problema fără a face o revistă a literaturii

Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea

rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul

Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor

afirmaţii nesusţinute de conţinutul lucrării

Concluzii

Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate

să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie

Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de

concluzii va scădea valoarea lucrării

Bibliografia (lista referinţelor citarea icircn text)

Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn

lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente

Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli

- să conţină cele mai importante şi recente lucrări

- să includă numai lucrări publicate

- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate

Bibliografie

Elisabeta Jaba ndash Statistică Ed Economică 1998

Mihai Ţarcă ndash Statistică volI Ed UAIC 1979

Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale

Ed University Press 2009

Sorana Daniela Bolboacă ndash Metodologia cercetării curs

53

Page 53: cercetarea medicala - metodologie

este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn

care a fost abordată problema fără a face o revistă a literaturii

Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea

rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul

Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor

afirmaţii nesusţinute de conţinutul lucrării

Concluzii

Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate

să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie

Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de

concluzii va scădea valoarea lucrării

Bibliografia (lista referinţelor citarea icircn text)

Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn

lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente

Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli

- să conţină cele mai importante şi recente lucrări

- să includă numai lucrări publicate

- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate

Bibliografie

Elisabeta Jaba ndash Statistică Ed Economică 1998

Mihai Ţarcă ndash Statistică volI Ed UAIC 1979

Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale

Ed University Press 2009

Sorana Daniela Bolboacă ndash Metodologia cercetării curs

53