cercetarea medicala - metodologie
-
Upload
mili2emilia -
Category
Documents
-
view
69 -
download
1
description
Transcript of cercetarea medicala - metodologie
Cuprins
1 Cercetarea ştiinţifică medicală 2
2 Scopul justificarea şi calităţile unui studiu medical2
3 Etapele unui studiu de cercetare4
31 Pregătirea studiului de cercetare 4
32 Elaborarea proiectului 8
33 Culegerea informaţiei9
Populaţia ţintă 9
Eşantionul9
Tipuri de culegere a datelor 12
Metode de culegere a datelor 13
Instrumente de cercetare 15
34 Prelucrarea datelor 16
Instrumentele de prelucrare16
Statistica descriptivă 16
Statistica inferenţială18
Testul statistic 19
Etapele unui test statistic 19
Inferenţa statistică pe date calitative 23
Testul χ2 25
Testul Fisher 27
Testul z pentru proporţii 28
Testul McNemar 29
Inferenţa statistică pe date cantitative 30
Testul z şi Student (t) 31
ANOVA 32
Testul Wilcoxon 33
Testul Kruskal-Wallis 34
Indicatori 39
35 Analiza şi interpretarea datelor 42
Interpretarea rezultatelor statistice 42
Erorile studiilor medicale44
36 Prezentarea rezultatelor46
Bibliografie 53
1
1 Cercetarea ştiinţifică medicală
Progresele tehnice incontestabile din ultima perioadă cu repercusiuni favorabile asupra evoluţiei
generale a societăţii umane au contribuit şi la apariţia a numeroși factori de risc care pot influenţa starea de
sănătate
Icircncercările de a depista corelaţiile dintre starea de sănătate sau de boală şi factorii
de risc de a evalua mecanismele prin care ei acţionează de a găsi remediile medicamentoase sau profilactice
nasc o serie de icircntrebări răspunsul la aceste icircntrebări fiind adus de cercetarea ştiinţifică
Un proiect de cercetare pe baza căruia se va desfășura un studiu clinico-epidemiologic
icircşi găseşte originea icircn
bull curiozitatea cercetătorului pentru o problemă medicală
bull icircncercarea de a descrie unele inadvertenţe existente icircntre ceea ce se observă şi ceea ce ar trebui să fie icircn
practica medicală
bull calităţile de observator şi experienţa profesională a cercetătorului
bull abilitatea cercetătorului de a găsi cele mai eficiente metode de rezolvare a
problemelor ivite
2 Scopul justificarea şi calităţile unui studiu medical
Scopul unui studiu de cercetare este de a da răspuns la icircntrebări cu privire la
bull cauzalitate la documentarea unei relaţii stracircnse icircntre unul sau mai mulţi factori de risc şi boală
bull istoria naturală a unei boli sau dinamica acesteia icircncepacircnd cu momentul impactului factorului de risc
(inclusiv a factorilor de natură biologică) cu macroorganismul urmacircnd apoi fazele incubaţia bolii perioada de
stare şi faza finală urmată de vindecare imunitate cronicizare sau deces Dacă pentru bolile infecţioase aceste
faze cu precădere primele două sunt mai bine definite icircn bolile neinfecțioase debutul este imprecis iar
perioada de latenţă este de obicei asimptomatică deci mai greu se poate depista boala icircn aceste faze
bull prognosticul bolii aprecierea cacirct mai aproape de certitudine a evoluţiei unei boli Factorii prognostici sunt
apreciaţi prin studii epidemiologice de cohortă icircn care se pot evalua indicatori ca supravieţuirea unui bolnav la
5 ani după un anumit moment cheie din istoria naturală a bolii rata de fatalitate rata de răspuns la tratament
ratele de recidive şi remisii ale bolii
bull tratamentul eficienţa şi eficacitatea unui tratament sunt frecvente subiecte de cercetare pentru abordarea lor
se apelează la trialuri clinice controlaterandomizate
Se pot analiza de asemenea scheme noi de tratament eficienţa unor preparate sau scheme de aplicare a
preparatelor profilactice (vaccinuri dezinfectanţi etc)
2
bull profilaxia icircmbolnăvirilor include totalitatea măsurilor care pot influenţa cauzele modificabile ale unei boli şi
se efectuează icircn patru trepte profilaxia primordială primară secundară şi terţiară
Justificarea studiului clinic
Justificarea studiului pleacă de la informaţiile existente legate de subiectul pe care cercetarea
intenţionează să icircl dezbată informaţii existente icircn literatura de specialitate
Cercetarea bibliografică permite identificarea unor lipsuri icircn legătură cu problema luată icircn studiu
inexistenţa de date referitoare la o icircmbolnăvire dintr-o zonă geografică (ţară judeţ comunitate) explicarea şi
emiterea unor soluţii de remediu Toate acestea ar putea fi elemente care justifică iniţierea şi derularea unui
studiu
Icircn justificarea studiului se poate insista pe
bull caracterul nou actual inedit al problemei
bull un nivel ridicat al morbidităţii sau mortalităţii unui fenomen de sănătate
bull gravitatea evenimentului
Calităţile studiului de cercetare
Un bun studiu de cercetare trebuie să fie pertinent nou fezabil să respecte etica medicală
Un studiu este pertinent cacircnd are repercusiuni asupra viitorului clinic al unui fenomen de sănătate pertinența
practică icircnsemnacircnd o mai bună cunoaştere a bolii a prognosticului ei ameliorarea tehnicilor de diagnostic şi
de tratament etc
O altă cerinţă se referă la ineditul studiului faptul de a fi nou icircn sensul de a aduce informaţii noi să nu repete
un studiu deja finalizat şi cu concluzii ferme
Cercetătorul trebuie icircnainte de a demara studiul icircnainte de a investi timp bani energie să estimeze dacă
studiul este fezabil Icircn acest sens trebuie să se asigure că
bull are un număr suficient de subiecţi determinări de laborator etc pentru a putea trage concluzii adecvate
bull nu există constracircngeri tehnologice sau financiare
bull studiul este accesibil şi acceptat de populaţie
bull nu are costuri de timp dar mai ales financiare mari
bull nu are scopuri prea ambiţioase sau scopuri multiple icircn general un studiu ar trebui să aibă un singur scop să
găsească rezolvarea la o singură icircntrebare
Studiul medical trebuie să respecte etica medicală cele patru principii
bull interesul şi beneficiul cercetării
bull inocuitatea (nevătămarea cercetării)
bull respectul faţă de persoanele incluse icircn studiu (respectul intimităţii persoanelorconfidenţialitatea datelor)
bull păstrarea echităţii şi respectul valorilor morale
In efectuarea unui studiu este necesară parcurgerea următoarelor etape
1 Pregătirea studiului
3
2 Elaborarea protocolului
3 Culegerea informaţiilor (datelor)
4 Prelucrarea datelor
5 Analiza şi interpretarea rezultatelor
6 Prezentarea rezultatelor
7 Redactarea studiului
3 Etapele unui studiu de cercetare
31 Pregătirea studiului de cercetare
Pregătirea studiului de cercetare comportă mai multe sub-etape
bull Documentarea bibliografică
bull Definirea fenomenului
bull Formularea temei de cercetare
bull Aspecte manageriale
Documentarea bibliografică
Cercetarea bibliografică are misiunea de a realiza un compromis icircntre excesul de documente (anual se
publică icircn icircntreaga lume peste 20000 de reviste cu caracter medical) şi pierderea de informaţii pertinente
Cercetarea bibliografică necesită o selectare şi o evaluare a literaturii de specialitate pe o anumită problemă şi
se realizează prin parcurgerea a trei etape
a) Prima etapă este cercetarea bibliografică propriu-zisă adică identificarea publicaţiilor care se referă la
subiectul icircn discuţie
Etapele documentării bibliografice sunt
bull Definirea şi delimitarea precisă a subiectului de cercetat
bull Stabilirea unei liste de bdquocuvinte cheierdquo prin lectura referinţelor bibliografice
bull Traducerea icircn limbi de circulaţie internaţională
bull Stabilirea unei liste cu documentele de cercetat
bull Consultarea unor tratate sau cărţi de referinţă
bull Consultarea publicaţiilor primare
bull Redactarea fişelor bibliografice şi aranjarea lor icircn ordine alfabetică
bull Introducerea referinţelor bibliografice icircn textul propriu-zis
Literatura primară de specialitate
Reprezintă toate materialele scrise care conţin studii originale
Articole ştiinţifice Au calitatea esenţială că informaţiile publicate sunt recente intervalul de timp scurs de la
scriere la publicare fiind icircn general foarte scurt
4
Teze de doctorat licenţă Se pot găsi icircn bibliotecile instituţiilor de icircnvăţămacircnt superior Sunt utile pentru că
icircn general tratează pe larg o anumită problemă care poate fi de interes avacircnd şi o bibliografie recentă
Brevete şi mărci Sunt acele sisteme de protecţie a produselor şi tehnologiilor Sunt utile icircn general icircn
cercetarea experimentală
Literatura secundară de specialitate
Tratate de specialitate Sunt foarte importante icircn faza incipieintă a unui studiu pentru aprofundarea problemei
de cercetat Informaţiile prezente icircn astfel de publicaţii sunt ordonate cu noţiuni de bază definiţii teorii
posibile etc
Cărţi de referinţă Sunt monografii care studiază pe larg un fenomen putacircnd fi foarte utile atacirct cercetătorilor
debutanţi cacirct şi celor iniţiaţi
Literatura terţiară de specialitate este reprezentată de indexuri reviste cu extrase de articole şi rezumate
Cercetarea bibliografică bdquoon-linerdquo permite accesul la nenumărate surse de informare utilizacircnd icircn acest scop
motoare de căutare
b) A doua etapă este lectura critică activă a publicaţiilor selectate pentru a judeca valoarea publicaţiilor
indiferent dacă este vorba de calitatea cercetării sau de pertinenţa rezultatelor publicate
Evaluarea corectă critică a unui articol va permite cititorului să aprecieze dacă publicaţia este credibilă
rezultatele corespund realităţii (validitatea internă) respectiv dacă informaţiile conţinute icircn publicaţie sunt
aplicabile icircn practica medicală dacă se pot generaliza dacă sunt aplicabile icircn proiectul de cercetare al
viitorului investigator (validitatea externă)
Lectura critică a literaturii medicale se bazează pe folosirea unei grile de lectură care are meritul de a putea fi
aplicată tuturor tipurilor de publicaţii Această grilă are 8 criterii de evaluare pentru fiecare criteriu trebuie să
se răspundă la următoarele icircntrebări
bull este posibil să se găsească icircn articol informaţia pentru criteriul icircn cauză
bull dacă criteriul abordat este corect
bull dacă criteriul este incorect icircn ce măsură ameninţă validitatea studiului
Cele 8 criterii de evaluare sunt
1 Obiectivul vizează următoarele preocupări medicale
bull istoria naturală a unei boli evoluţia şi prognosticul ei
bull performanţa unui test diagnostic
bull impactul unei intervenţii (terapeutice de depistare de prevenţie sau de educaţie)
Lectura critică va aşeza articolul icircn una din aceste situaţii apoi icircn raport cu obiectivul va stabili dacă are
ipoteze de verificat
5
2 Tipul de studiu Cititorul trebuie să recunoască planul de studiul pentru a verifica dacă tipul de studiu este
adaptat icircntrebării puse Va merge progresiv cu urmărirea de la raportul de caz-seria de cazuri la studiul
transversal studiul caz-control studiul de cohortă şi trialul controlat
3 Factorii studiaţi (variabila independentă) pot fi factori de expunere sau de intervenţie Cititorul trebuie să
poată recunoaşte factorul să aprecieze cum a fost măsurat dacă s-a folosit aceeaşi metodă de măsurare pentru
loturile icircn studiu ce metodă de comparaţie s-a folosit dacă sunt erori (factor de confuzie)
4 Criteriul de raţionament este evenimentul sau situaţia presupusă a fi rezultatul factorului studiat boala
decesul supravieţuirea complicaţiile etc Definirea precisă şi metoda de măsurare a rezultatului expunerii va
permite cititorului să aprecieze validitatea informaţiilor
5 Populaţia studiată (eşantionul) Se va urmări dacă este definită populaţia de referinţă şi populaţia de
studiat analizacircndu-se corectitudinea selecţiei randomizarea proporţia de subiecţi la sfacircrşitul studiului
validitatea externă a rezultatelor
6 Analiza datelor Cititorul trebuie să aprecieze dacă s-au examinat toate erorile inclusiv factorul de confuzie
dacă nu validitatea studiului ar putea fi compromisă
7 Rezultatele Principalele aspecte pe care cititorul le va urmări la acest capitol sunt dacă ele se datoresc
numai şansei dacă s-a făcut calculul statistic dacă s-a apreciat relaţia expunere-efect (RR OR RA) dacă a
fost apreciată semnificaţia clinică sau biologică care nu este identică cu semnificaţia statistică
8 Sinteza lecturii critice analizează concluziile autorilor dacă ele răspund icircntrebărilor formulate la icircnceputul
studiului dacă rezultatele sunt aplicabile la populaţia studiată dacă rezultatele sunt acceptabile pentru practica
proprie a cititorului dacă rezultatele justifică vreo schimbare icircn practica clinică respectiv vor ameliora starea
pacienţilor Această abordare cere cititorului cunoaşterea noţiunilor de bază icircn metodologia cercetării
ştiinţifice fiind vorba icircn acelaşi timp şi de un demers clinic
c) A treia etapă icircn cercetarea bibliografică constă icircn combinarea datelor din mai multe studii referitoare la
acelaşi subiect şi care se realizează prin meta-analiză Tehnica meta-analizei permite să se sporească
eficacitatea testării ipotezelor să crească forţa statistică a rezultatelor şi să se obţină informaţii care nu pot fi
convenabil extrase din fiecare cercetare
Definirea fenomenului
Definirea fenomenului se bazează pe
bull Cunoaşterea prealabilă a problemei prin documentare riguroasă documentare care poate justifica pertinenţa
temei propuse (revista literaturii de specialitate)
Icircn prima etapă se cercetează bibliografia propriu-zisă adică se identifică publicaţiile care se referă la subiectul
icircn discuţie apoi se vor selecta publicaţiile necesare studiului apreciind validitatea lor (problemele de
documentare bibliografică vor constitui un capitol separat)
bull Formularea unei ipoteze ştiinţifice sub-etapă care reprezintă fondul problemei
6
Ipoteza este o afirmaţie (nu o icircntrebare) despre o posibilă relaţie icircntre factorii studiaţi şi criteriile de
raţionament Ipoteza poate fi ipoteză ldquonulărdquo - nu există această relaţie şi ldquoalternativărdquo - există relaţia Ipoteza
va trebui apoi dovedită sau respinsă testul statistic calculează probabilitatea conform căreia asociaţia observată
este reală sau ea survine din icircntacircmplare
bull Motivarea organizării studiului Trebuie făcută o motivare corectă legată de inexistenţa unor studii
referitoare la problema pe care o va dezbate studiul
Formularea temei de studiu
Pentru formularea temei de studiu trebuiesc menţionate obiectivul sau obiectivele şi tipul de studiu ales pentru
cercetarea respectivă Există icircn general patru tipuri de obiective
bull obiective care se referă la evoluţia şi prognosticul unei icircmbolnăviri obiective prin care se icircncearcă
icircnţelegerea şi cunoaşterea unor evenimente ce pot să apară la un pacient pe parcursul bolii
bull obiective care se referă la etiologia bolii (cauze de natură bacteriană virală parazitară) sau la cauzalitate
(relaţia factor de risc-boală)
bull obiective legate de performanţa unor teste de diagnostic sau de screening de evaluare a strategiei de
diagnostic sau de interpretare a unui test
bull obiective care se referă la impactul unei intervenţii evaluarea unei intervenţii terapeutice de depistare a unor
boli de prevenţie de educare pentru sănătate
Obiectivele unui studiu se icircmpart icircn obiectivul major unul din cele patru enumerate şi obiective
secundare care pot aborda şi alte fenomene biologice decacirct cel major cu condiţia să nu altereze realizarea
acestuia Alegerea tipului de studiu este stracircns legată de obiectivul ales Dacă obiectivul este descrierea
distribuţiei caracteristicilor unei populaţii aprecierea frecvenţei unui fenomen de sănătate analiza acelui
fenomen icircn funcţie de timp loc persoană se va alege un studiu epidemiologic descriptiv studiu care nu are o
ipoteză fixată anterior O ipoteză se poate formula ca rezultat al studiului descriptiv dar nu se va face
verificarea ei icircn cadrul studiului Dacă intenţia studiului este de a emite o judecată asupra unei posibile relaţii
icircntre factorii studiaţi atunci problema de cercetat este fundamentată de o ipoteză care trebuie verificată
dovedită iar studiul care realizează acest lucru respectiv limitele studiilor utilizate
Aspectele manageriale
Aspectele manageriale includ
bull justificarea bugetului estimarea sumei necesară realizării studiului și apreciarea durate studiului
bull defalcarea bugetului pe necesități legate de achziționare de aparatură reactanți truse etc pentru personal
(munca depusă pregătire deplasări icircn teren participări la congrese sau conferințe documentare) materiale
consumabile etc
7
32 Elaborarea proiectului
Protocolul de cercetare este un document care emite obiectivul și ipoteza studiului definește condițiile de
desfășurare și realizare a viitorului studiu clinic Elaborarea protocolului este importantă pentru cercetătorii
participanţi la studiu comisiile de etică şi finanţatori
Protocolul include mai multe formulare care trebuie să cuprindă
a) Titlul proiectului
b) Sumarul proiectului
c) Descrierea proiectului
d) Normele deontologice de cercetare
e) Modalitățile de diseminarea și valorificarea rezultatelor
f) Perspective de continuare a cercetării
g) Anexe
Prezentarea proiectului va include următoarele fișiere
bull resursele umane (membrii echipei afilierea acestora)
bull relevanța temei pentru dezvoltarea cunoașterii icircn domeniu
bull stadiul actual al cunoașterii și bibliografia aferentă
bull justificarea studiului
bull enunțarea obiectivelor și ipoteza de lucru
bull metodologia propriu-zisă
Referitor la metodologia utilizată vor trebui menționate
bull factorulfactorii studiați care reprezintă variabila independentă respectiv dacă este cazul modalitățile de
măsurare
bull criteriile de raționament- variabila dependentă (situația sau evenimentul ce se presupune a fi rezultatul
factorului studiat cum ar fi boala handicapul complicații decesul)
bull tipul de studiu care se va aplica icircmpreună cu design-ul acestuia
bull eșantioanele de lucru și modalitățile de eșantionaj
bull metodele de culegere și de prelucrare a datelor
bull planificarea activităților
bull structura bugetului fiind eligibile următoarele categorii de cheltuieli de capital (echipamente software
upgrading) pentru personal (full sau part-time instruire asigurări de sănătate) de informare (documentare
abonamente) mobilități (vizite la alte unități de cercetare participări la
congrese) materiale consumabile (truse reactanți papetărie) valorificare a rezultatelor (lucrări științifice de
etapă sau lucrarea finală) cheltuieli indirecte (de regie)
bull modalităţile de valorificare a rezultatelor
bull legături de alte proiecte
8
Protocolul mai conține anexe curriculum vitae al investigatorului principal și al coinvestigatorilor
calendarul activităților avizul Comisiei de etică documente speciale și
consimțămacircntul informat icircn cazul studiilor pe subiecți umani
Icircnainte de implementare protocolul va fi verificat de experți pentru eligibilitate (dacă sunt icircndeplinite
condițiile de acceptare finanțare) calitate și pertinență icircn sensul că protocolul trebuie să fie clar exprimat
corect icircntocmit bine așezat și cu repercursiuni favorabile pentru viitor
33 Culegerea informaţiei
Pentru a realiza o cercetare medicală culegerea datelor este prima etapă şi realizează icircn funcţie de
obiectivele propuse tipul studiului timpul disponibil şi resurse umane şi financiare
Există două mari posibilităţi de culegere
bull Icircn funcţie de elementele studiate
o Culegerea exaustivă Toţi subiecţii populaţiei pe care dorim să o studiem Greu de realizat din cauza
costurilor foarte mari sau a alterării populaţiei de studiu
o Prin eşantionare Este metoda folosită icircn studii medicale
bull Icircn funcţie de durata culegerii
o Transversală Se studiază un grup la un moment dat
o Longitudinală Extinsă in timp
- Retrospectivă ndash icircnregistrări medicale
- Prospectivă ndash date culese la intervale prestabilite de timp
Populaţia ţintă
Este orice colectivitate icircntreagă de oameni animale plante sau obiecte de la care putem colecta date Populaţia
ţintă este icircntregul grup care ne interesează pe care dorim să-l descriem sau să tragem concluzii despre el
Pentru a putea realiza generalizări spre populaţia ţintă deseori suntem obligaţi să folosim un eşantion (selecţie)
care icircnsă trebuie să fie reprezentativ pentru populaţia pe care vrem să o studiem Pentru fiecare populaţie de
studiu sunt posibile mai multe eşantioane Pe baza acestor eşantioane se calculează un estimator Pe baza
acestui estimator calculat care poate fi medie aritmetică procent etc se pot trage concluzii despre icircntreaga
populaţie Este foarte important ca investigatorul să definească foarte atent şi complet populaţia icircnainte de a
realiza eşantionul inclusiv descrierea criteriilor de includere şi excludere icircn populaţia de studiu
Eşantionul
Un eşantion este practic un grup de elemente selectate dintr-un grup mai extins (populaţia ţintă) Studiind
eşantionul selectat se pot trage concluzii despre grupul de unde a fost ales (populaţia ţintă)
Este icircn general ales pentru studiu pentru că
bull Populaţia ţintă este prea mare şi nu poate fi studiată ca icircntreg
bull Nu avem acces din diverse motive decacirct la parte din populaţia de studiu
9
bull Un studiu pe icircntreaga populaţie poate distruge populaţia
bull Eşantioanele pot fi studiate mai rapid
bull Costul şi resursele necesare studiului sunt mai reduse
Numărul elementelor dintr-un eşantion se numeşte talia sau volumul selecţiei
Acesta fiind icircn general mai mic decacirct icircntreaga populaţie poate fi observat icircn detaliu iar dacă este reprezentativ
se pot afla prin intermediul său proprietăţile populaţiei ţintă
Eşantionul trebuie să fie reprezentativ pentru populaţia generală De aceea dintre metodele de eşantionare se
folosesc tehnicile de randomizare Trebuie să satisfacă două condiţii principale
bull condiţie de ordin cantitativ talia să fie suficient de mare
bull condiţie de ordin calitativ trebuie extras aleator din populaţia ţintă
Metode de eşantionare
Putem vorbi icircn linii mari de două posibilităţi de eşantionare prin metode probabilistice şi prin metode
nonprobabilistice
Eşantionarea probabilistică este metoda cea mai folosită icircn studiile medicale fiind şi cea indicată pentru a
realiza reprezentativitatea calitativă
Icircn medicină se folosesc patru tipuri de eşantionări
1 Simplu randomizat
2 Sistematic
3 Stratificat
4 Cluster (icircn cuiburi)
1 Eşantionul simplu randomizat Fiecare element din populaţia ţintă are o şansă egală non zero de a fi
inclus icircn eşantion Se ia la icircntacircmplare un număr de elemente egal cu talia eşantionului Dezavantajul acestui tip
de eşantionare este că presupune cunoaşterea icircntregii populaţii ţintă
2 Eşantionul sistematic După aflarea taliei eşantionului şi a populaţiei ţintă se calculează factorul de
eşantionare k icircmpărţind talia populaţiei ţintă la volumul eşantionului Apoi fiecare al k-lea element este
selectat spre includere
Acelaşi mare dezavantaj apare şi icircn acest caz fiind obligatorie cunoaşterea icircntregii populaţii de studiu
3 Eşantionul stratificat Există icircn cele mai multe cazuri probleme medicale care studiindu-se pe eşantion
prezintă variabilităţi icircn funcţie de caracteristicile populaţiei (sex vacircrstă nivel de pregătire etc) Icircn acest caz
este obligatorie realizarea similitudinii demografice a eşantionului cu populaţia de studiu Din date provenite
de la Centrul de Statistică putem dezvolta ca procente o structură a populaţiei Această structură trebuie să se
regăsească (procentual) şi icircntre membrii eşantionului O importantă şansă ca reprezentativitatea calitativă să fie
corectă este conferită de respectarea
acestei similitudini demografice
10
4 Eşantionul bdquoclusterrdquo sau icircn cuiburi Icircn cazul unui studiu amplu cu scop de a investiga populaţia unei
icircntregi ţări sau regiuni putem ajunge icircn imposibilitatea de a alege şi mai ales investiga indivizi răspacircndiţi prin
icircntreaga zonă Din acest motiv se desemnează la icircntacircmplare un număr calculabil de
grupuri populaţionale extinse icircn toată zona de studiu Aceste grupuri poartă numele de bdquocuiburirdquo La nivelul
fiecărui bdquocuibrdquo se aplică o tehnică precedentă de selecţie a cazurilor Se poate sau de cele mai multe ori se face
la nivel de bdquocuibrdquo stratificarea iar apoi selecţia propriu-zisă se realizează sistematic sau simplu randomizat
Este metoda de eşantionare cel mai frecvent utilizată icircn cercetarea medicală de amploare Pentru ca eventualele
erori să nu se poată strecura s-a definit şi un indice DEF (design effect) cu care trebuie multiplicată talia
selecţiei care pentru eşantionarea icircn bdquocuiburirdquo este egal cu 2 astfel putem obţine şi o reprezentativitate
calitativă dar şi una cantitativă
Eşantionarea nonprobabilistică este o metodă neindicată icircn studiile medicale datorită lipsei de forţă icircn ceea ce
priveşte posibilitatea de aplicare a concluziilor asupra populaţiei de studiu
Se definesc şi icircn acest caz patru metode
1 Eşantion de convenienţă Membrii unui astfel de eşantion sunt aleşi numai pentru că sunt la icircndemacircnă
disponibili de a răspunde le un eventual chestionar
2 Eşantion pe cote Similar cu tipul de eşantion stratificat se referă la faptul că selecţia se face formacircnd
eşantionul din primele 30 de persoane care respectă un criteriu impus
3 Eşantion cu un scop Elementele incluse icircn eşantion sunt alese după un criteriu care exclude din start marea
majoritate a populaţiei
4 Eşantion raţional Selecţia se face prin prisma unui raţionament al celui care conduce studiul
Parametru şi estimator
Parametrul este o valoare de obicei necunoscută (şi care trebuie să fie estimată prin studiu) folosită pentru a
reprezenta o anumită caracteristică a populaţiei de studiu De exemplu media populaţiei (icircnălţime) este un
parametru populaţional Raportat la o populaţie parametrul este o valoare fixă şi exactă care nu variază
Fiecare eşantion extras din populaţie va indica o valoare a mediei care nu poate decacirct să estimeze parametrul
Icircn general parametrii sunt notaţi cu litere greceşti (ex Media = μ)
Estimatorul este o valoare calculată dintr-un eşantion studiat Este folosit pentru a putea aprecia parametrul
populaţional pe care icircn căutăm Este de asemenea posibil ca dintr-o populaţie să formăm mai multe eşantioane
mediile lor de cele mai multe ori nefiind identice icircntre ele şi nici identice cu media populaţiei Estimatorii
sunt notaţi cu litere latine (ex Media = μ)
Dacă valoarea mediei calculată pe eşantion este de exemplu 168 cm atunci putem estima ca valoarea mediei
icircn populaţie este 168 cm
11
Tipuri de culegere a datelor
1 Culegere de tip eşantion reprezentativ Grupul de indivizi incluşi icircn studiu sunt reprezentativi (calitativ şi
cantitativ) pentru populaţia generală Poate fi utilizat pentru studii descriptive (cel mai frecvent) dar uneori şi
pentru studii analitice
Este necesar pentru acest tip de culegere a datelor ca iniţial să fie cunoscută talia eşantionului (calculabilă icircn
funcţie de prevalenţă şi precizie) Pentru evaluarea datelor culese se utilizează tabelul de contingenţă 2 x 2
astfel (Figura 1)
Figura 1 - Tabelul de contingenţă 2 x 2
Unde
a ndash persoane expuse unui factor de risc care au boala studiată
b ndash persoane expuse unui factor de risc care nu au boala studiată
c - persoane neexpuse unui factor de risc care au boala studiată
d - persoane neexpuse unui factor de risc care nu au boala studiată
După aranjarea datelor icircn tabelul de contingenţă (2 x 2) se poate icircncepe analiza statistică a datelor atacirct ca
procente calculabile cacirct şi din punct de vedere a aplicării de teste statistice pentru elucidarea semnificaţiei
statistice
Este posibilă din acest tip de culegere de date calcularea
1 Prevalenţei unei boli
2 Frecvenţei expunerii
3 Gradul de asociere icircntre factorul eventual de risc şi boala
2 Culegerea de tip expus ndash neexpus Icircmparte subiecţii icircn două categorii expuşi sau neexpuşi factorului de risc
studiat Ca evoluţie următoare a studiului după o astfel de culegere a datelor se poate evalua icircn timp apariţia
icircmbolnăvirii despre care se efectuează studiul Icircn timp longitudinal prospectiv se poate calcula dacă factorul
studiat reprezintă un risc de icircmbolnăvire este indiferent sau chiar este cu efect protectiv Numărul subiecţilor
din cele două grupuri poate fi egal sau poate fi diferit Numărul acestora poate fi calculat icircn vederea obţinerii
unei bune reprezentativităţi cu ajutorul formulelor de selecţie Avacircnd icircn vedere calitatea longitudinală a
12
studiului este important ca numărul ales să fie mai mare pentru a putea suplinii eventualele pierderi din
urmărire Practic rezultatele sunt introduse icircn tabelul 2 x 2 de unde se pot calcula indicatorii doriţi (Figura 2)
Avacircnd icircn vedere modul de culegere a datelor este permisă calcularea de indicatori numai pe orizontală
orice comparare icircntre coloana dreaptă şi stacircngă fiind incorectă Avantajul acestui tip de culegere a datelor ar fi
eventualul număr mai redus de subiecţi dar dezavantajul major este cel al costurilor de urmărire icircn timp dar
trebuie luată icircn calcul şi pierderea de subiecţi din evidenţe Factorul controlat este deci prezenţa expunerii iar
factorul aleator este prezenţa bolii
Figura 2 Tabelul de contingenţă pentru tipul de culegere expus ndash neexpus
4 Culegerea de tip caz ndash martor Icircn acest caz ceea ce ghidează colectarea datelor este prezenţa sau absenţa
bolii icircn momentul prezent Se vor culege date de la două loturi constituite după criteriul de bolnav B+ şi de fără
boală B+ Datele culese sunt icircn trecut deci caracterul datelor va fi retrospectiv Icircn acest caz factorul controlat
este boala factorul aleator fiind expunerea (Figura 3)
Calculul de indicatori icircn acest caz se va putea efectua numai icircntre coloane orice calcul icircntre valorile de pe linii
fiind greşit Rezultate semnificative se pot obţine icircn acest caz utilizacircnd loturi mai mici de studiu prin
comparaţie cu tipul eşantion reprezentativ permiţacircnd icircn acelaşi timp studiul bolilor rare (cu prevalenţă mică)
Figura 3 Tabelul de contingenţă pentru tipul de culegere caz ndash martor
Metode de culegere a datelor
Metoda aleasă pentru culegerea datelor trebuie să fie aleasă după un atent studiu bibliografic icircn vederea
stabilirii celui mai eficient mod de a răspunde temei de studiu
Metodele de culegere trebuie să fie bine aplicabile şi consistente ca aport informaţional necesar
13
1 Fiziologice Sunt colectate date despre anumite caracteristici fiziologice ale pacienţilor (TA glicemie
colesterol etc) Această metodă aduce rezultate obiective cacirct timp instrumentul de evaluare este bine calibrat
şi prezintă variaţii mici
2 Metode observaţionale Instrumentul de culegere a datelor trebuie să fie sincronizat cu protocolul conceput
de cercetător Datele culese trebuie să fie de asemenea consistente adică să fie colectate de aceeaşi manieră
conducătorul studiului trebuind să instruiască investigatorii (colectorii de date) Icircnregistrarea datelor trebuie să
fie de asemenea sistematică şi bine standardizată Observaţii de control trebuie icircn mod obligatoriu făcute
pentru a putea aprecia icircn mod corect orice deviere datorată unor factorii externi Este obligatorie luarea icircn
consideraţie a aspectelor etice
3 Interviul Poate fi structurat cu un set specific de icircntrebări sau nestructurat cu o temă generală cu care se
icircncepe interviul Interviurile pot fi icircnregistrate sau intervievatorul poate nota pur şi simplu răspunsurile Există
două tipuri generice de interviu interviul de profunzime care se referă la o discuţie icircn general structurată cu
un număr de icircntrebări prestabilite icircn icircncăperea de studiu fiind doară intervievatorul şi persoana chestionată şi
interviul de grup unde prin conversaţii pornind de la temă generală expusă şi condusă de intervievator se
obţin date despre subiecţii participanţi la studiu Ambele metode de interviu au indicaţiile lor precise Un
interviu pe teme intime nu va putea fi corect icircn ceea ce priveşte datele colectate dacă se aplică un interviu de
grup
4 Chestionarul Document scris adresat unor persoane pentru a răspunde la una sau mai multe icircntrebări
Trebuie să aducă răspunsurile la icircntrebările care motivează studiul constituind ansamblul icircntrebărilor destinate
culegerii de informaţii (date) Redactarea chestionarului trebuie să ţină cont de structura acestuia introducere
conţinut exprimarea icircntrebărilor grafica chestionarului
5 Icircnregistrări preexistente
Icircn cercetarea medicală sunt cel mai frecvent utilizate Informaţiile dorite sunt deja existente ceea ce icirci revine
cercetătorului este ca să structureze datele icircn funcţie de scopul studiului pe care icircn conduce Aceste surse sunt
bull Foi de observaţie
bull Registre de consultaţie
bull Buletine de analize
bull Registre de operaţii
Icircn cazul icircn care nici o metodă de culegere a datelor nu este pe placul celui ce conduce studiul există
posibilitatea de a construi un instrument nou de culegere a datelor
Acest proces trebuie să urmărească nişte paşi obligatorii fiind mare consumator de timp
bull Definirea structurii cu care se va face măsurarea
bull Formularea itemilor de măsură
bull Analiza validităţii instrumentului de măsură ndash măsoară acesta fenomenul corect
bull Elaborarea de instrucţiuni de utilizare pentru investigatori
14
bull Pretestarea instrumentului
bull Aprecierea validităţii interne şi externe a datelor culese
Instrumente de cercetare
Formularea clară a temei de cercetare necesită o foarte bună definire a factorilor studiaţi şi a criteriilor de
judecată Acestea din urmă sunt ultimele care vor trebui definite icircn cadrul protocolului de studiu
Alegerea unui instrument de măsură
Nu există un instrument de măsură perfect sau universal corect Alegerea sa dintre cele existente şi cele deja
utilizate depind de trei factori
bull Obiectivul studiului
bull Boala studiată
bull Populaţia icircn studiu
De aceste trei elemente trebuie ţinut cont icircn fiecare etapă a dezvoltării instrumentului
Definirea obiectivului
Studiu transversal Dacă se doreşte studierea unui simptom sau a unei caracteristici ale populaţiei se poate
icircmpărţi populaţia de studiu icircn mai multe grupuri Este practic vorba de a determina diferenţele dintre subiecţi
icircn cea ce priveşte o variabilă necesară studiată printr-un studiu transversal (utilizarea dozării de Ac HBS
pentru a evalua progresele bolnavilor de hepatită tip B)
Studiu longitudinal Icircn acest caz nu se poate icircmpărţii populaţia de studiu icircn mai multe grupuri datele obţinute
fiind de la acelaşi subiect colectate după un interval de timp
Icircn funcţie de boală şi populaţie se aleg şi instrumentele de măsură cele mai adecvate
Instrumentele cercetării reprezintă un mecanism specific sau o strategie pe care cercetătorul o utilizează pentru
colectarea prelucrarea şi inferenţa datelor Aceste instrumente sunt
1 Studiul icircn bibliotecă
2 Computerul
3 Determinările experimentale
4 Statistica
5 Mintea umană
6 Facilităţi de limbaj şi comunicare
Determinările experimentale
Măsurarea constă icircn aprecierea şi cuantificarea fenomenelor calitativ sau cantitativ Interpretarea
datelor se referă la transformarea lor icircn unităţi de descoperire a unor fenomene mai puţin cercetate
Standardele acceptate se referă la norme medii distribuţii etc Tot icircn cadrul interpretării datelor datele
obţinute sunt caracterizate pe scale de valori nominal ordinal de interval sau de raport
Validarea şi reproductibilitatea măsurătorilor sunt aspecte importante şi foarte necesare pentru o
cercetare corect fundamentată care doreşte obţinerea unor concluzii pertinente
15
Statistica Este implicată icircn condensarea şi procesarea unui volum mai mare de date astfel icircncacirct să se poată
interpreta corect valorile obţinute şi să se permită comparările Utilizarea unor teste statistice specifice permite
determinarea semnificaţiei (diferenţei) statistice astfel icircncacirct estimatorii să poată fi aplicaţi la populaţia
generală Furnizează informaţii şi privind corelarea sau relaţionarea icircntre date
Mintea umană este cea care reuşeşte să integreze şi să icircnţeleagă rezultatele obţinute Semnificaţia ştiinţifică
este stabilită icircn funcţie de rezultatele statisticii de mintea umană conform afirmaţiei bdquosemnificaţia ştiinţifică
nu este egală cu semnificaţia statisticărdquo Metodele aplicate pentru a putea ajunge la o concluzie pertinentă sunt
logica deductivă raţionamentul inductiv şi gacircndirea critică
Limbaj şi comunicare Exprimarea orală sau icircn scris permite nuanţarea unor aspecte seci cifrice ale unor
studii Icircn acest mod devine mai evidentă semnificaţia ştiinţifică a unor rezultate statistice
34 Prelucrarea datelor
Instrumentele de prelucrare
Statistica este o ştiinţă ramură a matematicii care studiază evoluţia fenomenelor şi proceselor
colective pe baza observării lor ştiinţifice a culegerii şi prelucrării detaliate a informaţiilor statistice cu scopul
de a formula şi explica legile legităţile şi regularităţile ce le guvernează
Statistica permite deci aprecierea unor parametrii populaţionali prin studiul unui număr redus de
elemente ale populaţiei icircn studiu (ţintă) O populaţie poate fi definită printr-un şir de valori care pot fi grupate
icircn funcţie de parametrul studiat (glicemie colesterol TAD TAS etc) Pentru fiecare astfel de şir se defineşte
o variabilă (care va purta nume propriu glicemie colesterol etc) Practic variabila este considerată o funcţie
ia valori posibil diferite de la un element la altul icircn funcţie de caracteristicile proprii acestora Sunt clasificate
icircn două grupe variabile cantitative (caracteristică măsurabilă) şi calitative (caracteristică ce nu poate fi
măsurată)
La racircndul lor variabilele calitative pot fi
bull Nominale ndash grupuri de elemente ce nu pot fi ordonate (culoarea părului)
bull Nominale ordonate ndash concluziile pot fi grupate (eficienţa unui tratament slabă bună foarte bună)
bull Binare ndash apar numai două posibilităţi (bolnav sănătos)
Variabilele cantitative pot fi
bull Continue ndash o variabilă măsurabilă care poate lua o infinitate de valori
bull Discrete ndash variabile care nu pot lua decacirct valori icircntregi
Statistica descriptivă
Există două ramuri ale statisticii statistica descriptivă şi statistica inferenţială
Statistica descriptivă (după cum rezultă din denumire) se ocupă cu descrierea unor valori obţinute ale unei
variabile studiate
16
Valorile pe care variabila le ia se constituie icircntr-o serie statistică Indicatorii care definesc o variabilă (serie)
sunt
1 Ale tendinţei centrale
Media aritmetică - notată de regulă cu
Mediana - este acea valoare din şirul de date care icircmparte icircn două părţi egale şirul ordonat de valori (atenţie
şirul este ordonat crescător) situacircndu-se la mijlocul seriei statistice
Dacă numărul de valori n este un număr impar atunci mediana este valoarea unde
Dacă n este par deci avem un număr par de valori mediana este definitatilde ca fiind
unde k = n2
Modul - constituie valoarea care apare cel mai des deci valoarea cu numărul cel mai mare de apariţii
2 De dispersie
Amplitudinea - este diferenţa dintre valoarea maximă şi cea minimă
A = Amax - Amin
Amplitudinea relativă - notată A este raportul dintre amplitudinea absolută şi media aritmetică a seriei de
date
Varianţa notată este un indicator de icircmprăştiere a datelor Formula de calcul este
Abaterea standard (S) sau deviaţia standard reprezintă rădăcina pătrată din varianţă (dispersie)
Coeficientul de variaţie se calculează ca un raport procentual icircntre abaterea standard şi valoarea medie a şirului
de valori
Eroarea standard intervine icircn estimarea intervalelor de confidenţă Se calculează astfel
17
3 De asimetrie (skewness) indică distribuţia datelor dacă sunt sau nu distribuite normal
4 De boltire (kurtosis) estimează boltirea sau aplatizarea curbei de distribuţie
Prezentarea descriptivă a datelor se face prin icircnregistrarea datelor culese icircn tabele care să reprezinte icircn mod
sintetic valorile măsurate
Icircn concluzie statistica descriptivă permite
bull Stabilirea comparabilităţii icircntre grupurile de studiu şi aprecierea prezenţei erorilor sau confuziei
bull Reprezentarea datelor icircn tabele permite evaluarea fiecărui pacient şi dacă a existat pierderi din studiu
Statistica inferenţială
Statistica inferenţială (inductivă) este partea de analiză a datelor care permite extrapolarea unei
concluzii trase pe baza unui eşantion spre populaţia ţintă pentru care a fost efectuat studiul
Scopul analizei statistice este de a evidenţia efectul unui tratament sau al unui factor de risc prin date obţinute
din eşantionul studiat spre populaţia ţintă Aceasta implică testarea ipotezelor statistice sau altfel spus testarea
semnificaţiei statistice Este una dintre cele mai importante momente ale studiului Cum rezultatele sunt
obţinute prin studiul unui eşantion există posibilitatea ca acestea să fie datorate icircntacircmplării Testele
statistice ne ajută să apreciem icircn ce măsură rezultatele sunt icircntacircmplătoare şi mai ales icircn ce măsură şi dacă se
pot aplica populaţiei generale Icircn acest scop se impune o valoare limită alfa 005 care reprezintă limita
superioară a probabilităţii ca rezultatul obţinut să fie greşit (datorat icircntacircmplării) Astfel icircn funcţie de tipul
variabilelor şi indicatorii descriptivi aplicaţi şi evaluaţi se aplică teste de semnificaţie statistică (Tabelul 1)
Tabelul 1 Alegerea testelor de semnificaţie statistică
Tipul datelor
18
Diferenţierea variabilelor din punctul de vedere a distribuţiei se face folosind testul de normalitate
Kolmogorov ndash Smirnov
Testul statistic reprezintă metoda de comparaţie a două sau mai multe populaţii prin intermediul unor
variabile observate ale lor
Scopul unui test statistic este de a defini realitatea
Definirea icircntrebării de cercetare (ipoteza clinică)
Tratamentul cu Nebivolol este la fel de eficient ca şi cel cu Valsartan icircn tratamentul
hipertensiunii arteriale
Transpunerea icircntrebării de cercetare icircn termeni statistici (ipoteza statistică)
Media tensiunii arteriale a pacienţilor trataţi cu Valsartan nu diferă semnificativ de media
tensiunii arteriale a pacienţilor trataţi cu Nebivolol
Etapele unui test statistic
1 Formularea problemei icircn termenii ipotezelor statistice
2 Alegerea şi calcularea parametrului statistic al testului
3 Regiunea critică
4 Concluzia testului
1 Formularea problemei icircn termenii ipotezelor statistice
Ipoteza nulă ipoteza care trebuie testată testul efectuacircndu-se sub prezumţia că ipoteza nulă ar
fi adevărată
Ipoteza alternativă acea ipoteză care icircntr-un sens sau altul contrazice ipoteza nulă Această
ipoteză se mai numeşte şi ipoteza de lucru
Ipoteza nulă tipuri
O coadă (ldquoone-tailedrdquo sau ldquoone-siderdquo)
Media este mai mare
Media este mai mică
Două cozi (ldquoone-tailedrdquo sau ldquoone-siderdquo)
Media este egală
2 Alegerea şi calcularea parametrului statistic al testului
Parametrul statistic al testului exprimă icircntr-o anumită formă diferenţa dintre elementele comparate
Ţinacircnd seama de faptul că eşantionul sau eşantioanele utilizate sunt aleator extrase din populaţiile care
fac obiectul testului parametrul statistic este o variabilă aleatoare de selecţie care urmează o anumită
lege de probabilitate
Un parametru statistic al testului bun trebuie să icircndeplinească două condiţii
19
Trebuie să se comporte diferit atunci cacircnd ipoteza nulă H0 este adevărată faţă de situaţia icircn
care ipoteza alternativă H1 este adevărată
Distribuţia de probabilitate a parametrului statistic al testului sub prezumţia că H0 este
adevărată este cunoscută
3 Regiunea critică
- Trebuie să fim capabili să decidem icircn funcţie de valoarea parametrului statistic calculat care dintre
ipoteze cea nulă sau cea alternativă este adevărată
- Dacă valoarea parametrului statistic aparţine regiunii critice ipoteza nulă H0 va fi respinsă şi va fi
acceptată ipoteza alternativă H1
- Dacă valoarea parametrului statistic nu aparţine regiunii critice ipoteza nulă H0 va fi acceptată
- Decidem mărimea regiunii critice
Pentru aceasta trebuie să specificăm mărimea riscului de eroare pe care icircl acceptăm
Pe scurt definim nivelul de semnificaţie notat cu a sau mărimea riscului pe care
suntem dispuşi să ni-l asumăm icircn respingerea ipotezei nule H0 icircn cazul icircn care aceasta
este adevărată De obicei se alege un nivel de semnificaţie icircntre 1 şi 5
Probabilitatea unei erori de tipul I
probabilitatea de respingere a ipotezei nule H0 icircn favoarea ipotezei alternative H1 icircn
condiţiile icircn care H0 este adevărată
probabilitatea unei erori de tipul I se notează cu a şi se mai numeşte nivel de
semnificaţie al testului
Probabilitatea unei erori de tipul II
probabilitatea acceptării ipotezei nule icircn condiţiile icircn care ipoteza alternativă H1 este
adevărată
această probabilitate se notează cu b
- Unilaterală la dreapta ndash valoarea parametrului statistic al testului este mai mare sau egală cu
valoarea din dreapta a intervalului critic
- Unilaterală la stacircnga ndash valoarea parametrului statistic al testului este mai mică sau egală cu
valoarea din stacircnga a intervalului critic
- Bilaterală ndash valoarea parametrului statistic al testului este mai mică sau egală cu valoarea extremă
din stacircnga regiunii critice sau mai mare sau egală cu valoarea extremă din dreapta regiunii critice
valorile extreme ale regiunii critice avacircnd nivele egale de semnificaţie
4 Concluzia testului
- Ipoteza nulă H0 este respinsă dacă valoarea parametrului statistic aparţine regiunii critice
20
- Regiunea critică trebuie astfel aleasă icircncacirct dacă ipoteza alternativă H1 este adevărată
probabilitatea de respingere a ipotezei nule H0 este mai mare decacirct icircn cazul icircn care ipoteza nulă H0
ar fi adevărată
- Acceptarea ipotezei nule H0 atunci cacircnd ipoteza alternativă H1 este adevărată este cunoscută ca şi
eroarea de tipul II
a probabilitatea ei se notează cu b
b măsoară bdquonivelul de eroarerdquo
- Icircn testarea oricărei ipoteze statistice există patru situaţii care determină dacă decizia noastră este
corectă sau nu
Cazuri
H0 este adevărată H0 este falsă
Concluzie H0 se acceptă decizie corectă eroare de tipul
II
H0 se
respinge
eroare de tipul I decizie corectă
Luarea deciziei pe baza valorii probabilităţii p de semnificaţie a testului
Icircn momentul icircn care prelucrăm statistic o serie de date dorim să ştim dacă rezultatele obţinute sunt sau
nu semnificative statistic
Răspunsul la această icircntrebare este dat de valoarea lui p calculată de orice program statistic la
prelucrarea unor date
Icircn cazul testelor statistice ipoteza nulă este respinsă dacă nivelul de semnificaţie este mai mic decacirct
005 iar programele de prelucrare statistică a datelor vor afişa o steluţă () icircn tabelul rezultatelor
21
Dacă p le 005 respingem ipoteza nulă şi acceptăm ipoteza alternativă (am obţinut semnificaţia
statistică)
Dacă p gt 005 acceptăm ipoteza nulă (nu am obţinut semnificaţia statistică)
p = 013
NU respingem ipoteza nulă
Risc de eroare de tip II
α = 005
p = 002
Respingem ipoteza nulă
Risc de eroare de tip I
Semnificaţia lui p
Criteriu de luare a deciziei cu privire la o ipoteză statistică nulă
Cuantifică şansa ca o decizie de respingere a ipotezei nule să fie greşită
Măsură a semnificaţiei statistice şi NU CLINICĂ
22
Semnificaţia lui p (reguli empirice)
001 le p lt 005 rezultatul e semnificativ statistic
0001 le p lt 001 rezultatul e icircnalt semnificativ statistic
p lt 0001 rezultatul e foarte icircnalt semnificativ statistic
p ge 005 rezultatul e considerat nesemnificativ statistic
Limite ale valorii p
Valoarea p NU ne dă informaţii despre
Şansa de beneficiu a unui pacient individual
Procentul de pacienţi care vor avea un beneficiu icircn urma instituirii procedurii medicale
Gradul de beneficiu expectat pentru un anumit pacient
Puterea unui test statistic
Este capacitatea de a detecta o diferenţă acolo unde există
Creşterea volumului eşantionului determină creşterea puterii testului statistic aplicat
Valoarea este icircn relaţie directă cu eroarea de tip II
Puterea = 1 ndash β
Cea mai utilizată modalitate de creştere a puterii unui test statistic este de a creşte volumul
eşantionului
Tipul scalei de măsură ndash testul statistic
Denumire test Interval Nominal Observaţii
Corelaţie Pearson 2 0 Există o relaţie liniară
χ2 0 2
Student 1 1 Doar 2 grupuri
ANOVA 1 1 2 sau mai multe grupuri
Student perechi 1 1 Eşantioane perechi
Măsurători repetate (ANOVA) 1 1 Mai mult de 2 grupuri date
perechi
Inferenţa statistică pe date calitativ e
Tabela de contingenţă 2times2
Riscuri şi raţii
Testul χ2 (testarea asocierii icircn tabela de contingenţă)
Testul Fisher
23
Testul z pentru proporţii
Testul McNemar
Tabela de contingenţă 2times2
Scale de tip nominal (dicotomiale tabela de contingenţă de 2times2) sau ordinal (tabela de contingenţă de
rtimesc)
Frecvenţa absolută (numărul de evenimente per categorie)
Tabela de contingenţă de 2times2 4 categorii
AP = adevărat pozitiv
FP = fals pozitiv
FN = fals negativ
AN = adevărat negativ
Ulcer deschis Ulcer vindecat Total
Recurenţă + AP = 1 FP = 5 = 1+5 = 6
Recurenţă - FN = 7 AN = 16 = 7+16 = 23
Total =1+7=8 =5+16=21 29
Riscuri şi raţii Mărimi ale asocierii
Denumire Formula Definiţie
Rata falşilor pozitivi =FP(FP+AN) Probabilitatea unui test fals + (α)
Rata falşilor negativi =FN(FN+AP) Probabilitatea unui test fals ndash (β)
Sensibilitate =AP(AP+FN) Probabilitatea unui test real + (1- β)
Specificitate =AN(AN+FP) Probabilitatea unui test real ndash (1- α)
Acurateţe =(AP+AN)n Probabilitatea generală a unei decizii corecte
Valoarea predictivă pozitivă =AP(AP+FP) Probabilitatea ca un test pozitiv să fie corect
Valoarea predictivă negativă =AN(AN+FN) Probabilitatea ca un test negativ să fie corect
Riscul relativ =AP(FP+AN)FN(AP+FP)
Rata şansei =(AP∙AN)(FN∙FP)
Riscul atribuabil =AP(AP+FP)-FN(FN+AN)
24
Denumire Formula
Rata falşilor pozitivi = 5(5+1) = 08334
Rata falşilor negativi = 7(7+16) = 03043
Sensibilitate = 1(1+7) = 01250
Specificitate = 16(16+5) = 07619
Acurateţe = (1+16)29 = 05862
Valoarea predictivă pozitivă = 1(1+5) = 01667
Valoarea predictivă negativă = 16(16+7) = 06957
Riscul relativ = 1(5+16)7(1+5) = 2142 = 050
Rata şansei = (1∙16)(7∙5) = 04571
Riscul atribuabil = 1(1+5)-7(7+16) = 01667-03043=-01376
Testarea asocierii icircn tabela de contingenţă
Testul χ2
Nu trebuie utilizat pentru eşantioane de volum mic
Testul este valid doar dacă valoarea expectată (aşteptată) pentru fiecare celulă este cel puţin
egală cu 1 şi frecvenţa absolută observată este de minim 5
Dacă aceste condiţii nu sunt icircndeplinite se aplică testul exact al lui Fisher (Fisherrsquos Exact Test)
Indică dacă cele două variabile sunt sau nu independente DAR NU cuantifică puterea asocierii
dintre ele
Problema S-a investigat icircntr-un studiu asocierea dintre obezitatea (ca factor de risc) şi bolile
cardio-vasculare la persoanele icircn etate (gt 60 ani) Din totalul de 620 persoane investigate s-au
identificat 150 persoane cu obezitate şi boală cardio-vasculară 230 persoane fără obezitate şi
fără boală cardio-vasculară şi 60 persoane fără obezitate dar cu boală cardio-vasculară Există
o asociere icircntre obezitate şi boala cardio-vasculară (df=1 α=005 χ2critic = 384)
Testul χ2 exemplu
H025
Nu există asociere icircntre obezitate şi bolile cardio-vasculare
Obezitatea şi bolile cardio-vasculare sunt independente
H1
Există asociere icircntre obezitate şi bolile cardio-vasculare
Obezitatea şi bolile cardio-vasculare sunt asociate
a = 005 pragul de semnificaţie al testului
urmează o lege cu (r-1)(c-1) grade de libertate
χ2 = parametrul testului χ2
fio = frecvenţa observată
fit = frecvenţa teoretică
Regiunea critică este [χα2 yen)
Pentru α = 005 χα2 = 384
OBSERVAT BCV+ BCV- Total
Obezitate + AP = 150 FP = 180 330
Obezitate - FN = 60 AN = 230 290
Total 210 410 620
TEORETIC BCV+ BCV- Total
Obezitate + = 330times210620 = 330times410620 330
Obezitate - = 290times210620 = 290times410620 290
Total 210 410 620
TEORETIC BCV+ BCV- Total
Obezitate + = 330times210620 = 330times410620 330
26
Obezitate - = 290times210620 = 290times410620 290
Total 210 410 620
TEORETIC BCV+ BCV-
Obezitate + = 112 = 218
Obezitate - = 98 = 192
Deoarece 4177Icirc[384 yen) se respinge H0 cu un risc de eroare de 5
Există asociere icircntre obezitate şi bolile cardio-vasculare
Testul Fisher
Corecţie a testului χ2
Valoarea p asociată parametrului ne dă probabilitatea ca valoarea observată de independenţă să fie
atribuită doar şansei
O valoare p mică indică că există alte cauze decacirct şansa influenţează rezultatul şi astfel cele două
variabile investigate nu sunt independente
Testul Fisher = dispersia corectată a factorului x dispersia corectată a factorilor reziduali
Icircn acest context regula adunării dispersiilor se poate scrie unde
este variaţia lui y pe seama variaţiei variabilei x
este variaţia lui y pe seama influenţei factorilor reziduali (neicircnregistraţi)
este variaţia totală a caracteristicii y
Testul Fisher empiric se calculează după formula
27
se compară cu Ftab pentru nx şi nz grade de libertate la un anumit prag de semnificaţie stabilit
Dacă Fc gt Ftab rezultă că variaţia factorului de grupare x este semnificativă pentru variaţia caracteristicii y
Testul z pentru proporţii
1 Compararea unei frecvenţe observate cu o frecvenţă teoretică
2 Testarea egalităţii a două frecvenţe
Testul z Compararea unei frecvenţe observate cu o frecvenţă teoretică
Scop Investigarea semnificaţiei diferenţei icircntre o frecvenţă teoretică p (icircntr-o populaţie) şi o frecvenţă
observată f pe un eşantion reprezentativ (variabilă calitativă (binare))
Condiţii de aplicare Testul este corect aplicat dacă numărul n al observaţiilor eşantionului este
suficient de mare (n∙p n∙(1-p)gt10
Parametrul
n = volumul eşantionului
Suntem interesaţi de investigarea prevalenţei hepatitei B la personalul care lucrează icircn laboratoarele
clinicilor de boli infecţioase din Transilvania Se ştie din studii anterioare că prevalenţa hepatitei B icircn
populaţia generală din Transilvania este de 9 S-a luat icircn studiu un eşantion de 100 persoane şi s-a
obţinut o prevalenţă a hepatitei B de 6 Există diferenţă semnificativă icircntre frecvenţa hepatitei B la
personalul care lucrează icircn laboratoarele spitalelor de boli infecţioase din Transilvania faţă de
populaţia generală
f = 006 p = 009 n = 100
Ipoteza nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat
faţă de frecvenţa hepatitei B icircn populaţia generală
Ipoteza alternativă test bilateral Există diferenţă semnificativă icircntre frecvenţa hepatitei B la
nivelul eşantionului şi prevalenţa hepatitei B icircn populaţia generală
f = 006 p = 009 n = 100
Pragul de semnificaţie a = 005
Regiunea critică test bilateral (-yen -196 ]Egrave[196 yen)
28
Concluzia testului
Deoarece parametrul statistic calculat al testului nu aparţine regiunii critice se acceptă ipoteza
nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat faţă de
frecvenţa hepatitei B icircn populaţia generală
Testul McNemar
Evaluarea dependenţei variabilelor calitative perechi (dorim să determinăm dacă o anumită
caracteristică este sau nu asociată cu o anumită patologie)
Identificăm n pacienţi care prezintă patologia de interes (eg Cancer bronho-pulmonar) şi n
pacienţi cu aceleaşi caracteristici ca şi primul grup dar care nu o prezintă
Martor = da Martor = nu
Caz = da a b
Caz = nu c d
Testul McNemar - exemplu fumat vs cancer
Martor = da Martor = nu
Cancer = da a = 2 b = 5
Cancer = nu c = 0 d = 3
29
χ2critic(α=005) = 384
32 lt 384 rarr acceptăm ipoteza nulă
Fumatul nu este icircn relaţie cu apariţia cancerului bronho-pulmonar
Inferenţa statistică pe date cantitative
Variabile cantitative continue
Testul z şi Student (t) (o medie sau medii perechi)
Testul z şi Student (t) (testarea a două medii)
ANOVA (ge 3 medii)
Ranguri (variabile cantitative discrete sau cantitative care nu icircndeplinesc condiţia de
normalitate)
Testul sumei rangurilor Wilcoxon
Kruskal-Wallis (ge 3 eşantioane independente)
Friedman (ge 3 eşantioane dependente)
Teste de normalitate variabile cantitative continue
Shapiro-Wilk
Kolmogorov-Smirnov
Shapiro-Wilk
Chi-Square Goodness-of-Fit
Dacă datele urmează o distribuţie normală aplicăm un test parametric
Dacă datele nu urmează o distribuţie normală aplicăm un test de comparare al rangurilor
30
Testul Z de comparare a mediei unui eşantion cu media unei populaţii
Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ
extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie
s2 care se cunoaşte
Condiţii de aplicare
1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru
compararea mediei unui eşantion cu media unei populaţii)
2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal
distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă
3 Talia eşantionului este mare ( ge 30)
Ipoteze
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media
eşantionului şi media populaţiei
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
(-yen -196 ] Egrave [196 yen)
Parametrul testului
n = volumul eşantionului
= media eşantionului
s = deviaţia standard a populaţiei
Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)
Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard
cunoscută
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi
media standard
Condiţii de aplicare
Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se
realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această
condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea
31
Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai
puternic
Numărul de grade de libertate (df) df = n-1
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
Parametrul testului
n = volumul eşantionului
micro0 = media standard
= media eşantionului
s = deviaţia standard a eşantionului
Testul ANOVA compararea mediilor a mai multe eşantioane
H0 = toate mediile sunt egale
H1 = nu toate mediile sunt egale
Condiţii de aplicare
1 Datele sunt independente unele faţă de celelalte
2 Datele fiecărui grup sunt normal distribuite
3 Deviaţia standard este aceeaşi pentru toate grupurile
Id Medicament
A B C D E F
1 5 6 7 10 5 9
2 6 8 8 11 8 8
3 7 7 9 13 6 7
4 8 9 11 12 4 5
32
5 9 10 10 9 7 6
Suma 35 40 45 55 30 35
Media 7 8 9 11 6 7
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =
= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)
Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2
F = (suma pătratelor(icircntre))(suma pătratelor(icircn))
Suma pătratelor (icircntre) = 16times5 = 80
Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60
Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn
interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare
SP df Media pătratelor F = MPicircntreMPicircn
Icircntre 80 5 = 805 = 16 = 1625 = 64
Icircn 60 24 = 6024 = 25
Total 140 29 -
Testul sumei rangurilor Wilcoxon
Aplicat pentru
Un set de observaţii provenite dintr-o valoare ipotetică comună
Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)
Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero
Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace
Suma rangurilor pentru diferenţele negative = 2+3+1 = 6
Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30
33
Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului
egal cu 8 = 0109
Icircnainte După Diferenţa Rang
64 66 -2 2
66 58 8 5
67 68 -1 3
71 65 6 4
72 75 -3 1
76 67 9 6
78 59 19 8
89 74 15 7
Testul Kruskal-Wallis (ge 3 eşantioane independente)
Test de ranguri aplicate pe mai mult de 3 eşantioane
H = parametrul testului
n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)
Tk = suma rangurilor
Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie
pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni
34
df = k-1 (k = numărul de eşantioane)
df = 3-1 = 2
Hcritic(α=005) = 599
H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie
pozitivă şi respectiv biopsie negativă
Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie
a tipului de studiu pe eşantioane perechi)
1 Definirea numărului de tratamente k
2 Obţinerea rangurilor pentru fiecare tratament
3 Sumarea rangurilor fiecărui tratament
4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)
5 Dacă Fr gt Frcritic rarr respingem H0
Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost
măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi
n = 9 k = 3 T12 = 225 T2
2 = 38025 T32 = 38025
Frcritic = 599
Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de
prostată
35
De reţinut
Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei
Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-
of-Fit
Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z
Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t
Compararea mediilor a 3 sau mai multe eşantioane ANOVA
Compararea mediilor a două populaţii (σ) testul Z
Compararea mediilor a două eşantioane (s) testul t
Compararea mediilor a două eşantioane perechi (s) testul t
ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi
cu cel pentru compararea a două eşantioane perechi
Ranguri
Distribuţia datelor nu are importanţă
Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)
Trei sau mai multe eşantioane Kruskal-Wallis
Trei sau mai multe eşantioane perechi Friedman
Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia
Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a
datelor)
Variabile nominale
Un singur eşantion sau eşantioane perechi
Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte
Eşantioane perechi testul Mc Nemar
Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2
Icircn analiza proporţiilor există teste diferite pentru
Compararea unei frecvenţe cu o frecvenţă cunoscută
Compararea a două frecvenţe
Semnificaţia statistică
Valoarea p (p value)
Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor
două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E
posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării
aleatorii
36
Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală
urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii
Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este
probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un
experiment de dimensiunea acestuia
Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că
diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii
diferite
Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca
fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă
ar fi fost adevărată
Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă
1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe
baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De
fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001
2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie
3 Se aplică testul statistic aferent pentru a calcula valoarea p
4 Se compară valoarea p cu valoarea ndash prag
5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe
semnificativă dpdv statisticrdquo
6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e
semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să
conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă
Teste de semnificaţie
Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului
populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)
Testarea ipotezelor implică posibile erori
Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile
sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui
grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul
icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005
ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există
37
nici o diferenţă
Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ
statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de
ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost
ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau
dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă
cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă
semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe
ipotetice variate icircn cazul icircn care ele există
Măsuri ale frecvenţei
Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)
Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate
Generic formula pe care se bazează toate cele trei este
unde x şi y sunt cantităţile de comparat
Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea
unei frecvenţe pe grupe de sex vacircrstă etc
Proporţia implică icircn mod necesar ca x să fie inclus icircn y
Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară
frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp
Pentru calcularea unei rate trebuie ţinut cont de trei aspecte
bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin
bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp
bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo
Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un
tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei
populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei
aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)
38
Indicatori
Rata de incidenţă
Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă
icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii
Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o
perioadă de timp
Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de
timp x
Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei
susceptibili de a dezvolta icircmbolnăvirea studiată
Numitorul poate fi
bull Numărul mediu al populaţiei icircn perioada de timp studiată
bull Mărimea populaţiei icircn mijlocul perioadei de studiu
bull Mărimea populaţiei la icircnceputul studiului
Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă
Este obligatorie menţionarea perioadei de timp
Prevalenţa
Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la
un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă
schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa
momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)
39
Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include
numai cazuri noi respectiv include cazuri noi şi vechi
Rata de atac
Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este
folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp
raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori
Rata persoană-timp
Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din
momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte
migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost
observate
Riscul relativ (RR)
Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment
legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele
prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două
grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la
bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la
bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai
mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo
Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2
Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn
cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă
(Tabelul 1)
Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR
Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la
neexpuşi
40
Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de
culegere a datelor
Odds ratio (OR)
Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin
raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general
studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)
Tabelul 2 Tabelul 2 x 2 pentru calcularea OR
Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală
Rate de mortalitate
Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp
specificată Există mai multe tipuri de rate de mortalitate
o Mortalitate specifică pe sex
o Mortalitate specifică pe rasă
o Mortalitate specifică pe boală
o Mortalitate neonatală
o Mortalitate postneonatală
o Mortalitate infantilă
o Mortalitate maternă
Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP
41
Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de
viaţă şi vacircrsta la care survine decesul dacă este prematur
Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu
Ani de viaţă pierduţi datorat dizabilităţii
Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt
utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru
cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite
grupuri
Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de
risc şi o boală se folosesc riscul relativ şi odds ratio
35 Analiza şi interpretarea datelor
După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date
trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul
Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor
colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului
studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu
plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde
prezenţa biostatisticianului este necesară
Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu
elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat
iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului
iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate
depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori
testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere
clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza
Interpretarea rezultatelor statistice
Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne
motive (număr mic de date) acceptarea ei să fie falsă
Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine
gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia
ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument
de decizie Intervalul de confidenţă
42
Interpretarea statistica ne interpretarea clinică
Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă
Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice
obţinute pe eşantionul studiat
Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare
Ce interpretăm Rezultatele
personale obţinute icircn urma studiului
care au fost prezentate icircn secţiunea bdquoRezultaterdquo
Explicăm rezultatele obţinute
Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale
Interpretarea trebuie să se realizeze icircn
lumina limitelor studiului
contextul cultural social şi educaţional al locului unde s-a realizat cercetarea
contextul a ceea ce se cunoaşte din literatura de specialitate
Interpretăm doar rezultatele personale obţinute icircn urma studiului
Interpretarea statistică nu este tot una cu interpretarea clinică
Interpretarea statistică este importantă
Interpretarea clinică este foarte importantă
Intervalul de confidenţă
Media calculată pe baza unui eşantion nu va echivala media populaţiei
Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului
Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a
populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a
populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)
pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru
orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare
dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de
confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de
date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de
5
Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel
Dacă valoarea p este mică
Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare
aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o
medie diferită Diferenţa este semnificativă dpdv statistic
43
Icircn continuare
Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa
reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică
pentru a fi interesante din punct de vedere ştiinţific
Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC
oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care
este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a
obţine o concluzie clară
Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o
diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că
datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din
punct de vedere ştiinţific
Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul
detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat
Erorile studiilor medicale
Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura
anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară
caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea
asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri
legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias
Erorile potenţiale icircn studiile epidemiologice
1 Erori icircntacircmplătoare
2 Erori sistematice
3 Confuzia
4 Validitatea
1 Erori icircntacircmplătoare
Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a
parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel
de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot
fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii
(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor
de măsură (eroarea de măsurare)
44
2 Erori sistematice
Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate
care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu
acurateţe mare Acurateţea nu este afectată de mărimea eşantionului
Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de
experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea
dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus
şi greu de cuantificat (consum de alcool personalitate etc)
Principalele tipuri de erori din această categorie sunt
bull Biasul de selecţie
bull Biasul de informaţie
Biasul de selecţie
Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul
trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion
inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale
persoanelor incluse
Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se
ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia
Biasul de informaţie
Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de
instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze
expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere
nesemnificativă sau chiar să nu şi-o amintească de loc
3 Confuzia
Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune
prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este
cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă
de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte
important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor
protector
4 Validitatea
Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă
Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte
estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional
Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă
45
conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se
demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)
Validitatea externă se poate realiza numai dacă studiul este valid intern
Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii
studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de
studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt
laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi
validă din punct de vedere intern)
3 6 Prezentarea rezultatelor
După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite
Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor
icircntr-o formă bdquodigerabilărdquo este necesară
Scopul prezentării datelor
1 Transmiterea concluziilor studiului
a Datele corecte şi importante merită comunicate
b Datele trebuie să confirme sau să infirme ipoteza studiului
c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală
2 Acordarea posibilităţii altor cercetători să aprecieze studiul
a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti
b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor
prezentate
Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru
fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie
statistică
Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de
valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras
(Tabel 3)
Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)
46
Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct
numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor
precum şi prezentarea acestora sub formă inteligibilă
Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care
convin cercetătorului
Prezentarea datelor se poate face
1 Figuri şi tabele icircn articole scrise
2 Figuri şi tabele icircn prezentări orale
3 Figuri şi tabele icircn postere
4 Text scris sau incluse icircn text
5 Site-uri de WEB
Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor
Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie
Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele
exprimacircnd exact ceea ce acestea exprimă
Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate
anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel
să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se
acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca
mai sus sugestive sunt formatele simple şi puţin icircncărcate
Dacă nu există reguli impuse se respectă
1 Mesaj simplu fără falsificarea datelor
2 De obicei este necesar atacirct tabelul cacirct şi graficul
3 Să fie simplu şi clar
Tabele
Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile
coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică
elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de
1 Se folosesc doar linii orizontale
2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn
evidenţi prin linie de separare (Tabelul 4)
Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland
Noua Zeelandă)
(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)
47
3 Numerele sunt aliniate icircn funcţie de virgulă
4 Indicii statistici sunt explicaţi sub tabel
5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană
6 Abrevierile pot fi folosite
7 Numărul de zecimale trebuie limitat la maxim două
8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel
9 Plasarea legendei este obligatorie sub tabel
10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)
Icircn cazul prezentărilor orale sau a posterelor este indicat ca
1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării
2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte
3 Folosirea de simboluri este permisă
Clasificarea tabelelor
Tabelele se clasifică după
i) conţinut
bull cu distribuţii de frecvenţe
bull de clase de frecvenţe
bull de contingenţă
ii) structura
bull cu doua coloane
bull cu subclasificări
bull ldquomasterrdquo
Tabele ce conţin distribuţii de frecvenţe
O modalitate comodă de a prezenta o mulţime de date brute este
1 Se ordonează datele in ordine crescătoare
2 Se determine frecvenţa fiecărei valori
3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane
(Tabelul 5)
Tabelul 5 Distribuţii de frecvenţă absolută
48
Tabelul claselor de frecvenţe
1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă
2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)
Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)
Tabele de contingenţă
1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a
tabelelor de contingenţă
2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a
combinaţiilor de perechi ordonate de valori
3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre
a factor de risc si
b starea sănătăţii
4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)
5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)
Tabelul 7 Tabel de contingenţă 2 x 2
49
Grafice
Există două categorii de moduri grafice sub care se pot prezenta datele
1 Ilustraţii şi fotografii
2 Grafice
1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă
pentru lucrare
2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit
Putem vorbi despre mai multe tipuri de grafice
bull Grafice pentru reprezentarea datelor cantitative
1048707 Grafic cartezian (X Y)
1048707 Histograma
1048707 Poligonul de frecvenţe
1048707 Diagrama bdquoscatterrdquo
bull Grafice pentru reprezentarea datelor calitative
1048707 Grafic cu bare
1048707 Diagrama tip bdquoboxplotrdquo
1048707 Diagrama bdquopierdquo
1048707 Cartograma
Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi
dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)
Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)
Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie
Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)
Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)
50
Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir
de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele
două variabile studiate (Figura 6)
Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2
(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2
rămacircne aproximativ constantă)
Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea
comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea
comparativă a mai multor variabile
Figura 7 Grafic calitativ cu bare
51
Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo
Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două
posibilităţi reprezentate grafic este mai frecventă (Figura 8)
Figura 8 Reprezentare tip bdquopierdquo
Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli
sau a oricărui element comparativ Se foloseşte de epidemiologi
Rezultate
Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare
Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o
manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu
explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția
bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la
ilustraţii tabele grafice
Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi
nici rezultatele care invalidează eventual ipoteza
Discuţii
Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd
cultura ştiinţifică şi inteligenţa autorilor
Acest capitol răspunde la trei obiective
Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia
calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de
selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează
rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv
52
este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn
care a fost abordată problema fără a face o revistă a literaturii
Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea
rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul
Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor
afirmaţii nesusţinute de conţinutul lucrării
Concluzii
Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate
să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie
Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de
concluzii va scădea valoarea lucrării
Bibliografia (lista referinţelor citarea icircn text)
Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn
lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente
Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli
- să conţină cele mai importante şi recente lucrări
- să includă numai lucrări publicate
- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate
Bibliografie
Elisabeta Jaba ndash Statistică Ed Economică 1998
Mihai Ţarcă ndash Statistică volI Ed UAIC 1979
Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale
Ed University Press 2009
Sorana Daniela Bolboacă ndash Metodologia cercetării curs
53
1 Cercetarea ştiinţifică medicală
Progresele tehnice incontestabile din ultima perioadă cu repercusiuni favorabile asupra evoluţiei
generale a societăţii umane au contribuit şi la apariţia a numeroși factori de risc care pot influenţa starea de
sănătate
Icircncercările de a depista corelaţiile dintre starea de sănătate sau de boală şi factorii
de risc de a evalua mecanismele prin care ei acţionează de a găsi remediile medicamentoase sau profilactice
nasc o serie de icircntrebări răspunsul la aceste icircntrebări fiind adus de cercetarea ştiinţifică
Un proiect de cercetare pe baza căruia se va desfășura un studiu clinico-epidemiologic
icircşi găseşte originea icircn
bull curiozitatea cercetătorului pentru o problemă medicală
bull icircncercarea de a descrie unele inadvertenţe existente icircntre ceea ce se observă şi ceea ce ar trebui să fie icircn
practica medicală
bull calităţile de observator şi experienţa profesională a cercetătorului
bull abilitatea cercetătorului de a găsi cele mai eficiente metode de rezolvare a
problemelor ivite
2 Scopul justificarea şi calităţile unui studiu medical
Scopul unui studiu de cercetare este de a da răspuns la icircntrebări cu privire la
bull cauzalitate la documentarea unei relaţii stracircnse icircntre unul sau mai mulţi factori de risc şi boală
bull istoria naturală a unei boli sau dinamica acesteia icircncepacircnd cu momentul impactului factorului de risc
(inclusiv a factorilor de natură biologică) cu macroorganismul urmacircnd apoi fazele incubaţia bolii perioada de
stare şi faza finală urmată de vindecare imunitate cronicizare sau deces Dacă pentru bolile infecţioase aceste
faze cu precădere primele două sunt mai bine definite icircn bolile neinfecțioase debutul este imprecis iar
perioada de latenţă este de obicei asimptomatică deci mai greu se poate depista boala icircn aceste faze
bull prognosticul bolii aprecierea cacirct mai aproape de certitudine a evoluţiei unei boli Factorii prognostici sunt
apreciaţi prin studii epidemiologice de cohortă icircn care se pot evalua indicatori ca supravieţuirea unui bolnav la
5 ani după un anumit moment cheie din istoria naturală a bolii rata de fatalitate rata de răspuns la tratament
ratele de recidive şi remisii ale bolii
bull tratamentul eficienţa şi eficacitatea unui tratament sunt frecvente subiecte de cercetare pentru abordarea lor
se apelează la trialuri clinice controlaterandomizate
Se pot analiza de asemenea scheme noi de tratament eficienţa unor preparate sau scheme de aplicare a
preparatelor profilactice (vaccinuri dezinfectanţi etc)
2
bull profilaxia icircmbolnăvirilor include totalitatea măsurilor care pot influenţa cauzele modificabile ale unei boli şi
se efectuează icircn patru trepte profilaxia primordială primară secundară şi terţiară
Justificarea studiului clinic
Justificarea studiului pleacă de la informaţiile existente legate de subiectul pe care cercetarea
intenţionează să icircl dezbată informaţii existente icircn literatura de specialitate
Cercetarea bibliografică permite identificarea unor lipsuri icircn legătură cu problema luată icircn studiu
inexistenţa de date referitoare la o icircmbolnăvire dintr-o zonă geografică (ţară judeţ comunitate) explicarea şi
emiterea unor soluţii de remediu Toate acestea ar putea fi elemente care justifică iniţierea şi derularea unui
studiu
Icircn justificarea studiului se poate insista pe
bull caracterul nou actual inedit al problemei
bull un nivel ridicat al morbidităţii sau mortalităţii unui fenomen de sănătate
bull gravitatea evenimentului
Calităţile studiului de cercetare
Un bun studiu de cercetare trebuie să fie pertinent nou fezabil să respecte etica medicală
Un studiu este pertinent cacircnd are repercusiuni asupra viitorului clinic al unui fenomen de sănătate pertinența
practică icircnsemnacircnd o mai bună cunoaştere a bolii a prognosticului ei ameliorarea tehnicilor de diagnostic şi
de tratament etc
O altă cerinţă se referă la ineditul studiului faptul de a fi nou icircn sensul de a aduce informaţii noi să nu repete
un studiu deja finalizat şi cu concluzii ferme
Cercetătorul trebuie icircnainte de a demara studiul icircnainte de a investi timp bani energie să estimeze dacă
studiul este fezabil Icircn acest sens trebuie să se asigure că
bull are un număr suficient de subiecţi determinări de laborator etc pentru a putea trage concluzii adecvate
bull nu există constracircngeri tehnologice sau financiare
bull studiul este accesibil şi acceptat de populaţie
bull nu are costuri de timp dar mai ales financiare mari
bull nu are scopuri prea ambiţioase sau scopuri multiple icircn general un studiu ar trebui să aibă un singur scop să
găsească rezolvarea la o singură icircntrebare
Studiul medical trebuie să respecte etica medicală cele patru principii
bull interesul şi beneficiul cercetării
bull inocuitatea (nevătămarea cercetării)
bull respectul faţă de persoanele incluse icircn studiu (respectul intimităţii persoanelorconfidenţialitatea datelor)
bull păstrarea echităţii şi respectul valorilor morale
In efectuarea unui studiu este necesară parcurgerea următoarelor etape
1 Pregătirea studiului
3
2 Elaborarea protocolului
3 Culegerea informaţiilor (datelor)
4 Prelucrarea datelor
5 Analiza şi interpretarea rezultatelor
6 Prezentarea rezultatelor
7 Redactarea studiului
3 Etapele unui studiu de cercetare
31 Pregătirea studiului de cercetare
Pregătirea studiului de cercetare comportă mai multe sub-etape
bull Documentarea bibliografică
bull Definirea fenomenului
bull Formularea temei de cercetare
bull Aspecte manageriale
Documentarea bibliografică
Cercetarea bibliografică are misiunea de a realiza un compromis icircntre excesul de documente (anual se
publică icircn icircntreaga lume peste 20000 de reviste cu caracter medical) şi pierderea de informaţii pertinente
Cercetarea bibliografică necesită o selectare şi o evaluare a literaturii de specialitate pe o anumită problemă şi
se realizează prin parcurgerea a trei etape
a) Prima etapă este cercetarea bibliografică propriu-zisă adică identificarea publicaţiilor care se referă la
subiectul icircn discuţie
Etapele documentării bibliografice sunt
bull Definirea şi delimitarea precisă a subiectului de cercetat
bull Stabilirea unei liste de bdquocuvinte cheierdquo prin lectura referinţelor bibliografice
bull Traducerea icircn limbi de circulaţie internaţională
bull Stabilirea unei liste cu documentele de cercetat
bull Consultarea unor tratate sau cărţi de referinţă
bull Consultarea publicaţiilor primare
bull Redactarea fişelor bibliografice şi aranjarea lor icircn ordine alfabetică
bull Introducerea referinţelor bibliografice icircn textul propriu-zis
Literatura primară de specialitate
Reprezintă toate materialele scrise care conţin studii originale
Articole ştiinţifice Au calitatea esenţială că informaţiile publicate sunt recente intervalul de timp scurs de la
scriere la publicare fiind icircn general foarte scurt
4
Teze de doctorat licenţă Se pot găsi icircn bibliotecile instituţiilor de icircnvăţămacircnt superior Sunt utile pentru că
icircn general tratează pe larg o anumită problemă care poate fi de interes avacircnd şi o bibliografie recentă
Brevete şi mărci Sunt acele sisteme de protecţie a produselor şi tehnologiilor Sunt utile icircn general icircn
cercetarea experimentală
Literatura secundară de specialitate
Tratate de specialitate Sunt foarte importante icircn faza incipieintă a unui studiu pentru aprofundarea problemei
de cercetat Informaţiile prezente icircn astfel de publicaţii sunt ordonate cu noţiuni de bază definiţii teorii
posibile etc
Cărţi de referinţă Sunt monografii care studiază pe larg un fenomen putacircnd fi foarte utile atacirct cercetătorilor
debutanţi cacirct şi celor iniţiaţi
Literatura terţiară de specialitate este reprezentată de indexuri reviste cu extrase de articole şi rezumate
Cercetarea bibliografică bdquoon-linerdquo permite accesul la nenumărate surse de informare utilizacircnd icircn acest scop
motoare de căutare
b) A doua etapă este lectura critică activă a publicaţiilor selectate pentru a judeca valoarea publicaţiilor
indiferent dacă este vorba de calitatea cercetării sau de pertinenţa rezultatelor publicate
Evaluarea corectă critică a unui articol va permite cititorului să aprecieze dacă publicaţia este credibilă
rezultatele corespund realităţii (validitatea internă) respectiv dacă informaţiile conţinute icircn publicaţie sunt
aplicabile icircn practica medicală dacă se pot generaliza dacă sunt aplicabile icircn proiectul de cercetare al
viitorului investigator (validitatea externă)
Lectura critică a literaturii medicale se bazează pe folosirea unei grile de lectură care are meritul de a putea fi
aplicată tuturor tipurilor de publicaţii Această grilă are 8 criterii de evaluare pentru fiecare criteriu trebuie să
se răspundă la următoarele icircntrebări
bull este posibil să se găsească icircn articol informaţia pentru criteriul icircn cauză
bull dacă criteriul abordat este corect
bull dacă criteriul este incorect icircn ce măsură ameninţă validitatea studiului
Cele 8 criterii de evaluare sunt
1 Obiectivul vizează următoarele preocupări medicale
bull istoria naturală a unei boli evoluţia şi prognosticul ei
bull performanţa unui test diagnostic
bull impactul unei intervenţii (terapeutice de depistare de prevenţie sau de educaţie)
Lectura critică va aşeza articolul icircn una din aceste situaţii apoi icircn raport cu obiectivul va stabili dacă are
ipoteze de verificat
5
2 Tipul de studiu Cititorul trebuie să recunoască planul de studiul pentru a verifica dacă tipul de studiu este
adaptat icircntrebării puse Va merge progresiv cu urmărirea de la raportul de caz-seria de cazuri la studiul
transversal studiul caz-control studiul de cohortă şi trialul controlat
3 Factorii studiaţi (variabila independentă) pot fi factori de expunere sau de intervenţie Cititorul trebuie să
poată recunoaşte factorul să aprecieze cum a fost măsurat dacă s-a folosit aceeaşi metodă de măsurare pentru
loturile icircn studiu ce metodă de comparaţie s-a folosit dacă sunt erori (factor de confuzie)
4 Criteriul de raţionament este evenimentul sau situaţia presupusă a fi rezultatul factorului studiat boala
decesul supravieţuirea complicaţiile etc Definirea precisă şi metoda de măsurare a rezultatului expunerii va
permite cititorului să aprecieze validitatea informaţiilor
5 Populaţia studiată (eşantionul) Se va urmări dacă este definită populaţia de referinţă şi populaţia de
studiat analizacircndu-se corectitudinea selecţiei randomizarea proporţia de subiecţi la sfacircrşitul studiului
validitatea externă a rezultatelor
6 Analiza datelor Cititorul trebuie să aprecieze dacă s-au examinat toate erorile inclusiv factorul de confuzie
dacă nu validitatea studiului ar putea fi compromisă
7 Rezultatele Principalele aspecte pe care cititorul le va urmări la acest capitol sunt dacă ele se datoresc
numai şansei dacă s-a făcut calculul statistic dacă s-a apreciat relaţia expunere-efect (RR OR RA) dacă a
fost apreciată semnificaţia clinică sau biologică care nu este identică cu semnificaţia statistică
8 Sinteza lecturii critice analizează concluziile autorilor dacă ele răspund icircntrebărilor formulate la icircnceputul
studiului dacă rezultatele sunt aplicabile la populaţia studiată dacă rezultatele sunt acceptabile pentru practica
proprie a cititorului dacă rezultatele justifică vreo schimbare icircn practica clinică respectiv vor ameliora starea
pacienţilor Această abordare cere cititorului cunoaşterea noţiunilor de bază icircn metodologia cercetării
ştiinţifice fiind vorba icircn acelaşi timp şi de un demers clinic
c) A treia etapă icircn cercetarea bibliografică constă icircn combinarea datelor din mai multe studii referitoare la
acelaşi subiect şi care se realizează prin meta-analiză Tehnica meta-analizei permite să se sporească
eficacitatea testării ipotezelor să crească forţa statistică a rezultatelor şi să se obţină informaţii care nu pot fi
convenabil extrase din fiecare cercetare
Definirea fenomenului
Definirea fenomenului se bazează pe
bull Cunoaşterea prealabilă a problemei prin documentare riguroasă documentare care poate justifica pertinenţa
temei propuse (revista literaturii de specialitate)
Icircn prima etapă se cercetează bibliografia propriu-zisă adică se identifică publicaţiile care se referă la subiectul
icircn discuţie apoi se vor selecta publicaţiile necesare studiului apreciind validitatea lor (problemele de
documentare bibliografică vor constitui un capitol separat)
bull Formularea unei ipoteze ştiinţifice sub-etapă care reprezintă fondul problemei
6
Ipoteza este o afirmaţie (nu o icircntrebare) despre o posibilă relaţie icircntre factorii studiaţi şi criteriile de
raţionament Ipoteza poate fi ipoteză ldquonulărdquo - nu există această relaţie şi ldquoalternativărdquo - există relaţia Ipoteza
va trebui apoi dovedită sau respinsă testul statistic calculează probabilitatea conform căreia asociaţia observată
este reală sau ea survine din icircntacircmplare
bull Motivarea organizării studiului Trebuie făcută o motivare corectă legată de inexistenţa unor studii
referitoare la problema pe care o va dezbate studiul
Formularea temei de studiu
Pentru formularea temei de studiu trebuiesc menţionate obiectivul sau obiectivele şi tipul de studiu ales pentru
cercetarea respectivă Există icircn general patru tipuri de obiective
bull obiective care se referă la evoluţia şi prognosticul unei icircmbolnăviri obiective prin care se icircncearcă
icircnţelegerea şi cunoaşterea unor evenimente ce pot să apară la un pacient pe parcursul bolii
bull obiective care se referă la etiologia bolii (cauze de natură bacteriană virală parazitară) sau la cauzalitate
(relaţia factor de risc-boală)
bull obiective legate de performanţa unor teste de diagnostic sau de screening de evaluare a strategiei de
diagnostic sau de interpretare a unui test
bull obiective care se referă la impactul unei intervenţii evaluarea unei intervenţii terapeutice de depistare a unor
boli de prevenţie de educare pentru sănătate
Obiectivele unui studiu se icircmpart icircn obiectivul major unul din cele patru enumerate şi obiective
secundare care pot aborda şi alte fenomene biologice decacirct cel major cu condiţia să nu altereze realizarea
acestuia Alegerea tipului de studiu este stracircns legată de obiectivul ales Dacă obiectivul este descrierea
distribuţiei caracteristicilor unei populaţii aprecierea frecvenţei unui fenomen de sănătate analiza acelui
fenomen icircn funcţie de timp loc persoană se va alege un studiu epidemiologic descriptiv studiu care nu are o
ipoteză fixată anterior O ipoteză se poate formula ca rezultat al studiului descriptiv dar nu se va face
verificarea ei icircn cadrul studiului Dacă intenţia studiului este de a emite o judecată asupra unei posibile relaţii
icircntre factorii studiaţi atunci problema de cercetat este fundamentată de o ipoteză care trebuie verificată
dovedită iar studiul care realizează acest lucru respectiv limitele studiilor utilizate
Aspectele manageriale
Aspectele manageriale includ
bull justificarea bugetului estimarea sumei necesară realizării studiului și apreciarea durate studiului
bull defalcarea bugetului pe necesități legate de achziționare de aparatură reactanți truse etc pentru personal
(munca depusă pregătire deplasări icircn teren participări la congrese sau conferințe documentare) materiale
consumabile etc
7
32 Elaborarea proiectului
Protocolul de cercetare este un document care emite obiectivul și ipoteza studiului definește condițiile de
desfășurare și realizare a viitorului studiu clinic Elaborarea protocolului este importantă pentru cercetătorii
participanţi la studiu comisiile de etică şi finanţatori
Protocolul include mai multe formulare care trebuie să cuprindă
a) Titlul proiectului
b) Sumarul proiectului
c) Descrierea proiectului
d) Normele deontologice de cercetare
e) Modalitățile de diseminarea și valorificarea rezultatelor
f) Perspective de continuare a cercetării
g) Anexe
Prezentarea proiectului va include următoarele fișiere
bull resursele umane (membrii echipei afilierea acestora)
bull relevanța temei pentru dezvoltarea cunoașterii icircn domeniu
bull stadiul actual al cunoașterii și bibliografia aferentă
bull justificarea studiului
bull enunțarea obiectivelor și ipoteza de lucru
bull metodologia propriu-zisă
Referitor la metodologia utilizată vor trebui menționate
bull factorulfactorii studiați care reprezintă variabila independentă respectiv dacă este cazul modalitățile de
măsurare
bull criteriile de raționament- variabila dependentă (situația sau evenimentul ce se presupune a fi rezultatul
factorului studiat cum ar fi boala handicapul complicații decesul)
bull tipul de studiu care se va aplica icircmpreună cu design-ul acestuia
bull eșantioanele de lucru și modalitățile de eșantionaj
bull metodele de culegere și de prelucrare a datelor
bull planificarea activităților
bull structura bugetului fiind eligibile următoarele categorii de cheltuieli de capital (echipamente software
upgrading) pentru personal (full sau part-time instruire asigurări de sănătate) de informare (documentare
abonamente) mobilități (vizite la alte unități de cercetare participări la
congrese) materiale consumabile (truse reactanți papetărie) valorificare a rezultatelor (lucrări științifice de
etapă sau lucrarea finală) cheltuieli indirecte (de regie)
bull modalităţile de valorificare a rezultatelor
bull legături de alte proiecte
8
Protocolul mai conține anexe curriculum vitae al investigatorului principal și al coinvestigatorilor
calendarul activităților avizul Comisiei de etică documente speciale și
consimțămacircntul informat icircn cazul studiilor pe subiecți umani
Icircnainte de implementare protocolul va fi verificat de experți pentru eligibilitate (dacă sunt icircndeplinite
condițiile de acceptare finanțare) calitate și pertinență icircn sensul că protocolul trebuie să fie clar exprimat
corect icircntocmit bine așezat și cu repercursiuni favorabile pentru viitor
33 Culegerea informaţiei
Pentru a realiza o cercetare medicală culegerea datelor este prima etapă şi realizează icircn funcţie de
obiectivele propuse tipul studiului timpul disponibil şi resurse umane şi financiare
Există două mari posibilităţi de culegere
bull Icircn funcţie de elementele studiate
o Culegerea exaustivă Toţi subiecţii populaţiei pe care dorim să o studiem Greu de realizat din cauza
costurilor foarte mari sau a alterării populaţiei de studiu
o Prin eşantionare Este metoda folosită icircn studii medicale
bull Icircn funcţie de durata culegerii
o Transversală Se studiază un grup la un moment dat
o Longitudinală Extinsă in timp
- Retrospectivă ndash icircnregistrări medicale
- Prospectivă ndash date culese la intervale prestabilite de timp
Populaţia ţintă
Este orice colectivitate icircntreagă de oameni animale plante sau obiecte de la care putem colecta date Populaţia
ţintă este icircntregul grup care ne interesează pe care dorim să-l descriem sau să tragem concluzii despre el
Pentru a putea realiza generalizări spre populaţia ţintă deseori suntem obligaţi să folosim un eşantion (selecţie)
care icircnsă trebuie să fie reprezentativ pentru populaţia pe care vrem să o studiem Pentru fiecare populaţie de
studiu sunt posibile mai multe eşantioane Pe baza acestor eşantioane se calculează un estimator Pe baza
acestui estimator calculat care poate fi medie aritmetică procent etc se pot trage concluzii despre icircntreaga
populaţie Este foarte important ca investigatorul să definească foarte atent şi complet populaţia icircnainte de a
realiza eşantionul inclusiv descrierea criteriilor de includere şi excludere icircn populaţia de studiu
Eşantionul
Un eşantion este practic un grup de elemente selectate dintr-un grup mai extins (populaţia ţintă) Studiind
eşantionul selectat se pot trage concluzii despre grupul de unde a fost ales (populaţia ţintă)
Este icircn general ales pentru studiu pentru că
bull Populaţia ţintă este prea mare şi nu poate fi studiată ca icircntreg
bull Nu avem acces din diverse motive decacirct la parte din populaţia de studiu
9
bull Un studiu pe icircntreaga populaţie poate distruge populaţia
bull Eşantioanele pot fi studiate mai rapid
bull Costul şi resursele necesare studiului sunt mai reduse
Numărul elementelor dintr-un eşantion se numeşte talia sau volumul selecţiei
Acesta fiind icircn general mai mic decacirct icircntreaga populaţie poate fi observat icircn detaliu iar dacă este reprezentativ
se pot afla prin intermediul său proprietăţile populaţiei ţintă
Eşantionul trebuie să fie reprezentativ pentru populaţia generală De aceea dintre metodele de eşantionare se
folosesc tehnicile de randomizare Trebuie să satisfacă două condiţii principale
bull condiţie de ordin cantitativ talia să fie suficient de mare
bull condiţie de ordin calitativ trebuie extras aleator din populaţia ţintă
Metode de eşantionare
Putem vorbi icircn linii mari de două posibilităţi de eşantionare prin metode probabilistice şi prin metode
nonprobabilistice
Eşantionarea probabilistică este metoda cea mai folosită icircn studiile medicale fiind şi cea indicată pentru a
realiza reprezentativitatea calitativă
Icircn medicină se folosesc patru tipuri de eşantionări
1 Simplu randomizat
2 Sistematic
3 Stratificat
4 Cluster (icircn cuiburi)
1 Eşantionul simplu randomizat Fiecare element din populaţia ţintă are o şansă egală non zero de a fi
inclus icircn eşantion Se ia la icircntacircmplare un număr de elemente egal cu talia eşantionului Dezavantajul acestui tip
de eşantionare este că presupune cunoaşterea icircntregii populaţii ţintă
2 Eşantionul sistematic După aflarea taliei eşantionului şi a populaţiei ţintă se calculează factorul de
eşantionare k icircmpărţind talia populaţiei ţintă la volumul eşantionului Apoi fiecare al k-lea element este
selectat spre includere
Acelaşi mare dezavantaj apare şi icircn acest caz fiind obligatorie cunoaşterea icircntregii populaţii de studiu
3 Eşantionul stratificat Există icircn cele mai multe cazuri probleme medicale care studiindu-se pe eşantion
prezintă variabilităţi icircn funcţie de caracteristicile populaţiei (sex vacircrstă nivel de pregătire etc) Icircn acest caz
este obligatorie realizarea similitudinii demografice a eşantionului cu populaţia de studiu Din date provenite
de la Centrul de Statistică putem dezvolta ca procente o structură a populaţiei Această structură trebuie să se
regăsească (procentual) şi icircntre membrii eşantionului O importantă şansă ca reprezentativitatea calitativă să fie
corectă este conferită de respectarea
acestei similitudini demografice
10
4 Eşantionul bdquoclusterrdquo sau icircn cuiburi Icircn cazul unui studiu amplu cu scop de a investiga populaţia unei
icircntregi ţări sau regiuni putem ajunge icircn imposibilitatea de a alege şi mai ales investiga indivizi răspacircndiţi prin
icircntreaga zonă Din acest motiv se desemnează la icircntacircmplare un număr calculabil de
grupuri populaţionale extinse icircn toată zona de studiu Aceste grupuri poartă numele de bdquocuiburirdquo La nivelul
fiecărui bdquocuibrdquo se aplică o tehnică precedentă de selecţie a cazurilor Se poate sau de cele mai multe ori se face
la nivel de bdquocuibrdquo stratificarea iar apoi selecţia propriu-zisă se realizează sistematic sau simplu randomizat
Este metoda de eşantionare cel mai frecvent utilizată icircn cercetarea medicală de amploare Pentru ca eventualele
erori să nu se poată strecura s-a definit şi un indice DEF (design effect) cu care trebuie multiplicată talia
selecţiei care pentru eşantionarea icircn bdquocuiburirdquo este egal cu 2 astfel putem obţine şi o reprezentativitate
calitativă dar şi una cantitativă
Eşantionarea nonprobabilistică este o metodă neindicată icircn studiile medicale datorită lipsei de forţă icircn ceea ce
priveşte posibilitatea de aplicare a concluziilor asupra populaţiei de studiu
Se definesc şi icircn acest caz patru metode
1 Eşantion de convenienţă Membrii unui astfel de eşantion sunt aleşi numai pentru că sunt la icircndemacircnă
disponibili de a răspunde le un eventual chestionar
2 Eşantion pe cote Similar cu tipul de eşantion stratificat se referă la faptul că selecţia se face formacircnd
eşantionul din primele 30 de persoane care respectă un criteriu impus
3 Eşantion cu un scop Elementele incluse icircn eşantion sunt alese după un criteriu care exclude din start marea
majoritate a populaţiei
4 Eşantion raţional Selecţia se face prin prisma unui raţionament al celui care conduce studiul
Parametru şi estimator
Parametrul este o valoare de obicei necunoscută (şi care trebuie să fie estimată prin studiu) folosită pentru a
reprezenta o anumită caracteristică a populaţiei de studiu De exemplu media populaţiei (icircnălţime) este un
parametru populaţional Raportat la o populaţie parametrul este o valoare fixă şi exactă care nu variază
Fiecare eşantion extras din populaţie va indica o valoare a mediei care nu poate decacirct să estimeze parametrul
Icircn general parametrii sunt notaţi cu litere greceşti (ex Media = μ)
Estimatorul este o valoare calculată dintr-un eşantion studiat Este folosit pentru a putea aprecia parametrul
populaţional pe care icircn căutăm Este de asemenea posibil ca dintr-o populaţie să formăm mai multe eşantioane
mediile lor de cele mai multe ori nefiind identice icircntre ele şi nici identice cu media populaţiei Estimatorii
sunt notaţi cu litere latine (ex Media = μ)
Dacă valoarea mediei calculată pe eşantion este de exemplu 168 cm atunci putem estima ca valoarea mediei
icircn populaţie este 168 cm
11
Tipuri de culegere a datelor
1 Culegere de tip eşantion reprezentativ Grupul de indivizi incluşi icircn studiu sunt reprezentativi (calitativ şi
cantitativ) pentru populaţia generală Poate fi utilizat pentru studii descriptive (cel mai frecvent) dar uneori şi
pentru studii analitice
Este necesar pentru acest tip de culegere a datelor ca iniţial să fie cunoscută talia eşantionului (calculabilă icircn
funcţie de prevalenţă şi precizie) Pentru evaluarea datelor culese se utilizează tabelul de contingenţă 2 x 2
astfel (Figura 1)
Figura 1 - Tabelul de contingenţă 2 x 2
Unde
a ndash persoane expuse unui factor de risc care au boala studiată
b ndash persoane expuse unui factor de risc care nu au boala studiată
c - persoane neexpuse unui factor de risc care au boala studiată
d - persoane neexpuse unui factor de risc care nu au boala studiată
După aranjarea datelor icircn tabelul de contingenţă (2 x 2) se poate icircncepe analiza statistică a datelor atacirct ca
procente calculabile cacirct şi din punct de vedere a aplicării de teste statistice pentru elucidarea semnificaţiei
statistice
Este posibilă din acest tip de culegere de date calcularea
1 Prevalenţei unei boli
2 Frecvenţei expunerii
3 Gradul de asociere icircntre factorul eventual de risc şi boala
2 Culegerea de tip expus ndash neexpus Icircmparte subiecţii icircn două categorii expuşi sau neexpuşi factorului de risc
studiat Ca evoluţie următoare a studiului după o astfel de culegere a datelor se poate evalua icircn timp apariţia
icircmbolnăvirii despre care se efectuează studiul Icircn timp longitudinal prospectiv se poate calcula dacă factorul
studiat reprezintă un risc de icircmbolnăvire este indiferent sau chiar este cu efect protectiv Numărul subiecţilor
din cele două grupuri poate fi egal sau poate fi diferit Numărul acestora poate fi calculat icircn vederea obţinerii
unei bune reprezentativităţi cu ajutorul formulelor de selecţie Avacircnd icircn vedere calitatea longitudinală a
12
studiului este important ca numărul ales să fie mai mare pentru a putea suplinii eventualele pierderi din
urmărire Practic rezultatele sunt introduse icircn tabelul 2 x 2 de unde se pot calcula indicatorii doriţi (Figura 2)
Avacircnd icircn vedere modul de culegere a datelor este permisă calcularea de indicatori numai pe orizontală
orice comparare icircntre coloana dreaptă şi stacircngă fiind incorectă Avantajul acestui tip de culegere a datelor ar fi
eventualul număr mai redus de subiecţi dar dezavantajul major este cel al costurilor de urmărire icircn timp dar
trebuie luată icircn calcul şi pierderea de subiecţi din evidenţe Factorul controlat este deci prezenţa expunerii iar
factorul aleator este prezenţa bolii
Figura 2 Tabelul de contingenţă pentru tipul de culegere expus ndash neexpus
4 Culegerea de tip caz ndash martor Icircn acest caz ceea ce ghidează colectarea datelor este prezenţa sau absenţa
bolii icircn momentul prezent Se vor culege date de la două loturi constituite după criteriul de bolnav B+ şi de fără
boală B+ Datele culese sunt icircn trecut deci caracterul datelor va fi retrospectiv Icircn acest caz factorul controlat
este boala factorul aleator fiind expunerea (Figura 3)
Calculul de indicatori icircn acest caz se va putea efectua numai icircntre coloane orice calcul icircntre valorile de pe linii
fiind greşit Rezultate semnificative se pot obţine icircn acest caz utilizacircnd loturi mai mici de studiu prin
comparaţie cu tipul eşantion reprezentativ permiţacircnd icircn acelaşi timp studiul bolilor rare (cu prevalenţă mică)
Figura 3 Tabelul de contingenţă pentru tipul de culegere caz ndash martor
Metode de culegere a datelor
Metoda aleasă pentru culegerea datelor trebuie să fie aleasă după un atent studiu bibliografic icircn vederea
stabilirii celui mai eficient mod de a răspunde temei de studiu
Metodele de culegere trebuie să fie bine aplicabile şi consistente ca aport informaţional necesar
13
1 Fiziologice Sunt colectate date despre anumite caracteristici fiziologice ale pacienţilor (TA glicemie
colesterol etc) Această metodă aduce rezultate obiective cacirct timp instrumentul de evaluare este bine calibrat
şi prezintă variaţii mici
2 Metode observaţionale Instrumentul de culegere a datelor trebuie să fie sincronizat cu protocolul conceput
de cercetător Datele culese trebuie să fie de asemenea consistente adică să fie colectate de aceeaşi manieră
conducătorul studiului trebuind să instruiască investigatorii (colectorii de date) Icircnregistrarea datelor trebuie să
fie de asemenea sistematică şi bine standardizată Observaţii de control trebuie icircn mod obligatoriu făcute
pentru a putea aprecia icircn mod corect orice deviere datorată unor factorii externi Este obligatorie luarea icircn
consideraţie a aspectelor etice
3 Interviul Poate fi structurat cu un set specific de icircntrebări sau nestructurat cu o temă generală cu care se
icircncepe interviul Interviurile pot fi icircnregistrate sau intervievatorul poate nota pur şi simplu răspunsurile Există
două tipuri generice de interviu interviul de profunzime care se referă la o discuţie icircn general structurată cu
un număr de icircntrebări prestabilite icircn icircncăperea de studiu fiind doară intervievatorul şi persoana chestionată şi
interviul de grup unde prin conversaţii pornind de la temă generală expusă şi condusă de intervievator se
obţin date despre subiecţii participanţi la studiu Ambele metode de interviu au indicaţiile lor precise Un
interviu pe teme intime nu va putea fi corect icircn ceea ce priveşte datele colectate dacă se aplică un interviu de
grup
4 Chestionarul Document scris adresat unor persoane pentru a răspunde la una sau mai multe icircntrebări
Trebuie să aducă răspunsurile la icircntrebările care motivează studiul constituind ansamblul icircntrebărilor destinate
culegerii de informaţii (date) Redactarea chestionarului trebuie să ţină cont de structura acestuia introducere
conţinut exprimarea icircntrebărilor grafica chestionarului
5 Icircnregistrări preexistente
Icircn cercetarea medicală sunt cel mai frecvent utilizate Informaţiile dorite sunt deja existente ceea ce icirci revine
cercetătorului este ca să structureze datele icircn funcţie de scopul studiului pe care icircn conduce Aceste surse sunt
bull Foi de observaţie
bull Registre de consultaţie
bull Buletine de analize
bull Registre de operaţii
Icircn cazul icircn care nici o metodă de culegere a datelor nu este pe placul celui ce conduce studiul există
posibilitatea de a construi un instrument nou de culegere a datelor
Acest proces trebuie să urmărească nişte paşi obligatorii fiind mare consumator de timp
bull Definirea structurii cu care se va face măsurarea
bull Formularea itemilor de măsură
bull Analiza validităţii instrumentului de măsură ndash măsoară acesta fenomenul corect
bull Elaborarea de instrucţiuni de utilizare pentru investigatori
14
bull Pretestarea instrumentului
bull Aprecierea validităţii interne şi externe a datelor culese
Instrumente de cercetare
Formularea clară a temei de cercetare necesită o foarte bună definire a factorilor studiaţi şi a criteriilor de
judecată Acestea din urmă sunt ultimele care vor trebui definite icircn cadrul protocolului de studiu
Alegerea unui instrument de măsură
Nu există un instrument de măsură perfect sau universal corect Alegerea sa dintre cele existente şi cele deja
utilizate depind de trei factori
bull Obiectivul studiului
bull Boala studiată
bull Populaţia icircn studiu
De aceste trei elemente trebuie ţinut cont icircn fiecare etapă a dezvoltării instrumentului
Definirea obiectivului
Studiu transversal Dacă se doreşte studierea unui simptom sau a unei caracteristici ale populaţiei se poate
icircmpărţi populaţia de studiu icircn mai multe grupuri Este practic vorba de a determina diferenţele dintre subiecţi
icircn cea ce priveşte o variabilă necesară studiată printr-un studiu transversal (utilizarea dozării de Ac HBS
pentru a evalua progresele bolnavilor de hepatită tip B)
Studiu longitudinal Icircn acest caz nu se poate icircmpărţii populaţia de studiu icircn mai multe grupuri datele obţinute
fiind de la acelaşi subiect colectate după un interval de timp
Icircn funcţie de boală şi populaţie se aleg şi instrumentele de măsură cele mai adecvate
Instrumentele cercetării reprezintă un mecanism specific sau o strategie pe care cercetătorul o utilizează pentru
colectarea prelucrarea şi inferenţa datelor Aceste instrumente sunt
1 Studiul icircn bibliotecă
2 Computerul
3 Determinările experimentale
4 Statistica
5 Mintea umană
6 Facilităţi de limbaj şi comunicare
Determinările experimentale
Măsurarea constă icircn aprecierea şi cuantificarea fenomenelor calitativ sau cantitativ Interpretarea
datelor se referă la transformarea lor icircn unităţi de descoperire a unor fenomene mai puţin cercetate
Standardele acceptate se referă la norme medii distribuţii etc Tot icircn cadrul interpretării datelor datele
obţinute sunt caracterizate pe scale de valori nominal ordinal de interval sau de raport
Validarea şi reproductibilitatea măsurătorilor sunt aspecte importante şi foarte necesare pentru o
cercetare corect fundamentată care doreşte obţinerea unor concluzii pertinente
15
Statistica Este implicată icircn condensarea şi procesarea unui volum mai mare de date astfel icircncacirct să se poată
interpreta corect valorile obţinute şi să se permită comparările Utilizarea unor teste statistice specifice permite
determinarea semnificaţiei (diferenţei) statistice astfel icircncacirct estimatorii să poată fi aplicaţi la populaţia
generală Furnizează informaţii şi privind corelarea sau relaţionarea icircntre date
Mintea umană este cea care reuşeşte să integreze şi să icircnţeleagă rezultatele obţinute Semnificaţia ştiinţifică
este stabilită icircn funcţie de rezultatele statisticii de mintea umană conform afirmaţiei bdquosemnificaţia ştiinţifică
nu este egală cu semnificaţia statisticărdquo Metodele aplicate pentru a putea ajunge la o concluzie pertinentă sunt
logica deductivă raţionamentul inductiv şi gacircndirea critică
Limbaj şi comunicare Exprimarea orală sau icircn scris permite nuanţarea unor aspecte seci cifrice ale unor
studii Icircn acest mod devine mai evidentă semnificaţia ştiinţifică a unor rezultate statistice
34 Prelucrarea datelor
Instrumentele de prelucrare
Statistica este o ştiinţă ramură a matematicii care studiază evoluţia fenomenelor şi proceselor
colective pe baza observării lor ştiinţifice a culegerii şi prelucrării detaliate a informaţiilor statistice cu scopul
de a formula şi explica legile legităţile şi regularităţile ce le guvernează
Statistica permite deci aprecierea unor parametrii populaţionali prin studiul unui număr redus de
elemente ale populaţiei icircn studiu (ţintă) O populaţie poate fi definită printr-un şir de valori care pot fi grupate
icircn funcţie de parametrul studiat (glicemie colesterol TAD TAS etc) Pentru fiecare astfel de şir se defineşte
o variabilă (care va purta nume propriu glicemie colesterol etc) Practic variabila este considerată o funcţie
ia valori posibil diferite de la un element la altul icircn funcţie de caracteristicile proprii acestora Sunt clasificate
icircn două grupe variabile cantitative (caracteristică măsurabilă) şi calitative (caracteristică ce nu poate fi
măsurată)
La racircndul lor variabilele calitative pot fi
bull Nominale ndash grupuri de elemente ce nu pot fi ordonate (culoarea părului)
bull Nominale ordonate ndash concluziile pot fi grupate (eficienţa unui tratament slabă bună foarte bună)
bull Binare ndash apar numai două posibilităţi (bolnav sănătos)
Variabilele cantitative pot fi
bull Continue ndash o variabilă măsurabilă care poate lua o infinitate de valori
bull Discrete ndash variabile care nu pot lua decacirct valori icircntregi
Statistica descriptivă
Există două ramuri ale statisticii statistica descriptivă şi statistica inferenţială
Statistica descriptivă (după cum rezultă din denumire) se ocupă cu descrierea unor valori obţinute ale unei
variabile studiate
16
Valorile pe care variabila le ia se constituie icircntr-o serie statistică Indicatorii care definesc o variabilă (serie)
sunt
1 Ale tendinţei centrale
Media aritmetică - notată de regulă cu
Mediana - este acea valoare din şirul de date care icircmparte icircn două părţi egale şirul ordonat de valori (atenţie
şirul este ordonat crescător) situacircndu-se la mijlocul seriei statistice
Dacă numărul de valori n este un număr impar atunci mediana este valoarea unde
Dacă n este par deci avem un număr par de valori mediana este definitatilde ca fiind
unde k = n2
Modul - constituie valoarea care apare cel mai des deci valoarea cu numărul cel mai mare de apariţii
2 De dispersie
Amplitudinea - este diferenţa dintre valoarea maximă şi cea minimă
A = Amax - Amin
Amplitudinea relativă - notată A este raportul dintre amplitudinea absolută şi media aritmetică a seriei de
date
Varianţa notată este un indicator de icircmprăştiere a datelor Formula de calcul este
Abaterea standard (S) sau deviaţia standard reprezintă rădăcina pătrată din varianţă (dispersie)
Coeficientul de variaţie se calculează ca un raport procentual icircntre abaterea standard şi valoarea medie a şirului
de valori
Eroarea standard intervine icircn estimarea intervalelor de confidenţă Se calculează astfel
17
3 De asimetrie (skewness) indică distribuţia datelor dacă sunt sau nu distribuite normal
4 De boltire (kurtosis) estimează boltirea sau aplatizarea curbei de distribuţie
Prezentarea descriptivă a datelor se face prin icircnregistrarea datelor culese icircn tabele care să reprezinte icircn mod
sintetic valorile măsurate
Icircn concluzie statistica descriptivă permite
bull Stabilirea comparabilităţii icircntre grupurile de studiu şi aprecierea prezenţei erorilor sau confuziei
bull Reprezentarea datelor icircn tabele permite evaluarea fiecărui pacient şi dacă a existat pierderi din studiu
Statistica inferenţială
Statistica inferenţială (inductivă) este partea de analiză a datelor care permite extrapolarea unei
concluzii trase pe baza unui eşantion spre populaţia ţintă pentru care a fost efectuat studiul
Scopul analizei statistice este de a evidenţia efectul unui tratament sau al unui factor de risc prin date obţinute
din eşantionul studiat spre populaţia ţintă Aceasta implică testarea ipotezelor statistice sau altfel spus testarea
semnificaţiei statistice Este una dintre cele mai importante momente ale studiului Cum rezultatele sunt
obţinute prin studiul unui eşantion există posibilitatea ca acestea să fie datorate icircntacircmplării Testele
statistice ne ajută să apreciem icircn ce măsură rezultatele sunt icircntacircmplătoare şi mai ales icircn ce măsură şi dacă se
pot aplica populaţiei generale Icircn acest scop se impune o valoare limită alfa 005 care reprezintă limita
superioară a probabilităţii ca rezultatul obţinut să fie greşit (datorat icircntacircmplării) Astfel icircn funcţie de tipul
variabilelor şi indicatorii descriptivi aplicaţi şi evaluaţi se aplică teste de semnificaţie statistică (Tabelul 1)
Tabelul 1 Alegerea testelor de semnificaţie statistică
Tipul datelor
18
Diferenţierea variabilelor din punctul de vedere a distribuţiei se face folosind testul de normalitate
Kolmogorov ndash Smirnov
Testul statistic reprezintă metoda de comparaţie a două sau mai multe populaţii prin intermediul unor
variabile observate ale lor
Scopul unui test statistic este de a defini realitatea
Definirea icircntrebării de cercetare (ipoteza clinică)
Tratamentul cu Nebivolol este la fel de eficient ca şi cel cu Valsartan icircn tratamentul
hipertensiunii arteriale
Transpunerea icircntrebării de cercetare icircn termeni statistici (ipoteza statistică)
Media tensiunii arteriale a pacienţilor trataţi cu Valsartan nu diferă semnificativ de media
tensiunii arteriale a pacienţilor trataţi cu Nebivolol
Etapele unui test statistic
1 Formularea problemei icircn termenii ipotezelor statistice
2 Alegerea şi calcularea parametrului statistic al testului
3 Regiunea critică
4 Concluzia testului
1 Formularea problemei icircn termenii ipotezelor statistice
Ipoteza nulă ipoteza care trebuie testată testul efectuacircndu-se sub prezumţia că ipoteza nulă ar
fi adevărată
Ipoteza alternativă acea ipoteză care icircntr-un sens sau altul contrazice ipoteza nulă Această
ipoteză se mai numeşte şi ipoteza de lucru
Ipoteza nulă tipuri
O coadă (ldquoone-tailedrdquo sau ldquoone-siderdquo)
Media este mai mare
Media este mai mică
Două cozi (ldquoone-tailedrdquo sau ldquoone-siderdquo)
Media este egală
2 Alegerea şi calcularea parametrului statistic al testului
Parametrul statistic al testului exprimă icircntr-o anumită formă diferenţa dintre elementele comparate
Ţinacircnd seama de faptul că eşantionul sau eşantioanele utilizate sunt aleator extrase din populaţiile care
fac obiectul testului parametrul statistic este o variabilă aleatoare de selecţie care urmează o anumită
lege de probabilitate
Un parametru statistic al testului bun trebuie să icircndeplinească două condiţii
19
Trebuie să se comporte diferit atunci cacircnd ipoteza nulă H0 este adevărată faţă de situaţia icircn
care ipoteza alternativă H1 este adevărată
Distribuţia de probabilitate a parametrului statistic al testului sub prezumţia că H0 este
adevărată este cunoscută
3 Regiunea critică
- Trebuie să fim capabili să decidem icircn funcţie de valoarea parametrului statistic calculat care dintre
ipoteze cea nulă sau cea alternativă este adevărată
- Dacă valoarea parametrului statistic aparţine regiunii critice ipoteza nulă H0 va fi respinsă şi va fi
acceptată ipoteza alternativă H1
- Dacă valoarea parametrului statistic nu aparţine regiunii critice ipoteza nulă H0 va fi acceptată
- Decidem mărimea regiunii critice
Pentru aceasta trebuie să specificăm mărimea riscului de eroare pe care icircl acceptăm
Pe scurt definim nivelul de semnificaţie notat cu a sau mărimea riscului pe care
suntem dispuşi să ni-l asumăm icircn respingerea ipotezei nule H0 icircn cazul icircn care aceasta
este adevărată De obicei se alege un nivel de semnificaţie icircntre 1 şi 5
Probabilitatea unei erori de tipul I
probabilitatea de respingere a ipotezei nule H0 icircn favoarea ipotezei alternative H1 icircn
condiţiile icircn care H0 este adevărată
probabilitatea unei erori de tipul I se notează cu a şi se mai numeşte nivel de
semnificaţie al testului
Probabilitatea unei erori de tipul II
probabilitatea acceptării ipotezei nule icircn condiţiile icircn care ipoteza alternativă H1 este
adevărată
această probabilitate se notează cu b
- Unilaterală la dreapta ndash valoarea parametrului statistic al testului este mai mare sau egală cu
valoarea din dreapta a intervalului critic
- Unilaterală la stacircnga ndash valoarea parametrului statistic al testului este mai mică sau egală cu
valoarea din stacircnga a intervalului critic
- Bilaterală ndash valoarea parametrului statistic al testului este mai mică sau egală cu valoarea extremă
din stacircnga regiunii critice sau mai mare sau egală cu valoarea extremă din dreapta regiunii critice
valorile extreme ale regiunii critice avacircnd nivele egale de semnificaţie
4 Concluzia testului
- Ipoteza nulă H0 este respinsă dacă valoarea parametrului statistic aparţine regiunii critice
20
- Regiunea critică trebuie astfel aleasă icircncacirct dacă ipoteza alternativă H1 este adevărată
probabilitatea de respingere a ipotezei nule H0 este mai mare decacirct icircn cazul icircn care ipoteza nulă H0
ar fi adevărată
- Acceptarea ipotezei nule H0 atunci cacircnd ipoteza alternativă H1 este adevărată este cunoscută ca şi
eroarea de tipul II
a probabilitatea ei se notează cu b
b măsoară bdquonivelul de eroarerdquo
- Icircn testarea oricărei ipoteze statistice există patru situaţii care determină dacă decizia noastră este
corectă sau nu
Cazuri
H0 este adevărată H0 este falsă
Concluzie H0 se acceptă decizie corectă eroare de tipul
II
H0 se
respinge
eroare de tipul I decizie corectă
Luarea deciziei pe baza valorii probabilităţii p de semnificaţie a testului
Icircn momentul icircn care prelucrăm statistic o serie de date dorim să ştim dacă rezultatele obţinute sunt sau
nu semnificative statistic
Răspunsul la această icircntrebare este dat de valoarea lui p calculată de orice program statistic la
prelucrarea unor date
Icircn cazul testelor statistice ipoteza nulă este respinsă dacă nivelul de semnificaţie este mai mic decacirct
005 iar programele de prelucrare statistică a datelor vor afişa o steluţă () icircn tabelul rezultatelor
21
Dacă p le 005 respingem ipoteza nulă şi acceptăm ipoteza alternativă (am obţinut semnificaţia
statistică)
Dacă p gt 005 acceptăm ipoteza nulă (nu am obţinut semnificaţia statistică)
p = 013
NU respingem ipoteza nulă
Risc de eroare de tip II
α = 005
p = 002
Respingem ipoteza nulă
Risc de eroare de tip I
Semnificaţia lui p
Criteriu de luare a deciziei cu privire la o ipoteză statistică nulă
Cuantifică şansa ca o decizie de respingere a ipotezei nule să fie greşită
Măsură a semnificaţiei statistice şi NU CLINICĂ
22
Semnificaţia lui p (reguli empirice)
001 le p lt 005 rezultatul e semnificativ statistic
0001 le p lt 001 rezultatul e icircnalt semnificativ statistic
p lt 0001 rezultatul e foarte icircnalt semnificativ statistic
p ge 005 rezultatul e considerat nesemnificativ statistic
Limite ale valorii p
Valoarea p NU ne dă informaţii despre
Şansa de beneficiu a unui pacient individual
Procentul de pacienţi care vor avea un beneficiu icircn urma instituirii procedurii medicale
Gradul de beneficiu expectat pentru un anumit pacient
Puterea unui test statistic
Este capacitatea de a detecta o diferenţă acolo unde există
Creşterea volumului eşantionului determină creşterea puterii testului statistic aplicat
Valoarea este icircn relaţie directă cu eroarea de tip II
Puterea = 1 ndash β
Cea mai utilizată modalitate de creştere a puterii unui test statistic este de a creşte volumul
eşantionului
Tipul scalei de măsură ndash testul statistic
Denumire test Interval Nominal Observaţii
Corelaţie Pearson 2 0 Există o relaţie liniară
χ2 0 2
Student 1 1 Doar 2 grupuri
ANOVA 1 1 2 sau mai multe grupuri
Student perechi 1 1 Eşantioane perechi
Măsurători repetate (ANOVA) 1 1 Mai mult de 2 grupuri date
perechi
Inferenţa statistică pe date calitativ e
Tabela de contingenţă 2times2
Riscuri şi raţii
Testul χ2 (testarea asocierii icircn tabela de contingenţă)
Testul Fisher
23
Testul z pentru proporţii
Testul McNemar
Tabela de contingenţă 2times2
Scale de tip nominal (dicotomiale tabela de contingenţă de 2times2) sau ordinal (tabela de contingenţă de
rtimesc)
Frecvenţa absolută (numărul de evenimente per categorie)
Tabela de contingenţă de 2times2 4 categorii
AP = adevărat pozitiv
FP = fals pozitiv
FN = fals negativ
AN = adevărat negativ
Ulcer deschis Ulcer vindecat Total
Recurenţă + AP = 1 FP = 5 = 1+5 = 6
Recurenţă - FN = 7 AN = 16 = 7+16 = 23
Total =1+7=8 =5+16=21 29
Riscuri şi raţii Mărimi ale asocierii
Denumire Formula Definiţie
Rata falşilor pozitivi =FP(FP+AN) Probabilitatea unui test fals + (α)
Rata falşilor negativi =FN(FN+AP) Probabilitatea unui test fals ndash (β)
Sensibilitate =AP(AP+FN) Probabilitatea unui test real + (1- β)
Specificitate =AN(AN+FP) Probabilitatea unui test real ndash (1- α)
Acurateţe =(AP+AN)n Probabilitatea generală a unei decizii corecte
Valoarea predictivă pozitivă =AP(AP+FP) Probabilitatea ca un test pozitiv să fie corect
Valoarea predictivă negativă =AN(AN+FN) Probabilitatea ca un test negativ să fie corect
Riscul relativ =AP(FP+AN)FN(AP+FP)
Rata şansei =(AP∙AN)(FN∙FP)
Riscul atribuabil =AP(AP+FP)-FN(FN+AN)
24
Denumire Formula
Rata falşilor pozitivi = 5(5+1) = 08334
Rata falşilor negativi = 7(7+16) = 03043
Sensibilitate = 1(1+7) = 01250
Specificitate = 16(16+5) = 07619
Acurateţe = (1+16)29 = 05862
Valoarea predictivă pozitivă = 1(1+5) = 01667
Valoarea predictivă negativă = 16(16+7) = 06957
Riscul relativ = 1(5+16)7(1+5) = 2142 = 050
Rata şansei = (1∙16)(7∙5) = 04571
Riscul atribuabil = 1(1+5)-7(7+16) = 01667-03043=-01376
Testarea asocierii icircn tabela de contingenţă
Testul χ2
Nu trebuie utilizat pentru eşantioane de volum mic
Testul este valid doar dacă valoarea expectată (aşteptată) pentru fiecare celulă este cel puţin
egală cu 1 şi frecvenţa absolută observată este de minim 5
Dacă aceste condiţii nu sunt icircndeplinite se aplică testul exact al lui Fisher (Fisherrsquos Exact Test)
Indică dacă cele două variabile sunt sau nu independente DAR NU cuantifică puterea asocierii
dintre ele
Problema S-a investigat icircntr-un studiu asocierea dintre obezitatea (ca factor de risc) şi bolile
cardio-vasculare la persoanele icircn etate (gt 60 ani) Din totalul de 620 persoane investigate s-au
identificat 150 persoane cu obezitate şi boală cardio-vasculară 230 persoane fără obezitate şi
fără boală cardio-vasculară şi 60 persoane fără obezitate dar cu boală cardio-vasculară Există
o asociere icircntre obezitate şi boala cardio-vasculară (df=1 α=005 χ2critic = 384)
Testul χ2 exemplu
H025
Nu există asociere icircntre obezitate şi bolile cardio-vasculare
Obezitatea şi bolile cardio-vasculare sunt independente
H1
Există asociere icircntre obezitate şi bolile cardio-vasculare
Obezitatea şi bolile cardio-vasculare sunt asociate
a = 005 pragul de semnificaţie al testului
urmează o lege cu (r-1)(c-1) grade de libertate
χ2 = parametrul testului χ2
fio = frecvenţa observată
fit = frecvenţa teoretică
Regiunea critică este [χα2 yen)
Pentru α = 005 χα2 = 384
OBSERVAT BCV+ BCV- Total
Obezitate + AP = 150 FP = 180 330
Obezitate - FN = 60 AN = 230 290
Total 210 410 620
TEORETIC BCV+ BCV- Total
Obezitate + = 330times210620 = 330times410620 330
Obezitate - = 290times210620 = 290times410620 290
Total 210 410 620
TEORETIC BCV+ BCV- Total
Obezitate + = 330times210620 = 330times410620 330
26
Obezitate - = 290times210620 = 290times410620 290
Total 210 410 620
TEORETIC BCV+ BCV-
Obezitate + = 112 = 218
Obezitate - = 98 = 192
Deoarece 4177Icirc[384 yen) se respinge H0 cu un risc de eroare de 5
Există asociere icircntre obezitate şi bolile cardio-vasculare
Testul Fisher
Corecţie a testului χ2
Valoarea p asociată parametrului ne dă probabilitatea ca valoarea observată de independenţă să fie
atribuită doar şansei
O valoare p mică indică că există alte cauze decacirct şansa influenţează rezultatul şi astfel cele două
variabile investigate nu sunt independente
Testul Fisher = dispersia corectată a factorului x dispersia corectată a factorilor reziduali
Icircn acest context regula adunării dispersiilor se poate scrie unde
este variaţia lui y pe seama variaţiei variabilei x
este variaţia lui y pe seama influenţei factorilor reziduali (neicircnregistraţi)
este variaţia totală a caracteristicii y
Testul Fisher empiric se calculează după formula
27
se compară cu Ftab pentru nx şi nz grade de libertate la un anumit prag de semnificaţie stabilit
Dacă Fc gt Ftab rezultă că variaţia factorului de grupare x este semnificativă pentru variaţia caracteristicii y
Testul z pentru proporţii
1 Compararea unei frecvenţe observate cu o frecvenţă teoretică
2 Testarea egalităţii a două frecvenţe
Testul z Compararea unei frecvenţe observate cu o frecvenţă teoretică
Scop Investigarea semnificaţiei diferenţei icircntre o frecvenţă teoretică p (icircntr-o populaţie) şi o frecvenţă
observată f pe un eşantion reprezentativ (variabilă calitativă (binare))
Condiţii de aplicare Testul este corect aplicat dacă numărul n al observaţiilor eşantionului este
suficient de mare (n∙p n∙(1-p)gt10
Parametrul
n = volumul eşantionului
Suntem interesaţi de investigarea prevalenţei hepatitei B la personalul care lucrează icircn laboratoarele
clinicilor de boli infecţioase din Transilvania Se ştie din studii anterioare că prevalenţa hepatitei B icircn
populaţia generală din Transilvania este de 9 S-a luat icircn studiu un eşantion de 100 persoane şi s-a
obţinut o prevalenţă a hepatitei B de 6 Există diferenţă semnificativă icircntre frecvenţa hepatitei B la
personalul care lucrează icircn laboratoarele spitalelor de boli infecţioase din Transilvania faţă de
populaţia generală
f = 006 p = 009 n = 100
Ipoteza nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat
faţă de frecvenţa hepatitei B icircn populaţia generală
Ipoteza alternativă test bilateral Există diferenţă semnificativă icircntre frecvenţa hepatitei B la
nivelul eşantionului şi prevalenţa hepatitei B icircn populaţia generală
f = 006 p = 009 n = 100
Pragul de semnificaţie a = 005
Regiunea critică test bilateral (-yen -196 ]Egrave[196 yen)
28
Concluzia testului
Deoarece parametrul statistic calculat al testului nu aparţine regiunii critice se acceptă ipoteza
nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat faţă de
frecvenţa hepatitei B icircn populaţia generală
Testul McNemar
Evaluarea dependenţei variabilelor calitative perechi (dorim să determinăm dacă o anumită
caracteristică este sau nu asociată cu o anumită patologie)
Identificăm n pacienţi care prezintă patologia de interes (eg Cancer bronho-pulmonar) şi n
pacienţi cu aceleaşi caracteristici ca şi primul grup dar care nu o prezintă
Martor = da Martor = nu
Caz = da a b
Caz = nu c d
Testul McNemar - exemplu fumat vs cancer
Martor = da Martor = nu
Cancer = da a = 2 b = 5
Cancer = nu c = 0 d = 3
29
χ2critic(α=005) = 384
32 lt 384 rarr acceptăm ipoteza nulă
Fumatul nu este icircn relaţie cu apariţia cancerului bronho-pulmonar
Inferenţa statistică pe date cantitative
Variabile cantitative continue
Testul z şi Student (t) (o medie sau medii perechi)
Testul z şi Student (t) (testarea a două medii)
ANOVA (ge 3 medii)
Ranguri (variabile cantitative discrete sau cantitative care nu icircndeplinesc condiţia de
normalitate)
Testul sumei rangurilor Wilcoxon
Kruskal-Wallis (ge 3 eşantioane independente)
Friedman (ge 3 eşantioane dependente)
Teste de normalitate variabile cantitative continue
Shapiro-Wilk
Kolmogorov-Smirnov
Shapiro-Wilk
Chi-Square Goodness-of-Fit
Dacă datele urmează o distribuţie normală aplicăm un test parametric
Dacă datele nu urmează o distribuţie normală aplicăm un test de comparare al rangurilor
30
Testul Z de comparare a mediei unui eşantion cu media unei populaţii
Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ
extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie
s2 care se cunoaşte
Condiţii de aplicare
1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru
compararea mediei unui eşantion cu media unei populaţii)
2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal
distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă
3 Talia eşantionului este mare ( ge 30)
Ipoteze
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media
eşantionului şi media populaţiei
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
(-yen -196 ] Egrave [196 yen)
Parametrul testului
n = volumul eşantionului
= media eşantionului
s = deviaţia standard a populaţiei
Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)
Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard
cunoscută
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi
media standard
Condiţii de aplicare
Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se
realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această
condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea
31
Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai
puternic
Numărul de grade de libertate (df) df = n-1
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
Parametrul testului
n = volumul eşantionului
micro0 = media standard
= media eşantionului
s = deviaţia standard a eşantionului
Testul ANOVA compararea mediilor a mai multe eşantioane
H0 = toate mediile sunt egale
H1 = nu toate mediile sunt egale
Condiţii de aplicare
1 Datele sunt independente unele faţă de celelalte
2 Datele fiecărui grup sunt normal distribuite
3 Deviaţia standard este aceeaşi pentru toate grupurile
Id Medicament
A B C D E F
1 5 6 7 10 5 9
2 6 8 8 11 8 8
3 7 7 9 13 6 7
4 8 9 11 12 4 5
32
5 9 10 10 9 7 6
Suma 35 40 45 55 30 35
Media 7 8 9 11 6 7
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =
= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)
Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2
F = (suma pătratelor(icircntre))(suma pătratelor(icircn))
Suma pătratelor (icircntre) = 16times5 = 80
Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60
Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn
interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare
SP df Media pătratelor F = MPicircntreMPicircn
Icircntre 80 5 = 805 = 16 = 1625 = 64
Icircn 60 24 = 6024 = 25
Total 140 29 -
Testul sumei rangurilor Wilcoxon
Aplicat pentru
Un set de observaţii provenite dintr-o valoare ipotetică comună
Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)
Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero
Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace
Suma rangurilor pentru diferenţele negative = 2+3+1 = 6
Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30
33
Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului
egal cu 8 = 0109
Icircnainte După Diferenţa Rang
64 66 -2 2
66 58 8 5
67 68 -1 3
71 65 6 4
72 75 -3 1
76 67 9 6
78 59 19 8
89 74 15 7
Testul Kruskal-Wallis (ge 3 eşantioane independente)
Test de ranguri aplicate pe mai mult de 3 eşantioane
H = parametrul testului
n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)
Tk = suma rangurilor
Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie
pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni
34
df = k-1 (k = numărul de eşantioane)
df = 3-1 = 2
Hcritic(α=005) = 599
H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie
pozitivă şi respectiv biopsie negativă
Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie
a tipului de studiu pe eşantioane perechi)
1 Definirea numărului de tratamente k
2 Obţinerea rangurilor pentru fiecare tratament
3 Sumarea rangurilor fiecărui tratament
4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)
5 Dacă Fr gt Frcritic rarr respingem H0
Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost
măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi
n = 9 k = 3 T12 = 225 T2
2 = 38025 T32 = 38025
Frcritic = 599
Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de
prostată
35
De reţinut
Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei
Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-
of-Fit
Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z
Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t
Compararea mediilor a 3 sau mai multe eşantioane ANOVA
Compararea mediilor a două populaţii (σ) testul Z
Compararea mediilor a două eşantioane (s) testul t
Compararea mediilor a două eşantioane perechi (s) testul t
ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi
cu cel pentru compararea a două eşantioane perechi
Ranguri
Distribuţia datelor nu are importanţă
Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)
Trei sau mai multe eşantioane Kruskal-Wallis
Trei sau mai multe eşantioane perechi Friedman
Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia
Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a
datelor)
Variabile nominale
Un singur eşantion sau eşantioane perechi
Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte
Eşantioane perechi testul Mc Nemar
Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2
Icircn analiza proporţiilor există teste diferite pentru
Compararea unei frecvenţe cu o frecvenţă cunoscută
Compararea a două frecvenţe
Semnificaţia statistică
Valoarea p (p value)
Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor
două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E
posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării
aleatorii
36
Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală
urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii
Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este
probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un
experiment de dimensiunea acestuia
Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că
diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii
diferite
Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca
fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă
ar fi fost adevărată
Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă
1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe
baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De
fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001
2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie
3 Se aplică testul statistic aferent pentru a calcula valoarea p
4 Se compară valoarea p cu valoarea ndash prag
5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe
semnificativă dpdv statisticrdquo
6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e
semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să
conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă
Teste de semnificaţie
Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului
populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)
Testarea ipotezelor implică posibile erori
Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile
sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui
grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul
icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005
ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există
37
nici o diferenţă
Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ
statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de
ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost
ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau
dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă
cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă
semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe
ipotetice variate icircn cazul icircn care ele există
Măsuri ale frecvenţei
Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)
Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate
Generic formula pe care se bazează toate cele trei este
unde x şi y sunt cantităţile de comparat
Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea
unei frecvenţe pe grupe de sex vacircrstă etc
Proporţia implică icircn mod necesar ca x să fie inclus icircn y
Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară
frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp
Pentru calcularea unei rate trebuie ţinut cont de trei aspecte
bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin
bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp
bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo
Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un
tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei
populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei
aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)
38
Indicatori
Rata de incidenţă
Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă
icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii
Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o
perioadă de timp
Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de
timp x
Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei
susceptibili de a dezvolta icircmbolnăvirea studiată
Numitorul poate fi
bull Numărul mediu al populaţiei icircn perioada de timp studiată
bull Mărimea populaţiei icircn mijlocul perioadei de studiu
bull Mărimea populaţiei la icircnceputul studiului
Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă
Este obligatorie menţionarea perioadei de timp
Prevalenţa
Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la
un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă
schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa
momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)
39
Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include
numai cazuri noi respectiv include cazuri noi şi vechi
Rata de atac
Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este
folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp
raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori
Rata persoană-timp
Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din
momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte
migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost
observate
Riscul relativ (RR)
Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment
legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele
prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două
grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la
bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la
bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai
mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo
Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2
Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn
cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă
(Tabelul 1)
Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR
Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la
neexpuşi
40
Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de
culegere a datelor
Odds ratio (OR)
Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin
raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general
studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)
Tabelul 2 Tabelul 2 x 2 pentru calcularea OR
Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală
Rate de mortalitate
Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp
specificată Există mai multe tipuri de rate de mortalitate
o Mortalitate specifică pe sex
o Mortalitate specifică pe rasă
o Mortalitate specifică pe boală
o Mortalitate neonatală
o Mortalitate postneonatală
o Mortalitate infantilă
o Mortalitate maternă
Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP
41
Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de
viaţă şi vacircrsta la care survine decesul dacă este prematur
Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu
Ani de viaţă pierduţi datorat dizabilităţii
Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt
utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru
cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite
grupuri
Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de
risc şi o boală se folosesc riscul relativ şi odds ratio
35 Analiza şi interpretarea datelor
După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date
trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul
Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor
colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului
studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu
plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde
prezenţa biostatisticianului este necesară
Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu
elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat
iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului
iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate
depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori
testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere
clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza
Interpretarea rezultatelor statistice
Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne
motive (număr mic de date) acceptarea ei să fie falsă
Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine
gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia
ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument
de decizie Intervalul de confidenţă
42
Interpretarea statistica ne interpretarea clinică
Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă
Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice
obţinute pe eşantionul studiat
Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare
Ce interpretăm Rezultatele
personale obţinute icircn urma studiului
care au fost prezentate icircn secţiunea bdquoRezultaterdquo
Explicăm rezultatele obţinute
Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale
Interpretarea trebuie să se realizeze icircn
lumina limitelor studiului
contextul cultural social şi educaţional al locului unde s-a realizat cercetarea
contextul a ceea ce se cunoaşte din literatura de specialitate
Interpretăm doar rezultatele personale obţinute icircn urma studiului
Interpretarea statistică nu este tot una cu interpretarea clinică
Interpretarea statistică este importantă
Interpretarea clinică este foarte importantă
Intervalul de confidenţă
Media calculată pe baza unui eşantion nu va echivala media populaţiei
Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului
Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a
populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a
populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)
pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru
orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare
dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de
confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de
date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de
5
Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel
Dacă valoarea p este mică
Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare
aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o
medie diferită Diferenţa este semnificativă dpdv statistic
43
Icircn continuare
Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa
reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică
pentru a fi interesante din punct de vedere ştiinţific
Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC
oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care
este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a
obţine o concluzie clară
Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o
diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că
datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din
punct de vedere ştiinţific
Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul
detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat
Erorile studiilor medicale
Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura
anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară
caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea
asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri
legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias
Erorile potenţiale icircn studiile epidemiologice
1 Erori icircntacircmplătoare
2 Erori sistematice
3 Confuzia
4 Validitatea
1 Erori icircntacircmplătoare
Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a
parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel
de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot
fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii
(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor
de măsură (eroarea de măsurare)
44
2 Erori sistematice
Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate
care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu
acurateţe mare Acurateţea nu este afectată de mărimea eşantionului
Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de
experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea
dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus
şi greu de cuantificat (consum de alcool personalitate etc)
Principalele tipuri de erori din această categorie sunt
bull Biasul de selecţie
bull Biasul de informaţie
Biasul de selecţie
Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul
trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion
inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale
persoanelor incluse
Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se
ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia
Biasul de informaţie
Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de
instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze
expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere
nesemnificativă sau chiar să nu şi-o amintească de loc
3 Confuzia
Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune
prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este
cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă
de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte
important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor
protector
4 Validitatea
Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă
Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte
estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional
Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă
45
conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se
demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)
Validitatea externă se poate realiza numai dacă studiul este valid intern
Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii
studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de
studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt
laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi
validă din punct de vedere intern)
3 6 Prezentarea rezultatelor
După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite
Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor
icircntr-o formă bdquodigerabilărdquo este necesară
Scopul prezentării datelor
1 Transmiterea concluziilor studiului
a Datele corecte şi importante merită comunicate
b Datele trebuie să confirme sau să infirme ipoteza studiului
c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală
2 Acordarea posibilităţii altor cercetători să aprecieze studiul
a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti
b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor
prezentate
Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru
fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie
statistică
Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de
valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras
(Tabel 3)
Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)
46
Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct
numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor
precum şi prezentarea acestora sub formă inteligibilă
Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care
convin cercetătorului
Prezentarea datelor se poate face
1 Figuri şi tabele icircn articole scrise
2 Figuri şi tabele icircn prezentări orale
3 Figuri şi tabele icircn postere
4 Text scris sau incluse icircn text
5 Site-uri de WEB
Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor
Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie
Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele
exprimacircnd exact ceea ce acestea exprimă
Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate
anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel
să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se
acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca
mai sus sugestive sunt formatele simple şi puţin icircncărcate
Dacă nu există reguli impuse se respectă
1 Mesaj simplu fără falsificarea datelor
2 De obicei este necesar atacirct tabelul cacirct şi graficul
3 Să fie simplu şi clar
Tabele
Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile
coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică
elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de
1 Se folosesc doar linii orizontale
2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn
evidenţi prin linie de separare (Tabelul 4)
Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland
Noua Zeelandă)
(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)
47
3 Numerele sunt aliniate icircn funcţie de virgulă
4 Indicii statistici sunt explicaţi sub tabel
5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană
6 Abrevierile pot fi folosite
7 Numărul de zecimale trebuie limitat la maxim două
8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel
9 Plasarea legendei este obligatorie sub tabel
10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)
Icircn cazul prezentărilor orale sau a posterelor este indicat ca
1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării
2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte
3 Folosirea de simboluri este permisă
Clasificarea tabelelor
Tabelele se clasifică după
i) conţinut
bull cu distribuţii de frecvenţe
bull de clase de frecvenţe
bull de contingenţă
ii) structura
bull cu doua coloane
bull cu subclasificări
bull ldquomasterrdquo
Tabele ce conţin distribuţii de frecvenţe
O modalitate comodă de a prezenta o mulţime de date brute este
1 Se ordonează datele in ordine crescătoare
2 Se determine frecvenţa fiecărei valori
3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane
(Tabelul 5)
Tabelul 5 Distribuţii de frecvenţă absolută
48
Tabelul claselor de frecvenţe
1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă
2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)
Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)
Tabele de contingenţă
1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a
tabelelor de contingenţă
2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a
combinaţiilor de perechi ordonate de valori
3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre
a factor de risc si
b starea sănătăţii
4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)
5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)
Tabelul 7 Tabel de contingenţă 2 x 2
49
Grafice
Există două categorii de moduri grafice sub care se pot prezenta datele
1 Ilustraţii şi fotografii
2 Grafice
1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă
pentru lucrare
2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit
Putem vorbi despre mai multe tipuri de grafice
bull Grafice pentru reprezentarea datelor cantitative
1048707 Grafic cartezian (X Y)
1048707 Histograma
1048707 Poligonul de frecvenţe
1048707 Diagrama bdquoscatterrdquo
bull Grafice pentru reprezentarea datelor calitative
1048707 Grafic cu bare
1048707 Diagrama tip bdquoboxplotrdquo
1048707 Diagrama bdquopierdquo
1048707 Cartograma
Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi
dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)
Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)
Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie
Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)
Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)
50
Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir
de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele
două variabile studiate (Figura 6)
Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2
(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2
rămacircne aproximativ constantă)
Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea
comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea
comparativă a mai multor variabile
Figura 7 Grafic calitativ cu bare
51
Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo
Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două
posibilităţi reprezentate grafic este mai frecventă (Figura 8)
Figura 8 Reprezentare tip bdquopierdquo
Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli
sau a oricărui element comparativ Se foloseşte de epidemiologi
Rezultate
Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare
Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o
manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu
explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția
bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la
ilustraţii tabele grafice
Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi
nici rezultatele care invalidează eventual ipoteza
Discuţii
Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd
cultura ştiinţifică şi inteligenţa autorilor
Acest capitol răspunde la trei obiective
Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia
calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de
selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează
rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv
52
este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn
care a fost abordată problema fără a face o revistă a literaturii
Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea
rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul
Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor
afirmaţii nesusţinute de conţinutul lucrării
Concluzii
Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate
să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie
Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de
concluzii va scădea valoarea lucrării
Bibliografia (lista referinţelor citarea icircn text)
Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn
lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente
Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli
- să conţină cele mai importante şi recente lucrări
- să includă numai lucrări publicate
- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate
Bibliografie
Elisabeta Jaba ndash Statistică Ed Economică 1998
Mihai Ţarcă ndash Statistică volI Ed UAIC 1979
Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale
Ed University Press 2009
Sorana Daniela Bolboacă ndash Metodologia cercetării curs
53
bull profilaxia icircmbolnăvirilor include totalitatea măsurilor care pot influenţa cauzele modificabile ale unei boli şi
se efectuează icircn patru trepte profilaxia primordială primară secundară şi terţiară
Justificarea studiului clinic
Justificarea studiului pleacă de la informaţiile existente legate de subiectul pe care cercetarea
intenţionează să icircl dezbată informaţii existente icircn literatura de specialitate
Cercetarea bibliografică permite identificarea unor lipsuri icircn legătură cu problema luată icircn studiu
inexistenţa de date referitoare la o icircmbolnăvire dintr-o zonă geografică (ţară judeţ comunitate) explicarea şi
emiterea unor soluţii de remediu Toate acestea ar putea fi elemente care justifică iniţierea şi derularea unui
studiu
Icircn justificarea studiului se poate insista pe
bull caracterul nou actual inedit al problemei
bull un nivel ridicat al morbidităţii sau mortalităţii unui fenomen de sănătate
bull gravitatea evenimentului
Calităţile studiului de cercetare
Un bun studiu de cercetare trebuie să fie pertinent nou fezabil să respecte etica medicală
Un studiu este pertinent cacircnd are repercusiuni asupra viitorului clinic al unui fenomen de sănătate pertinența
practică icircnsemnacircnd o mai bună cunoaştere a bolii a prognosticului ei ameliorarea tehnicilor de diagnostic şi
de tratament etc
O altă cerinţă se referă la ineditul studiului faptul de a fi nou icircn sensul de a aduce informaţii noi să nu repete
un studiu deja finalizat şi cu concluzii ferme
Cercetătorul trebuie icircnainte de a demara studiul icircnainte de a investi timp bani energie să estimeze dacă
studiul este fezabil Icircn acest sens trebuie să se asigure că
bull are un număr suficient de subiecţi determinări de laborator etc pentru a putea trage concluzii adecvate
bull nu există constracircngeri tehnologice sau financiare
bull studiul este accesibil şi acceptat de populaţie
bull nu are costuri de timp dar mai ales financiare mari
bull nu are scopuri prea ambiţioase sau scopuri multiple icircn general un studiu ar trebui să aibă un singur scop să
găsească rezolvarea la o singură icircntrebare
Studiul medical trebuie să respecte etica medicală cele patru principii
bull interesul şi beneficiul cercetării
bull inocuitatea (nevătămarea cercetării)
bull respectul faţă de persoanele incluse icircn studiu (respectul intimităţii persoanelorconfidenţialitatea datelor)
bull păstrarea echităţii şi respectul valorilor morale
In efectuarea unui studiu este necesară parcurgerea următoarelor etape
1 Pregătirea studiului
3
2 Elaborarea protocolului
3 Culegerea informaţiilor (datelor)
4 Prelucrarea datelor
5 Analiza şi interpretarea rezultatelor
6 Prezentarea rezultatelor
7 Redactarea studiului
3 Etapele unui studiu de cercetare
31 Pregătirea studiului de cercetare
Pregătirea studiului de cercetare comportă mai multe sub-etape
bull Documentarea bibliografică
bull Definirea fenomenului
bull Formularea temei de cercetare
bull Aspecte manageriale
Documentarea bibliografică
Cercetarea bibliografică are misiunea de a realiza un compromis icircntre excesul de documente (anual se
publică icircn icircntreaga lume peste 20000 de reviste cu caracter medical) şi pierderea de informaţii pertinente
Cercetarea bibliografică necesită o selectare şi o evaluare a literaturii de specialitate pe o anumită problemă şi
se realizează prin parcurgerea a trei etape
a) Prima etapă este cercetarea bibliografică propriu-zisă adică identificarea publicaţiilor care se referă la
subiectul icircn discuţie
Etapele documentării bibliografice sunt
bull Definirea şi delimitarea precisă a subiectului de cercetat
bull Stabilirea unei liste de bdquocuvinte cheierdquo prin lectura referinţelor bibliografice
bull Traducerea icircn limbi de circulaţie internaţională
bull Stabilirea unei liste cu documentele de cercetat
bull Consultarea unor tratate sau cărţi de referinţă
bull Consultarea publicaţiilor primare
bull Redactarea fişelor bibliografice şi aranjarea lor icircn ordine alfabetică
bull Introducerea referinţelor bibliografice icircn textul propriu-zis
Literatura primară de specialitate
Reprezintă toate materialele scrise care conţin studii originale
Articole ştiinţifice Au calitatea esenţială că informaţiile publicate sunt recente intervalul de timp scurs de la
scriere la publicare fiind icircn general foarte scurt
4
Teze de doctorat licenţă Se pot găsi icircn bibliotecile instituţiilor de icircnvăţămacircnt superior Sunt utile pentru că
icircn general tratează pe larg o anumită problemă care poate fi de interes avacircnd şi o bibliografie recentă
Brevete şi mărci Sunt acele sisteme de protecţie a produselor şi tehnologiilor Sunt utile icircn general icircn
cercetarea experimentală
Literatura secundară de specialitate
Tratate de specialitate Sunt foarte importante icircn faza incipieintă a unui studiu pentru aprofundarea problemei
de cercetat Informaţiile prezente icircn astfel de publicaţii sunt ordonate cu noţiuni de bază definiţii teorii
posibile etc
Cărţi de referinţă Sunt monografii care studiază pe larg un fenomen putacircnd fi foarte utile atacirct cercetătorilor
debutanţi cacirct şi celor iniţiaţi
Literatura terţiară de specialitate este reprezentată de indexuri reviste cu extrase de articole şi rezumate
Cercetarea bibliografică bdquoon-linerdquo permite accesul la nenumărate surse de informare utilizacircnd icircn acest scop
motoare de căutare
b) A doua etapă este lectura critică activă a publicaţiilor selectate pentru a judeca valoarea publicaţiilor
indiferent dacă este vorba de calitatea cercetării sau de pertinenţa rezultatelor publicate
Evaluarea corectă critică a unui articol va permite cititorului să aprecieze dacă publicaţia este credibilă
rezultatele corespund realităţii (validitatea internă) respectiv dacă informaţiile conţinute icircn publicaţie sunt
aplicabile icircn practica medicală dacă se pot generaliza dacă sunt aplicabile icircn proiectul de cercetare al
viitorului investigator (validitatea externă)
Lectura critică a literaturii medicale se bazează pe folosirea unei grile de lectură care are meritul de a putea fi
aplicată tuturor tipurilor de publicaţii Această grilă are 8 criterii de evaluare pentru fiecare criteriu trebuie să
se răspundă la următoarele icircntrebări
bull este posibil să se găsească icircn articol informaţia pentru criteriul icircn cauză
bull dacă criteriul abordat este corect
bull dacă criteriul este incorect icircn ce măsură ameninţă validitatea studiului
Cele 8 criterii de evaluare sunt
1 Obiectivul vizează următoarele preocupări medicale
bull istoria naturală a unei boli evoluţia şi prognosticul ei
bull performanţa unui test diagnostic
bull impactul unei intervenţii (terapeutice de depistare de prevenţie sau de educaţie)
Lectura critică va aşeza articolul icircn una din aceste situaţii apoi icircn raport cu obiectivul va stabili dacă are
ipoteze de verificat
5
2 Tipul de studiu Cititorul trebuie să recunoască planul de studiul pentru a verifica dacă tipul de studiu este
adaptat icircntrebării puse Va merge progresiv cu urmărirea de la raportul de caz-seria de cazuri la studiul
transversal studiul caz-control studiul de cohortă şi trialul controlat
3 Factorii studiaţi (variabila independentă) pot fi factori de expunere sau de intervenţie Cititorul trebuie să
poată recunoaşte factorul să aprecieze cum a fost măsurat dacă s-a folosit aceeaşi metodă de măsurare pentru
loturile icircn studiu ce metodă de comparaţie s-a folosit dacă sunt erori (factor de confuzie)
4 Criteriul de raţionament este evenimentul sau situaţia presupusă a fi rezultatul factorului studiat boala
decesul supravieţuirea complicaţiile etc Definirea precisă şi metoda de măsurare a rezultatului expunerii va
permite cititorului să aprecieze validitatea informaţiilor
5 Populaţia studiată (eşantionul) Se va urmări dacă este definită populaţia de referinţă şi populaţia de
studiat analizacircndu-se corectitudinea selecţiei randomizarea proporţia de subiecţi la sfacircrşitul studiului
validitatea externă a rezultatelor
6 Analiza datelor Cititorul trebuie să aprecieze dacă s-au examinat toate erorile inclusiv factorul de confuzie
dacă nu validitatea studiului ar putea fi compromisă
7 Rezultatele Principalele aspecte pe care cititorul le va urmări la acest capitol sunt dacă ele se datoresc
numai şansei dacă s-a făcut calculul statistic dacă s-a apreciat relaţia expunere-efect (RR OR RA) dacă a
fost apreciată semnificaţia clinică sau biologică care nu este identică cu semnificaţia statistică
8 Sinteza lecturii critice analizează concluziile autorilor dacă ele răspund icircntrebărilor formulate la icircnceputul
studiului dacă rezultatele sunt aplicabile la populaţia studiată dacă rezultatele sunt acceptabile pentru practica
proprie a cititorului dacă rezultatele justifică vreo schimbare icircn practica clinică respectiv vor ameliora starea
pacienţilor Această abordare cere cititorului cunoaşterea noţiunilor de bază icircn metodologia cercetării
ştiinţifice fiind vorba icircn acelaşi timp şi de un demers clinic
c) A treia etapă icircn cercetarea bibliografică constă icircn combinarea datelor din mai multe studii referitoare la
acelaşi subiect şi care se realizează prin meta-analiză Tehnica meta-analizei permite să se sporească
eficacitatea testării ipotezelor să crească forţa statistică a rezultatelor şi să se obţină informaţii care nu pot fi
convenabil extrase din fiecare cercetare
Definirea fenomenului
Definirea fenomenului se bazează pe
bull Cunoaşterea prealabilă a problemei prin documentare riguroasă documentare care poate justifica pertinenţa
temei propuse (revista literaturii de specialitate)
Icircn prima etapă se cercetează bibliografia propriu-zisă adică se identifică publicaţiile care se referă la subiectul
icircn discuţie apoi se vor selecta publicaţiile necesare studiului apreciind validitatea lor (problemele de
documentare bibliografică vor constitui un capitol separat)
bull Formularea unei ipoteze ştiinţifice sub-etapă care reprezintă fondul problemei
6
Ipoteza este o afirmaţie (nu o icircntrebare) despre o posibilă relaţie icircntre factorii studiaţi şi criteriile de
raţionament Ipoteza poate fi ipoteză ldquonulărdquo - nu există această relaţie şi ldquoalternativărdquo - există relaţia Ipoteza
va trebui apoi dovedită sau respinsă testul statistic calculează probabilitatea conform căreia asociaţia observată
este reală sau ea survine din icircntacircmplare
bull Motivarea organizării studiului Trebuie făcută o motivare corectă legată de inexistenţa unor studii
referitoare la problema pe care o va dezbate studiul
Formularea temei de studiu
Pentru formularea temei de studiu trebuiesc menţionate obiectivul sau obiectivele şi tipul de studiu ales pentru
cercetarea respectivă Există icircn general patru tipuri de obiective
bull obiective care se referă la evoluţia şi prognosticul unei icircmbolnăviri obiective prin care se icircncearcă
icircnţelegerea şi cunoaşterea unor evenimente ce pot să apară la un pacient pe parcursul bolii
bull obiective care se referă la etiologia bolii (cauze de natură bacteriană virală parazitară) sau la cauzalitate
(relaţia factor de risc-boală)
bull obiective legate de performanţa unor teste de diagnostic sau de screening de evaluare a strategiei de
diagnostic sau de interpretare a unui test
bull obiective care se referă la impactul unei intervenţii evaluarea unei intervenţii terapeutice de depistare a unor
boli de prevenţie de educare pentru sănătate
Obiectivele unui studiu se icircmpart icircn obiectivul major unul din cele patru enumerate şi obiective
secundare care pot aborda şi alte fenomene biologice decacirct cel major cu condiţia să nu altereze realizarea
acestuia Alegerea tipului de studiu este stracircns legată de obiectivul ales Dacă obiectivul este descrierea
distribuţiei caracteristicilor unei populaţii aprecierea frecvenţei unui fenomen de sănătate analiza acelui
fenomen icircn funcţie de timp loc persoană se va alege un studiu epidemiologic descriptiv studiu care nu are o
ipoteză fixată anterior O ipoteză se poate formula ca rezultat al studiului descriptiv dar nu se va face
verificarea ei icircn cadrul studiului Dacă intenţia studiului este de a emite o judecată asupra unei posibile relaţii
icircntre factorii studiaţi atunci problema de cercetat este fundamentată de o ipoteză care trebuie verificată
dovedită iar studiul care realizează acest lucru respectiv limitele studiilor utilizate
Aspectele manageriale
Aspectele manageriale includ
bull justificarea bugetului estimarea sumei necesară realizării studiului și apreciarea durate studiului
bull defalcarea bugetului pe necesități legate de achziționare de aparatură reactanți truse etc pentru personal
(munca depusă pregătire deplasări icircn teren participări la congrese sau conferințe documentare) materiale
consumabile etc
7
32 Elaborarea proiectului
Protocolul de cercetare este un document care emite obiectivul și ipoteza studiului definește condițiile de
desfășurare și realizare a viitorului studiu clinic Elaborarea protocolului este importantă pentru cercetătorii
participanţi la studiu comisiile de etică şi finanţatori
Protocolul include mai multe formulare care trebuie să cuprindă
a) Titlul proiectului
b) Sumarul proiectului
c) Descrierea proiectului
d) Normele deontologice de cercetare
e) Modalitățile de diseminarea și valorificarea rezultatelor
f) Perspective de continuare a cercetării
g) Anexe
Prezentarea proiectului va include următoarele fișiere
bull resursele umane (membrii echipei afilierea acestora)
bull relevanța temei pentru dezvoltarea cunoașterii icircn domeniu
bull stadiul actual al cunoașterii și bibliografia aferentă
bull justificarea studiului
bull enunțarea obiectivelor și ipoteza de lucru
bull metodologia propriu-zisă
Referitor la metodologia utilizată vor trebui menționate
bull factorulfactorii studiați care reprezintă variabila independentă respectiv dacă este cazul modalitățile de
măsurare
bull criteriile de raționament- variabila dependentă (situația sau evenimentul ce se presupune a fi rezultatul
factorului studiat cum ar fi boala handicapul complicații decesul)
bull tipul de studiu care se va aplica icircmpreună cu design-ul acestuia
bull eșantioanele de lucru și modalitățile de eșantionaj
bull metodele de culegere și de prelucrare a datelor
bull planificarea activităților
bull structura bugetului fiind eligibile următoarele categorii de cheltuieli de capital (echipamente software
upgrading) pentru personal (full sau part-time instruire asigurări de sănătate) de informare (documentare
abonamente) mobilități (vizite la alte unități de cercetare participări la
congrese) materiale consumabile (truse reactanți papetărie) valorificare a rezultatelor (lucrări științifice de
etapă sau lucrarea finală) cheltuieli indirecte (de regie)
bull modalităţile de valorificare a rezultatelor
bull legături de alte proiecte
8
Protocolul mai conține anexe curriculum vitae al investigatorului principal și al coinvestigatorilor
calendarul activităților avizul Comisiei de etică documente speciale și
consimțămacircntul informat icircn cazul studiilor pe subiecți umani
Icircnainte de implementare protocolul va fi verificat de experți pentru eligibilitate (dacă sunt icircndeplinite
condițiile de acceptare finanțare) calitate și pertinență icircn sensul că protocolul trebuie să fie clar exprimat
corect icircntocmit bine așezat și cu repercursiuni favorabile pentru viitor
33 Culegerea informaţiei
Pentru a realiza o cercetare medicală culegerea datelor este prima etapă şi realizează icircn funcţie de
obiectivele propuse tipul studiului timpul disponibil şi resurse umane şi financiare
Există două mari posibilităţi de culegere
bull Icircn funcţie de elementele studiate
o Culegerea exaustivă Toţi subiecţii populaţiei pe care dorim să o studiem Greu de realizat din cauza
costurilor foarte mari sau a alterării populaţiei de studiu
o Prin eşantionare Este metoda folosită icircn studii medicale
bull Icircn funcţie de durata culegerii
o Transversală Se studiază un grup la un moment dat
o Longitudinală Extinsă in timp
- Retrospectivă ndash icircnregistrări medicale
- Prospectivă ndash date culese la intervale prestabilite de timp
Populaţia ţintă
Este orice colectivitate icircntreagă de oameni animale plante sau obiecte de la care putem colecta date Populaţia
ţintă este icircntregul grup care ne interesează pe care dorim să-l descriem sau să tragem concluzii despre el
Pentru a putea realiza generalizări spre populaţia ţintă deseori suntem obligaţi să folosim un eşantion (selecţie)
care icircnsă trebuie să fie reprezentativ pentru populaţia pe care vrem să o studiem Pentru fiecare populaţie de
studiu sunt posibile mai multe eşantioane Pe baza acestor eşantioane se calculează un estimator Pe baza
acestui estimator calculat care poate fi medie aritmetică procent etc se pot trage concluzii despre icircntreaga
populaţie Este foarte important ca investigatorul să definească foarte atent şi complet populaţia icircnainte de a
realiza eşantionul inclusiv descrierea criteriilor de includere şi excludere icircn populaţia de studiu
Eşantionul
Un eşantion este practic un grup de elemente selectate dintr-un grup mai extins (populaţia ţintă) Studiind
eşantionul selectat se pot trage concluzii despre grupul de unde a fost ales (populaţia ţintă)
Este icircn general ales pentru studiu pentru că
bull Populaţia ţintă este prea mare şi nu poate fi studiată ca icircntreg
bull Nu avem acces din diverse motive decacirct la parte din populaţia de studiu
9
bull Un studiu pe icircntreaga populaţie poate distruge populaţia
bull Eşantioanele pot fi studiate mai rapid
bull Costul şi resursele necesare studiului sunt mai reduse
Numărul elementelor dintr-un eşantion se numeşte talia sau volumul selecţiei
Acesta fiind icircn general mai mic decacirct icircntreaga populaţie poate fi observat icircn detaliu iar dacă este reprezentativ
se pot afla prin intermediul său proprietăţile populaţiei ţintă
Eşantionul trebuie să fie reprezentativ pentru populaţia generală De aceea dintre metodele de eşantionare se
folosesc tehnicile de randomizare Trebuie să satisfacă două condiţii principale
bull condiţie de ordin cantitativ talia să fie suficient de mare
bull condiţie de ordin calitativ trebuie extras aleator din populaţia ţintă
Metode de eşantionare
Putem vorbi icircn linii mari de două posibilităţi de eşantionare prin metode probabilistice şi prin metode
nonprobabilistice
Eşantionarea probabilistică este metoda cea mai folosită icircn studiile medicale fiind şi cea indicată pentru a
realiza reprezentativitatea calitativă
Icircn medicină se folosesc patru tipuri de eşantionări
1 Simplu randomizat
2 Sistematic
3 Stratificat
4 Cluster (icircn cuiburi)
1 Eşantionul simplu randomizat Fiecare element din populaţia ţintă are o şansă egală non zero de a fi
inclus icircn eşantion Se ia la icircntacircmplare un număr de elemente egal cu talia eşantionului Dezavantajul acestui tip
de eşantionare este că presupune cunoaşterea icircntregii populaţii ţintă
2 Eşantionul sistematic După aflarea taliei eşantionului şi a populaţiei ţintă se calculează factorul de
eşantionare k icircmpărţind talia populaţiei ţintă la volumul eşantionului Apoi fiecare al k-lea element este
selectat spre includere
Acelaşi mare dezavantaj apare şi icircn acest caz fiind obligatorie cunoaşterea icircntregii populaţii de studiu
3 Eşantionul stratificat Există icircn cele mai multe cazuri probleme medicale care studiindu-se pe eşantion
prezintă variabilităţi icircn funcţie de caracteristicile populaţiei (sex vacircrstă nivel de pregătire etc) Icircn acest caz
este obligatorie realizarea similitudinii demografice a eşantionului cu populaţia de studiu Din date provenite
de la Centrul de Statistică putem dezvolta ca procente o structură a populaţiei Această structură trebuie să se
regăsească (procentual) şi icircntre membrii eşantionului O importantă şansă ca reprezentativitatea calitativă să fie
corectă este conferită de respectarea
acestei similitudini demografice
10
4 Eşantionul bdquoclusterrdquo sau icircn cuiburi Icircn cazul unui studiu amplu cu scop de a investiga populaţia unei
icircntregi ţări sau regiuni putem ajunge icircn imposibilitatea de a alege şi mai ales investiga indivizi răspacircndiţi prin
icircntreaga zonă Din acest motiv se desemnează la icircntacircmplare un număr calculabil de
grupuri populaţionale extinse icircn toată zona de studiu Aceste grupuri poartă numele de bdquocuiburirdquo La nivelul
fiecărui bdquocuibrdquo se aplică o tehnică precedentă de selecţie a cazurilor Se poate sau de cele mai multe ori se face
la nivel de bdquocuibrdquo stratificarea iar apoi selecţia propriu-zisă se realizează sistematic sau simplu randomizat
Este metoda de eşantionare cel mai frecvent utilizată icircn cercetarea medicală de amploare Pentru ca eventualele
erori să nu se poată strecura s-a definit şi un indice DEF (design effect) cu care trebuie multiplicată talia
selecţiei care pentru eşantionarea icircn bdquocuiburirdquo este egal cu 2 astfel putem obţine şi o reprezentativitate
calitativă dar şi una cantitativă
Eşantionarea nonprobabilistică este o metodă neindicată icircn studiile medicale datorită lipsei de forţă icircn ceea ce
priveşte posibilitatea de aplicare a concluziilor asupra populaţiei de studiu
Se definesc şi icircn acest caz patru metode
1 Eşantion de convenienţă Membrii unui astfel de eşantion sunt aleşi numai pentru că sunt la icircndemacircnă
disponibili de a răspunde le un eventual chestionar
2 Eşantion pe cote Similar cu tipul de eşantion stratificat se referă la faptul că selecţia se face formacircnd
eşantionul din primele 30 de persoane care respectă un criteriu impus
3 Eşantion cu un scop Elementele incluse icircn eşantion sunt alese după un criteriu care exclude din start marea
majoritate a populaţiei
4 Eşantion raţional Selecţia se face prin prisma unui raţionament al celui care conduce studiul
Parametru şi estimator
Parametrul este o valoare de obicei necunoscută (şi care trebuie să fie estimată prin studiu) folosită pentru a
reprezenta o anumită caracteristică a populaţiei de studiu De exemplu media populaţiei (icircnălţime) este un
parametru populaţional Raportat la o populaţie parametrul este o valoare fixă şi exactă care nu variază
Fiecare eşantion extras din populaţie va indica o valoare a mediei care nu poate decacirct să estimeze parametrul
Icircn general parametrii sunt notaţi cu litere greceşti (ex Media = μ)
Estimatorul este o valoare calculată dintr-un eşantion studiat Este folosit pentru a putea aprecia parametrul
populaţional pe care icircn căutăm Este de asemenea posibil ca dintr-o populaţie să formăm mai multe eşantioane
mediile lor de cele mai multe ori nefiind identice icircntre ele şi nici identice cu media populaţiei Estimatorii
sunt notaţi cu litere latine (ex Media = μ)
Dacă valoarea mediei calculată pe eşantion este de exemplu 168 cm atunci putem estima ca valoarea mediei
icircn populaţie este 168 cm
11
Tipuri de culegere a datelor
1 Culegere de tip eşantion reprezentativ Grupul de indivizi incluşi icircn studiu sunt reprezentativi (calitativ şi
cantitativ) pentru populaţia generală Poate fi utilizat pentru studii descriptive (cel mai frecvent) dar uneori şi
pentru studii analitice
Este necesar pentru acest tip de culegere a datelor ca iniţial să fie cunoscută talia eşantionului (calculabilă icircn
funcţie de prevalenţă şi precizie) Pentru evaluarea datelor culese se utilizează tabelul de contingenţă 2 x 2
astfel (Figura 1)
Figura 1 - Tabelul de contingenţă 2 x 2
Unde
a ndash persoane expuse unui factor de risc care au boala studiată
b ndash persoane expuse unui factor de risc care nu au boala studiată
c - persoane neexpuse unui factor de risc care au boala studiată
d - persoane neexpuse unui factor de risc care nu au boala studiată
După aranjarea datelor icircn tabelul de contingenţă (2 x 2) se poate icircncepe analiza statistică a datelor atacirct ca
procente calculabile cacirct şi din punct de vedere a aplicării de teste statistice pentru elucidarea semnificaţiei
statistice
Este posibilă din acest tip de culegere de date calcularea
1 Prevalenţei unei boli
2 Frecvenţei expunerii
3 Gradul de asociere icircntre factorul eventual de risc şi boala
2 Culegerea de tip expus ndash neexpus Icircmparte subiecţii icircn două categorii expuşi sau neexpuşi factorului de risc
studiat Ca evoluţie următoare a studiului după o astfel de culegere a datelor se poate evalua icircn timp apariţia
icircmbolnăvirii despre care se efectuează studiul Icircn timp longitudinal prospectiv se poate calcula dacă factorul
studiat reprezintă un risc de icircmbolnăvire este indiferent sau chiar este cu efect protectiv Numărul subiecţilor
din cele două grupuri poate fi egal sau poate fi diferit Numărul acestora poate fi calculat icircn vederea obţinerii
unei bune reprezentativităţi cu ajutorul formulelor de selecţie Avacircnd icircn vedere calitatea longitudinală a
12
studiului este important ca numărul ales să fie mai mare pentru a putea suplinii eventualele pierderi din
urmărire Practic rezultatele sunt introduse icircn tabelul 2 x 2 de unde se pot calcula indicatorii doriţi (Figura 2)
Avacircnd icircn vedere modul de culegere a datelor este permisă calcularea de indicatori numai pe orizontală
orice comparare icircntre coloana dreaptă şi stacircngă fiind incorectă Avantajul acestui tip de culegere a datelor ar fi
eventualul număr mai redus de subiecţi dar dezavantajul major este cel al costurilor de urmărire icircn timp dar
trebuie luată icircn calcul şi pierderea de subiecţi din evidenţe Factorul controlat este deci prezenţa expunerii iar
factorul aleator este prezenţa bolii
Figura 2 Tabelul de contingenţă pentru tipul de culegere expus ndash neexpus
4 Culegerea de tip caz ndash martor Icircn acest caz ceea ce ghidează colectarea datelor este prezenţa sau absenţa
bolii icircn momentul prezent Se vor culege date de la două loturi constituite după criteriul de bolnav B+ şi de fără
boală B+ Datele culese sunt icircn trecut deci caracterul datelor va fi retrospectiv Icircn acest caz factorul controlat
este boala factorul aleator fiind expunerea (Figura 3)
Calculul de indicatori icircn acest caz se va putea efectua numai icircntre coloane orice calcul icircntre valorile de pe linii
fiind greşit Rezultate semnificative se pot obţine icircn acest caz utilizacircnd loturi mai mici de studiu prin
comparaţie cu tipul eşantion reprezentativ permiţacircnd icircn acelaşi timp studiul bolilor rare (cu prevalenţă mică)
Figura 3 Tabelul de contingenţă pentru tipul de culegere caz ndash martor
Metode de culegere a datelor
Metoda aleasă pentru culegerea datelor trebuie să fie aleasă după un atent studiu bibliografic icircn vederea
stabilirii celui mai eficient mod de a răspunde temei de studiu
Metodele de culegere trebuie să fie bine aplicabile şi consistente ca aport informaţional necesar
13
1 Fiziologice Sunt colectate date despre anumite caracteristici fiziologice ale pacienţilor (TA glicemie
colesterol etc) Această metodă aduce rezultate obiective cacirct timp instrumentul de evaluare este bine calibrat
şi prezintă variaţii mici
2 Metode observaţionale Instrumentul de culegere a datelor trebuie să fie sincronizat cu protocolul conceput
de cercetător Datele culese trebuie să fie de asemenea consistente adică să fie colectate de aceeaşi manieră
conducătorul studiului trebuind să instruiască investigatorii (colectorii de date) Icircnregistrarea datelor trebuie să
fie de asemenea sistematică şi bine standardizată Observaţii de control trebuie icircn mod obligatoriu făcute
pentru a putea aprecia icircn mod corect orice deviere datorată unor factorii externi Este obligatorie luarea icircn
consideraţie a aspectelor etice
3 Interviul Poate fi structurat cu un set specific de icircntrebări sau nestructurat cu o temă generală cu care se
icircncepe interviul Interviurile pot fi icircnregistrate sau intervievatorul poate nota pur şi simplu răspunsurile Există
două tipuri generice de interviu interviul de profunzime care se referă la o discuţie icircn general structurată cu
un număr de icircntrebări prestabilite icircn icircncăperea de studiu fiind doară intervievatorul şi persoana chestionată şi
interviul de grup unde prin conversaţii pornind de la temă generală expusă şi condusă de intervievator se
obţin date despre subiecţii participanţi la studiu Ambele metode de interviu au indicaţiile lor precise Un
interviu pe teme intime nu va putea fi corect icircn ceea ce priveşte datele colectate dacă se aplică un interviu de
grup
4 Chestionarul Document scris adresat unor persoane pentru a răspunde la una sau mai multe icircntrebări
Trebuie să aducă răspunsurile la icircntrebările care motivează studiul constituind ansamblul icircntrebărilor destinate
culegerii de informaţii (date) Redactarea chestionarului trebuie să ţină cont de structura acestuia introducere
conţinut exprimarea icircntrebărilor grafica chestionarului
5 Icircnregistrări preexistente
Icircn cercetarea medicală sunt cel mai frecvent utilizate Informaţiile dorite sunt deja existente ceea ce icirci revine
cercetătorului este ca să structureze datele icircn funcţie de scopul studiului pe care icircn conduce Aceste surse sunt
bull Foi de observaţie
bull Registre de consultaţie
bull Buletine de analize
bull Registre de operaţii
Icircn cazul icircn care nici o metodă de culegere a datelor nu este pe placul celui ce conduce studiul există
posibilitatea de a construi un instrument nou de culegere a datelor
Acest proces trebuie să urmărească nişte paşi obligatorii fiind mare consumator de timp
bull Definirea structurii cu care se va face măsurarea
bull Formularea itemilor de măsură
bull Analiza validităţii instrumentului de măsură ndash măsoară acesta fenomenul corect
bull Elaborarea de instrucţiuni de utilizare pentru investigatori
14
bull Pretestarea instrumentului
bull Aprecierea validităţii interne şi externe a datelor culese
Instrumente de cercetare
Formularea clară a temei de cercetare necesită o foarte bună definire a factorilor studiaţi şi a criteriilor de
judecată Acestea din urmă sunt ultimele care vor trebui definite icircn cadrul protocolului de studiu
Alegerea unui instrument de măsură
Nu există un instrument de măsură perfect sau universal corect Alegerea sa dintre cele existente şi cele deja
utilizate depind de trei factori
bull Obiectivul studiului
bull Boala studiată
bull Populaţia icircn studiu
De aceste trei elemente trebuie ţinut cont icircn fiecare etapă a dezvoltării instrumentului
Definirea obiectivului
Studiu transversal Dacă se doreşte studierea unui simptom sau a unei caracteristici ale populaţiei se poate
icircmpărţi populaţia de studiu icircn mai multe grupuri Este practic vorba de a determina diferenţele dintre subiecţi
icircn cea ce priveşte o variabilă necesară studiată printr-un studiu transversal (utilizarea dozării de Ac HBS
pentru a evalua progresele bolnavilor de hepatită tip B)
Studiu longitudinal Icircn acest caz nu se poate icircmpărţii populaţia de studiu icircn mai multe grupuri datele obţinute
fiind de la acelaşi subiect colectate după un interval de timp
Icircn funcţie de boală şi populaţie se aleg şi instrumentele de măsură cele mai adecvate
Instrumentele cercetării reprezintă un mecanism specific sau o strategie pe care cercetătorul o utilizează pentru
colectarea prelucrarea şi inferenţa datelor Aceste instrumente sunt
1 Studiul icircn bibliotecă
2 Computerul
3 Determinările experimentale
4 Statistica
5 Mintea umană
6 Facilităţi de limbaj şi comunicare
Determinările experimentale
Măsurarea constă icircn aprecierea şi cuantificarea fenomenelor calitativ sau cantitativ Interpretarea
datelor se referă la transformarea lor icircn unităţi de descoperire a unor fenomene mai puţin cercetate
Standardele acceptate se referă la norme medii distribuţii etc Tot icircn cadrul interpretării datelor datele
obţinute sunt caracterizate pe scale de valori nominal ordinal de interval sau de raport
Validarea şi reproductibilitatea măsurătorilor sunt aspecte importante şi foarte necesare pentru o
cercetare corect fundamentată care doreşte obţinerea unor concluzii pertinente
15
Statistica Este implicată icircn condensarea şi procesarea unui volum mai mare de date astfel icircncacirct să se poată
interpreta corect valorile obţinute şi să se permită comparările Utilizarea unor teste statistice specifice permite
determinarea semnificaţiei (diferenţei) statistice astfel icircncacirct estimatorii să poată fi aplicaţi la populaţia
generală Furnizează informaţii şi privind corelarea sau relaţionarea icircntre date
Mintea umană este cea care reuşeşte să integreze şi să icircnţeleagă rezultatele obţinute Semnificaţia ştiinţifică
este stabilită icircn funcţie de rezultatele statisticii de mintea umană conform afirmaţiei bdquosemnificaţia ştiinţifică
nu este egală cu semnificaţia statisticărdquo Metodele aplicate pentru a putea ajunge la o concluzie pertinentă sunt
logica deductivă raţionamentul inductiv şi gacircndirea critică
Limbaj şi comunicare Exprimarea orală sau icircn scris permite nuanţarea unor aspecte seci cifrice ale unor
studii Icircn acest mod devine mai evidentă semnificaţia ştiinţifică a unor rezultate statistice
34 Prelucrarea datelor
Instrumentele de prelucrare
Statistica este o ştiinţă ramură a matematicii care studiază evoluţia fenomenelor şi proceselor
colective pe baza observării lor ştiinţifice a culegerii şi prelucrării detaliate a informaţiilor statistice cu scopul
de a formula şi explica legile legităţile şi regularităţile ce le guvernează
Statistica permite deci aprecierea unor parametrii populaţionali prin studiul unui număr redus de
elemente ale populaţiei icircn studiu (ţintă) O populaţie poate fi definită printr-un şir de valori care pot fi grupate
icircn funcţie de parametrul studiat (glicemie colesterol TAD TAS etc) Pentru fiecare astfel de şir se defineşte
o variabilă (care va purta nume propriu glicemie colesterol etc) Practic variabila este considerată o funcţie
ia valori posibil diferite de la un element la altul icircn funcţie de caracteristicile proprii acestora Sunt clasificate
icircn două grupe variabile cantitative (caracteristică măsurabilă) şi calitative (caracteristică ce nu poate fi
măsurată)
La racircndul lor variabilele calitative pot fi
bull Nominale ndash grupuri de elemente ce nu pot fi ordonate (culoarea părului)
bull Nominale ordonate ndash concluziile pot fi grupate (eficienţa unui tratament slabă bună foarte bună)
bull Binare ndash apar numai două posibilităţi (bolnav sănătos)
Variabilele cantitative pot fi
bull Continue ndash o variabilă măsurabilă care poate lua o infinitate de valori
bull Discrete ndash variabile care nu pot lua decacirct valori icircntregi
Statistica descriptivă
Există două ramuri ale statisticii statistica descriptivă şi statistica inferenţială
Statistica descriptivă (după cum rezultă din denumire) se ocupă cu descrierea unor valori obţinute ale unei
variabile studiate
16
Valorile pe care variabila le ia se constituie icircntr-o serie statistică Indicatorii care definesc o variabilă (serie)
sunt
1 Ale tendinţei centrale
Media aritmetică - notată de regulă cu
Mediana - este acea valoare din şirul de date care icircmparte icircn două părţi egale şirul ordonat de valori (atenţie
şirul este ordonat crescător) situacircndu-se la mijlocul seriei statistice
Dacă numărul de valori n este un număr impar atunci mediana este valoarea unde
Dacă n este par deci avem un număr par de valori mediana este definitatilde ca fiind
unde k = n2
Modul - constituie valoarea care apare cel mai des deci valoarea cu numărul cel mai mare de apariţii
2 De dispersie
Amplitudinea - este diferenţa dintre valoarea maximă şi cea minimă
A = Amax - Amin
Amplitudinea relativă - notată A este raportul dintre amplitudinea absolută şi media aritmetică a seriei de
date
Varianţa notată este un indicator de icircmprăştiere a datelor Formula de calcul este
Abaterea standard (S) sau deviaţia standard reprezintă rădăcina pătrată din varianţă (dispersie)
Coeficientul de variaţie se calculează ca un raport procentual icircntre abaterea standard şi valoarea medie a şirului
de valori
Eroarea standard intervine icircn estimarea intervalelor de confidenţă Se calculează astfel
17
3 De asimetrie (skewness) indică distribuţia datelor dacă sunt sau nu distribuite normal
4 De boltire (kurtosis) estimează boltirea sau aplatizarea curbei de distribuţie
Prezentarea descriptivă a datelor se face prin icircnregistrarea datelor culese icircn tabele care să reprezinte icircn mod
sintetic valorile măsurate
Icircn concluzie statistica descriptivă permite
bull Stabilirea comparabilităţii icircntre grupurile de studiu şi aprecierea prezenţei erorilor sau confuziei
bull Reprezentarea datelor icircn tabele permite evaluarea fiecărui pacient şi dacă a existat pierderi din studiu
Statistica inferenţială
Statistica inferenţială (inductivă) este partea de analiză a datelor care permite extrapolarea unei
concluzii trase pe baza unui eşantion spre populaţia ţintă pentru care a fost efectuat studiul
Scopul analizei statistice este de a evidenţia efectul unui tratament sau al unui factor de risc prin date obţinute
din eşantionul studiat spre populaţia ţintă Aceasta implică testarea ipotezelor statistice sau altfel spus testarea
semnificaţiei statistice Este una dintre cele mai importante momente ale studiului Cum rezultatele sunt
obţinute prin studiul unui eşantion există posibilitatea ca acestea să fie datorate icircntacircmplării Testele
statistice ne ajută să apreciem icircn ce măsură rezultatele sunt icircntacircmplătoare şi mai ales icircn ce măsură şi dacă se
pot aplica populaţiei generale Icircn acest scop se impune o valoare limită alfa 005 care reprezintă limita
superioară a probabilităţii ca rezultatul obţinut să fie greşit (datorat icircntacircmplării) Astfel icircn funcţie de tipul
variabilelor şi indicatorii descriptivi aplicaţi şi evaluaţi se aplică teste de semnificaţie statistică (Tabelul 1)
Tabelul 1 Alegerea testelor de semnificaţie statistică
Tipul datelor
18
Diferenţierea variabilelor din punctul de vedere a distribuţiei se face folosind testul de normalitate
Kolmogorov ndash Smirnov
Testul statistic reprezintă metoda de comparaţie a două sau mai multe populaţii prin intermediul unor
variabile observate ale lor
Scopul unui test statistic este de a defini realitatea
Definirea icircntrebării de cercetare (ipoteza clinică)
Tratamentul cu Nebivolol este la fel de eficient ca şi cel cu Valsartan icircn tratamentul
hipertensiunii arteriale
Transpunerea icircntrebării de cercetare icircn termeni statistici (ipoteza statistică)
Media tensiunii arteriale a pacienţilor trataţi cu Valsartan nu diferă semnificativ de media
tensiunii arteriale a pacienţilor trataţi cu Nebivolol
Etapele unui test statistic
1 Formularea problemei icircn termenii ipotezelor statistice
2 Alegerea şi calcularea parametrului statistic al testului
3 Regiunea critică
4 Concluzia testului
1 Formularea problemei icircn termenii ipotezelor statistice
Ipoteza nulă ipoteza care trebuie testată testul efectuacircndu-se sub prezumţia că ipoteza nulă ar
fi adevărată
Ipoteza alternativă acea ipoteză care icircntr-un sens sau altul contrazice ipoteza nulă Această
ipoteză se mai numeşte şi ipoteza de lucru
Ipoteza nulă tipuri
O coadă (ldquoone-tailedrdquo sau ldquoone-siderdquo)
Media este mai mare
Media este mai mică
Două cozi (ldquoone-tailedrdquo sau ldquoone-siderdquo)
Media este egală
2 Alegerea şi calcularea parametrului statistic al testului
Parametrul statistic al testului exprimă icircntr-o anumită formă diferenţa dintre elementele comparate
Ţinacircnd seama de faptul că eşantionul sau eşantioanele utilizate sunt aleator extrase din populaţiile care
fac obiectul testului parametrul statistic este o variabilă aleatoare de selecţie care urmează o anumită
lege de probabilitate
Un parametru statistic al testului bun trebuie să icircndeplinească două condiţii
19
Trebuie să se comporte diferit atunci cacircnd ipoteza nulă H0 este adevărată faţă de situaţia icircn
care ipoteza alternativă H1 este adevărată
Distribuţia de probabilitate a parametrului statistic al testului sub prezumţia că H0 este
adevărată este cunoscută
3 Regiunea critică
- Trebuie să fim capabili să decidem icircn funcţie de valoarea parametrului statistic calculat care dintre
ipoteze cea nulă sau cea alternativă este adevărată
- Dacă valoarea parametrului statistic aparţine regiunii critice ipoteza nulă H0 va fi respinsă şi va fi
acceptată ipoteza alternativă H1
- Dacă valoarea parametrului statistic nu aparţine regiunii critice ipoteza nulă H0 va fi acceptată
- Decidem mărimea regiunii critice
Pentru aceasta trebuie să specificăm mărimea riscului de eroare pe care icircl acceptăm
Pe scurt definim nivelul de semnificaţie notat cu a sau mărimea riscului pe care
suntem dispuşi să ni-l asumăm icircn respingerea ipotezei nule H0 icircn cazul icircn care aceasta
este adevărată De obicei se alege un nivel de semnificaţie icircntre 1 şi 5
Probabilitatea unei erori de tipul I
probabilitatea de respingere a ipotezei nule H0 icircn favoarea ipotezei alternative H1 icircn
condiţiile icircn care H0 este adevărată
probabilitatea unei erori de tipul I se notează cu a şi se mai numeşte nivel de
semnificaţie al testului
Probabilitatea unei erori de tipul II
probabilitatea acceptării ipotezei nule icircn condiţiile icircn care ipoteza alternativă H1 este
adevărată
această probabilitate se notează cu b
- Unilaterală la dreapta ndash valoarea parametrului statistic al testului este mai mare sau egală cu
valoarea din dreapta a intervalului critic
- Unilaterală la stacircnga ndash valoarea parametrului statistic al testului este mai mică sau egală cu
valoarea din stacircnga a intervalului critic
- Bilaterală ndash valoarea parametrului statistic al testului este mai mică sau egală cu valoarea extremă
din stacircnga regiunii critice sau mai mare sau egală cu valoarea extremă din dreapta regiunii critice
valorile extreme ale regiunii critice avacircnd nivele egale de semnificaţie
4 Concluzia testului
- Ipoteza nulă H0 este respinsă dacă valoarea parametrului statistic aparţine regiunii critice
20
- Regiunea critică trebuie astfel aleasă icircncacirct dacă ipoteza alternativă H1 este adevărată
probabilitatea de respingere a ipotezei nule H0 este mai mare decacirct icircn cazul icircn care ipoteza nulă H0
ar fi adevărată
- Acceptarea ipotezei nule H0 atunci cacircnd ipoteza alternativă H1 este adevărată este cunoscută ca şi
eroarea de tipul II
a probabilitatea ei se notează cu b
b măsoară bdquonivelul de eroarerdquo
- Icircn testarea oricărei ipoteze statistice există patru situaţii care determină dacă decizia noastră este
corectă sau nu
Cazuri
H0 este adevărată H0 este falsă
Concluzie H0 se acceptă decizie corectă eroare de tipul
II
H0 se
respinge
eroare de tipul I decizie corectă
Luarea deciziei pe baza valorii probabilităţii p de semnificaţie a testului
Icircn momentul icircn care prelucrăm statistic o serie de date dorim să ştim dacă rezultatele obţinute sunt sau
nu semnificative statistic
Răspunsul la această icircntrebare este dat de valoarea lui p calculată de orice program statistic la
prelucrarea unor date
Icircn cazul testelor statistice ipoteza nulă este respinsă dacă nivelul de semnificaţie este mai mic decacirct
005 iar programele de prelucrare statistică a datelor vor afişa o steluţă () icircn tabelul rezultatelor
21
Dacă p le 005 respingem ipoteza nulă şi acceptăm ipoteza alternativă (am obţinut semnificaţia
statistică)
Dacă p gt 005 acceptăm ipoteza nulă (nu am obţinut semnificaţia statistică)
p = 013
NU respingem ipoteza nulă
Risc de eroare de tip II
α = 005
p = 002
Respingem ipoteza nulă
Risc de eroare de tip I
Semnificaţia lui p
Criteriu de luare a deciziei cu privire la o ipoteză statistică nulă
Cuantifică şansa ca o decizie de respingere a ipotezei nule să fie greşită
Măsură a semnificaţiei statistice şi NU CLINICĂ
22
Semnificaţia lui p (reguli empirice)
001 le p lt 005 rezultatul e semnificativ statistic
0001 le p lt 001 rezultatul e icircnalt semnificativ statistic
p lt 0001 rezultatul e foarte icircnalt semnificativ statistic
p ge 005 rezultatul e considerat nesemnificativ statistic
Limite ale valorii p
Valoarea p NU ne dă informaţii despre
Şansa de beneficiu a unui pacient individual
Procentul de pacienţi care vor avea un beneficiu icircn urma instituirii procedurii medicale
Gradul de beneficiu expectat pentru un anumit pacient
Puterea unui test statistic
Este capacitatea de a detecta o diferenţă acolo unde există
Creşterea volumului eşantionului determină creşterea puterii testului statistic aplicat
Valoarea este icircn relaţie directă cu eroarea de tip II
Puterea = 1 ndash β
Cea mai utilizată modalitate de creştere a puterii unui test statistic este de a creşte volumul
eşantionului
Tipul scalei de măsură ndash testul statistic
Denumire test Interval Nominal Observaţii
Corelaţie Pearson 2 0 Există o relaţie liniară
χ2 0 2
Student 1 1 Doar 2 grupuri
ANOVA 1 1 2 sau mai multe grupuri
Student perechi 1 1 Eşantioane perechi
Măsurători repetate (ANOVA) 1 1 Mai mult de 2 grupuri date
perechi
Inferenţa statistică pe date calitativ e
Tabela de contingenţă 2times2
Riscuri şi raţii
Testul χ2 (testarea asocierii icircn tabela de contingenţă)
Testul Fisher
23
Testul z pentru proporţii
Testul McNemar
Tabela de contingenţă 2times2
Scale de tip nominal (dicotomiale tabela de contingenţă de 2times2) sau ordinal (tabela de contingenţă de
rtimesc)
Frecvenţa absolută (numărul de evenimente per categorie)
Tabela de contingenţă de 2times2 4 categorii
AP = adevărat pozitiv
FP = fals pozitiv
FN = fals negativ
AN = adevărat negativ
Ulcer deschis Ulcer vindecat Total
Recurenţă + AP = 1 FP = 5 = 1+5 = 6
Recurenţă - FN = 7 AN = 16 = 7+16 = 23
Total =1+7=8 =5+16=21 29
Riscuri şi raţii Mărimi ale asocierii
Denumire Formula Definiţie
Rata falşilor pozitivi =FP(FP+AN) Probabilitatea unui test fals + (α)
Rata falşilor negativi =FN(FN+AP) Probabilitatea unui test fals ndash (β)
Sensibilitate =AP(AP+FN) Probabilitatea unui test real + (1- β)
Specificitate =AN(AN+FP) Probabilitatea unui test real ndash (1- α)
Acurateţe =(AP+AN)n Probabilitatea generală a unei decizii corecte
Valoarea predictivă pozitivă =AP(AP+FP) Probabilitatea ca un test pozitiv să fie corect
Valoarea predictivă negativă =AN(AN+FN) Probabilitatea ca un test negativ să fie corect
Riscul relativ =AP(FP+AN)FN(AP+FP)
Rata şansei =(AP∙AN)(FN∙FP)
Riscul atribuabil =AP(AP+FP)-FN(FN+AN)
24
Denumire Formula
Rata falşilor pozitivi = 5(5+1) = 08334
Rata falşilor negativi = 7(7+16) = 03043
Sensibilitate = 1(1+7) = 01250
Specificitate = 16(16+5) = 07619
Acurateţe = (1+16)29 = 05862
Valoarea predictivă pozitivă = 1(1+5) = 01667
Valoarea predictivă negativă = 16(16+7) = 06957
Riscul relativ = 1(5+16)7(1+5) = 2142 = 050
Rata şansei = (1∙16)(7∙5) = 04571
Riscul atribuabil = 1(1+5)-7(7+16) = 01667-03043=-01376
Testarea asocierii icircn tabela de contingenţă
Testul χ2
Nu trebuie utilizat pentru eşantioane de volum mic
Testul este valid doar dacă valoarea expectată (aşteptată) pentru fiecare celulă este cel puţin
egală cu 1 şi frecvenţa absolută observată este de minim 5
Dacă aceste condiţii nu sunt icircndeplinite se aplică testul exact al lui Fisher (Fisherrsquos Exact Test)
Indică dacă cele două variabile sunt sau nu independente DAR NU cuantifică puterea asocierii
dintre ele
Problema S-a investigat icircntr-un studiu asocierea dintre obezitatea (ca factor de risc) şi bolile
cardio-vasculare la persoanele icircn etate (gt 60 ani) Din totalul de 620 persoane investigate s-au
identificat 150 persoane cu obezitate şi boală cardio-vasculară 230 persoane fără obezitate şi
fără boală cardio-vasculară şi 60 persoane fără obezitate dar cu boală cardio-vasculară Există
o asociere icircntre obezitate şi boala cardio-vasculară (df=1 α=005 χ2critic = 384)
Testul χ2 exemplu
H025
Nu există asociere icircntre obezitate şi bolile cardio-vasculare
Obezitatea şi bolile cardio-vasculare sunt independente
H1
Există asociere icircntre obezitate şi bolile cardio-vasculare
Obezitatea şi bolile cardio-vasculare sunt asociate
a = 005 pragul de semnificaţie al testului
urmează o lege cu (r-1)(c-1) grade de libertate
χ2 = parametrul testului χ2
fio = frecvenţa observată
fit = frecvenţa teoretică
Regiunea critică este [χα2 yen)
Pentru α = 005 χα2 = 384
OBSERVAT BCV+ BCV- Total
Obezitate + AP = 150 FP = 180 330
Obezitate - FN = 60 AN = 230 290
Total 210 410 620
TEORETIC BCV+ BCV- Total
Obezitate + = 330times210620 = 330times410620 330
Obezitate - = 290times210620 = 290times410620 290
Total 210 410 620
TEORETIC BCV+ BCV- Total
Obezitate + = 330times210620 = 330times410620 330
26
Obezitate - = 290times210620 = 290times410620 290
Total 210 410 620
TEORETIC BCV+ BCV-
Obezitate + = 112 = 218
Obezitate - = 98 = 192
Deoarece 4177Icirc[384 yen) se respinge H0 cu un risc de eroare de 5
Există asociere icircntre obezitate şi bolile cardio-vasculare
Testul Fisher
Corecţie a testului χ2
Valoarea p asociată parametrului ne dă probabilitatea ca valoarea observată de independenţă să fie
atribuită doar şansei
O valoare p mică indică că există alte cauze decacirct şansa influenţează rezultatul şi astfel cele două
variabile investigate nu sunt independente
Testul Fisher = dispersia corectată a factorului x dispersia corectată a factorilor reziduali
Icircn acest context regula adunării dispersiilor se poate scrie unde
este variaţia lui y pe seama variaţiei variabilei x
este variaţia lui y pe seama influenţei factorilor reziduali (neicircnregistraţi)
este variaţia totală a caracteristicii y
Testul Fisher empiric se calculează după formula
27
se compară cu Ftab pentru nx şi nz grade de libertate la un anumit prag de semnificaţie stabilit
Dacă Fc gt Ftab rezultă că variaţia factorului de grupare x este semnificativă pentru variaţia caracteristicii y
Testul z pentru proporţii
1 Compararea unei frecvenţe observate cu o frecvenţă teoretică
2 Testarea egalităţii a două frecvenţe
Testul z Compararea unei frecvenţe observate cu o frecvenţă teoretică
Scop Investigarea semnificaţiei diferenţei icircntre o frecvenţă teoretică p (icircntr-o populaţie) şi o frecvenţă
observată f pe un eşantion reprezentativ (variabilă calitativă (binare))
Condiţii de aplicare Testul este corect aplicat dacă numărul n al observaţiilor eşantionului este
suficient de mare (n∙p n∙(1-p)gt10
Parametrul
n = volumul eşantionului
Suntem interesaţi de investigarea prevalenţei hepatitei B la personalul care lucrează icircn laboratoarele
clinicilor de boli infecţioase din Transilvania Se ştie din studii anterioare că prevalenţa hepatitei B icircn
populaţia generală din Transilvania este de 9 S-a luat icircn studiu un eşantion de 100 persoane şi s-a
obţinut o prevalenţă a hepatitei B de 6 Există diferenţă semnificativă icircntre frecvenţa hepatitei B la
personalul care lucrează icircn laboratoarele spitalelor de boli infecţioase din Transilvania faţă de
populaţia generală
f = 006 p = 009 n = 100
Ipoteza nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat
faţă de frecvenţa hepatitei B icircn populaţia generală
Ipoteza alternativă test bilateral Există diferenţă semnificativă icircntre frecvenţa hepatitei B la
nivelul eşantionului şi prevalenţa hepatitei B icircn populaţia generală
f = 006 p = 009 n = 100
Pragul de semnificaţie a = 005
Regiunea critică test bilateral (-yen -196 ]Egrave[196 yen)
28
Concluzia testului
Deoarece parametrul statistic calculat al testului nu aparţine regiunii critice se acceptă ipoteza
nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat faţă de
frecvenţa hepatitei B icircn populaţia generală
Testul McNemar
Evaluarea dependenţei variabilelor calitative perechi (dorim să determinăm dacă o anumită
caracteristică este sau nu asociată cu o anumită patologie)
Identificăm n pacienţi care prezintă patologia de interes (eg Cancer bronho-pulmonar) şi n
pacienţi cu aceleaşi caracteristici ca şi primul grup dar care nu o prezintă
Martor = da Martor = nu
Caz = da a b
Caz = nu c d
Testul McNemar - exemplu fumat vs cancer
Martor = da Martor = nu
Cancer = da a = 2 b = 5
Cancer = nu c = 0 d = 3
29
χ2critic(α=005) = 384
32 lt 384 rarr acceptăm ipoteza nulă
Fumatul nu este icircn relaţie cu apariţia cancerului bronho-pulmonar
Inferenţa statistică pe date cantitative
Variabile cantitative continue
Testul z şi Student (t) (o medie sau medii perechi)
Testul z şi Student (t) (testarea a două medii)
ANOVA (ge 3 medii)
Ranguri (variabile cantitative discrete sau cantitative care nu icircndeplinesc condiţia de
normalitate)
Testul sumei rangurilor Wilcoxon
Kruskal-Wallis (ge 3 eşantioane independente)
Friedman (ge 3 eşantioane dependente)
Teste de normalitate variabile cantitative continue
Shapiro-Wilk
Kolmogorov-Smirnov
Shapiro-Wilk
Chi-Square Goodness-of-Fit
Dacă datele urmează o distribuţie normală aplicăm un test parametric
Dacă datele nu urmează o distribuţie normală aplicăm un test de comparare al rangurilor
30
Testul Z de comparare a mediei unui eşantion cu media unei populaţii
Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ
extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie
s2 care se cunoaşte
Condiţii de aplicare
1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru
compararea mediei unui eşantion cu media unei populaţii)
2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal
distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă
3 Talia eşantionului este mare ( ge 30)
Ipoteze
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media
eşantionului şi media populaţiei
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
(-yen -196 ] Egrave [196 yen)
Parametrul testului
n = volumul eşantionului
= media eşantionului
s = deviaţia standard a populaţiei
Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)
Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard
cunoscută
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi
media standard
Condiţii de aplicare
Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se
realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această
condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea
31
Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai
puternic
Numărul de grade de libertate (df) df = n-1
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
Parametrul testului
n = volumul eşantionului
micro0 = media standard
= media eşantionului
s = deviaţia standard a eşantionului
Testul ANOVA compararea mediilor a mai multe eşantioane
H0 = toate mediile sunt egale
H1 = nu toate mediile sunt egale
Condiţii de aplicare
1 Datele sunt independente unele faţă de celelalte
2 Datele fiecărui grup sunt normal distribuite
3 Deviaţia standard este aceeaşi pentru toate grupurile
Id Medicament
A B C D E F
1 5 6 7 10 5 9
2 6 8 8 11 8 8
3 7 7 9 13 6 7
4 8 9 11 12 4 5
32
5 9 10 10 9 7 6
Suma 35 40 45 55 30 35
Media 7 8 9 11 6 7
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =
= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)
Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2
F = (suma pătratelor(icircntre))(suma pătratelor(icircn))
Suma pătratelor (icircntre) = 16times5 = 80
Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60
Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn
interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare
SP df Media pătratelor F = MPicircntreMPicircn
Icircntre 80 5 = 805 = 16 = 1625 = 64
Icircn 60 24 = 6024 = 25
Total 140 29 -
Testul sumei rangurilor Wilcoxon
Aplicat pentru
Un set de observaţii provenite dintr-o valoare ipotetică comună
Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)
Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero
Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace
Suma rangurilor pentru diferenţele negative = 2+3+1 = 6
Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30
33
Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului
egal cu 8 = 0109
Icircnainte După Diferenţa Rang
64 66 -2 2
66 58 8 5
67 68 -1 3
71 65 6 4
72 75 -3 1
76 67 9 6
78 59 19 8
89 74 15 7
Testul Kruskal-Wallis (ge 3 eşantioane independente)
Test de ranguri aplicate pe mai mult de 3 eşantioane
H = parametrul testului
n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)
Tk = suma rangurilor
Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie
pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni
34
df = k-1 (k = numărul de eşantioane)
df = 3-1 = 2
Hcritic(α=005) = 599
H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie
pozitivă şi respectiv biopsie negativă
Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie
a tipului de studiu pe eşantioane perechi)
1 Definirea numărului de tratamente k
2 Obţinerea rangurilor pentru fiecare tratament
3 Sumarea rangurilor fiecărui tratament
4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)
5 Dacă Fr gt Frcritic rarr respingem H0
Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost
măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi
n = 9 k = 3 T12 = 225 T2
2 = 38025 T32 = 38025
Frcritic = 599
Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de
prostată
35
De reţinut
Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei
Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-
of-Fit
Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z
Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t
Compararea mediilor a 3 sau mai multe eşantioane ANOVA
Compararea mediilor a două populaţii (σ) testul Z
Compararea mediilor a două eşantioane (s) testul t
Compararea mediilor a două eşantioane perechi (s) testul t
ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi
cu cel pentru compararea a două eşantioane perechi
Ranguri
Distribuţia datelor nu are importanţă
Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)
Trei sau mai multe eşantioane Kruskal-Wallis
Trei sau mai multe eşantioane perechi Friedman
Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia
Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a
datelor)
Variabile nominale
Un singur eşantion sau eşantioane perechi
Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte
Eşantioane perechi testul Mc Nemar
Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2
Icircn analiza proporţiilor există teste diferite pentru
Compararea unei frecvenţe cu o frecvenţă cunoscută
Compararea a două frecvenţe
Semnificaţia statistică
Valoarea p (p value)
Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor
două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E
posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării
aleatorii
36
Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală
urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii
Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este
probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un
experiment de dimensiunea acestuia
Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că
diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii
diferite
Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca
fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă
ar fi fost adevărată
Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă
1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe
baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De
fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001
2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie
3 Se aplică testul statistic aferent pentru a calcula valoarea p
4 Se compară valoarea p cu valoarea ndash prag
5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe
semnificativă dpdv statisticrdquo
6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e
semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să
conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă
Teste de semnificaţie
Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului
populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)
Testarea ipotezelor implică posibile erori
Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile
sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui
grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul
icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005
ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există
37
nici o diferenţă
Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ
statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de
ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost
ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau
dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă
cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă
semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe
ipotetice variate icircn cazul icircn care ele există
Măsuri ale frecvenţei
Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)
Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate
Generic formula pe care se bazează toate cele trei este
unde x şi y sunt cantităţile de comparat
Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea
unei frecvenţe pe grupe de sex vacircrstă etc
Proporţia implică icircn mod necesar ca x să fie inclus icircn y
Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară
frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp
Pentru calcularea unei rate trebuie ţinut cont de trei aspecte
bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin
bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp
bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo
Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un
tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei
populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei
aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)
38
Indicatori
Rata de incidenţă
Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă
icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii
Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o
perioadă de timp
Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de
timp x
Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei
susceptibili de a dezvolta icircmbolnăvirea studiată
Numitorul poate fi
bull Numărul mediu al populaţiei icircn perioada de timp studiată
bull Mărimea populaţiei icircn mijlocul perioadei de studiu
bull Mărimea populaţiei la icircnceputul studiului
Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă
Este obligatorie menţionarea perioadei de timp
Prevalenţa
Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la
un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă
schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa
momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)
39
Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include
numai cazuri noi respectiv include cazuri noi şi vechi
Rata de atac
Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este
folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp
raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori
Rata persoană-timp
Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din
momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte
migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost
observate
Riscul relativ (RR)
Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment
legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele
prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două
grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la
bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la
bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai
mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo
Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2
Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn
cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă
(Tabelul 1)
Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR
Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la
neexpuşi
40
Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de
culegere a datelor
Odds ratio (OR)
Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin
raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general
studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)
Tabelul 2 Tabelul 2 x 2 pentru calcularea OR
Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală
Rate de mortalitate
Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp
specificată Există mai multe tipuri de rate de mortalitate
o Mortalitate specifică pe sex
o Mortalitate specifică pe rasă
o Mortalitate specifică pe boală
o Mortalitate neonatală
o Mortalitate postneonatală
o Mortalitate infantilă
o Mortalitate maternă
Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP
41
Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de
viaţă şi vacircrsta la care survine decesul dacă este prematur
Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu
Ani de viaţă pierduţi datorat dizabilităţii
Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt
utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru
cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite
grupuri
Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de
risc şi o boală se folosesc riscul relativ şi odds ratio
35 Analiza şi interpretarea datelor
După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date
trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul
Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor
colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului
studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu
plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde
prezenţa biostatisticianului este necesară
Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu
elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat
iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului
iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate
depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori
testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere
clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza
Interpretarea rezultatelor statistice
Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne
motive (număr mic de date) acceptarea ei să fie falsă
Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine
gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia
ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument
de decizie Intervalul de confidenţă
42
Interpretarea statistica ne interpretarea clinică
Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă
Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice
obţinute pe eşantionul studiat
Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare
Ce interpretăm Rezultatele
personale obţinute icircn urma studiului
care au fost prezentate icircn secţiunea bdquoRezultaterdquo
Explicăm rezultatele obţinute
Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale
Interpretarea trebuie să se realizeze icircn
lumina limitelor studiului
contextul cultural social şi educaţional al locului unde s-a realizat cercetarea
contextul a ceea ce se cunoaşte din literatura de specialitate
Interpretăm doar rezultatele personale obţinute icircn urma studiului
Interpretarea statistică nu este tot una cu interpretarea clinică
Interpretarea statistică este importantă
Interpretarea clinică este foarte importantă
Intervalul de confidenţă
Media calculată pe baza unui eşantion nu va echivala media populaţiei
Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului
Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a
populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a
populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)
pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru
orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare
dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de
confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de
date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de
5
Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel
Dacă valoarea p este mică
Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare
aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o
medie diferită Diferenţa este semnificativă dpdv statistic
43
Icircn continuare
Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa
reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică
pentru a fi interesante din punct de vedere ştiinţific
Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC
oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care
este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a
obţine o concluzie clară
Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o
diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că
datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din
punct de vedere ştiinţific
Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul
detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat
Erorile studiilor medicale
Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura
anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară
caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea
asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri
legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias
Erorile potenţiale icircn studiile epidemiologice
1 Erori icircntacircmplătoare
2 Erori sistematice
3 Confuzia
4 Validitatea
1 Erori icircntacircmplătoare
Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a
parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel
de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot
fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii
(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor
de măsură (eroarea de măsurare)
44
2 Erori sistematice
Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate
care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu
acurateţe mare Acurateţea nu este afectată de mărimea eşantionului
Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de
experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea
dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus
şi greu de cuantificat (consum de alcool personalitate etc)
Principalele tipuri de erori din această categorie sunt
bull Biasul de selecţie
bull Biasul de informaţie
Biasul de selecţie
Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul
trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion
inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale
persoanelor incluse
Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se
ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia
Biasul de informaţie
Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de
instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze
expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere
nesemnificativă sau chiar să nu şi-o amintească de loc
3 Confuzia
Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune
prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este
cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă
de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte
important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor
protector
4 Validitatea
Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă
Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte
estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional
Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă
45
conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se
demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)
Validitatea externă se poate realiza numai dacă studiul este valid intern
Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii
studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de
studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt
laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi
validă din punct de vedere intern)
3 6 Prezentarea rezultatelor
După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite
Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor
icircntr-o formă bdquodigerabilărdquo este necesară
Scopul prezentării datelor
1 Transmiterea concluziilor studiului
a Datele corecte şi importante merită comunicate
b Datele trebuie să confirme sau să infirme ipoteza studiului
c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală
2 Acordarea posibilităţii altor cercetători să aprecieze studiul
a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti
b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor
prezentate
Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru
fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie
statistică
Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de
valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras
(Tabel 3)
Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)
46
Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct
numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor
precum şi prezentarea acestora sub formă inteligibilă
Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care
convin cercetătorului
Prezentarea datelor se poate face
1 Figuri şi tabele icircn articole scrise
2 Figuri şi tabele icircn prezentări orale
3 Figuri şi tabele icircn postere
4 Text scris sau incluse icircn text
5 Site-uri de WEB
Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor
Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie
Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele
exprimacircnd exact ceea ce acestea exprimă
Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate
anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel
să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se
acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca
mai sus sugestive sunt formatele simple şi puţin icircncărcate
Dacă nu există reguli impuse se respectă
1 Mesaj simplu fără falsificarea datelor
2 De obicei este necesar atacirct tabelul cacirct şi graficul
3 Să fie simplu şi clar
Tabele
Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile
coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică
elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de
1 Se folosesc doar linii orizontale
2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn
evidenţi prin linie de separare (Tabelul 4)
Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland
Noua Zeelandă)
(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)
47
3 Numerele sunt aliniate icircn funcţie de virgulă
4 Indicii statistici sunt explicaţi sub tabel
5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană
6 Abrevierile pot fi folosite
7 Numărul de zecimale trebuie limitat la maxim două
8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel
9 Plasarea legendei este obligatorie sub tabel
10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)
Icircn cazul prezentărilor orale sau a posterelor este indicat ca
1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării
2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte
3 Folosirea de simboluri este permisă
Clasificarea tabelelor
Tabelele se clasifică după
i) conţinut
bull cu distribuţii de frecvenţe
bull de clase de frecvenţe
bull de contingenţă
ii) structura
bull cu doua coloane
bull cu subclasificări
bull ldquomasterrdquo
Tabele ce conţin distribuţii de frecvenţe
O modalitate comodă de a prezenta o mulţime de date brute este
1 Se ordonează datele in ordine crescătoare
2 Se determine frecvenţa fiecărei valori
3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane
(Tabelul 5)
Tabelul 5 Distribuţii de frecvenţă absolută
48
Tabelul claselor de frecvenţe
1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă
2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)
Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)
Tabele de contingenţă
1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a
tabelelor de contingenţă
2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a
combinaţiilor de perechi ordonate de valori
3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre
a factor de risc si
b starea sănătăţii
4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)
5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)
Tabelul 7 Tabel de contingenţă 2 x 2
49
Grafice
Există două categorii de moduri grafice sub care se pot prezenta datele
1 Ilustraţii şi fotografii
2 Grafice
1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă
pentru lucrare
2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit
Putem vorbi despre mai multe tipuri de grafice
bull Grafice pentru reprezentarea datelor cantitative
1048707 Grafic cartezian (X Y)
1048707 Histograma
1048707 Poligonul de frecvenţe
1048707 Diagrama bdquoscatterrdquo
bull Grafice pentru reprezentarea datelor calitative
1048707 Grafic cu bare
1048707 Diagrama tip bdquoboxplotrdquo
1048707 Diagrama bdquopierdquo
1048707 Cartograma
Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi
dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)
Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)
Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie
Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)
Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)
50
Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir
de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele
două variabile studiate (Figura 6)
Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2
(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2
rămacircne aproximativ constantă)
Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea
comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea
comparativă a mai multor variabile
Figura 7 Grafic calitativ cu bare
51
Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo
Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două
posibilităţi reprezentate grafic este mai frecventă (Figura 8)
Figura 8 Reprezentare tip bdquopierdquo
Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli
sau a oricărui element comparativ Se foloseşte de epidemiologi
Rezultate
Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare
Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o
manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu
explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția
bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la
ilustraţii tabele grafice
Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi
nici rezultatele care invalidează eventual ipoteza
Discuţii
Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd
cultura ştiinţifică şi inteligenţa autorilor
Acest capitol răspunde la trei obiective
Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia
calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de
selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează
rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv
52
este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn
care a fost abordată problema fără a face o revistă a literaturii
Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea
rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul
Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor
afirmaţii nesusţinute de conţinutul lucrării
Concluzii
Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate
să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie
Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de
concluzii va scădea valoarea lucrării
Bibliografia (lista referinţelor citarea icircn text)
Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn
lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente
Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli
- să conţină cele mai importante şi recente lucrări
- să includă numai lucrări publicate
- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate
Bibliografie
Elisabeta Jaba ndash Statistică Ed Economică 1998
Mihai Ţarcă ndash Statistică volI Ed UAIC 1979
Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale
Ed University Press 2009
Sorana Daniela Bolboacă ndash Metodologia cercetării curs
53
2 Elaborarea protocolului
3 Culegerea informaţiilor (datelor)
4 Prelucrarea datelor
5 Analiza şi interpretarea rezultatelor
6 Prezentarea rezultatelor
7 Redactarea studiului
3 Etapele unui studiu de cercetare
31 Pregătirea studiului de cercetare
Pregătirea studiului de cercetare comportă mai multe sub-etape
bull Documentarea bibliografică
bull Definirea fenomenului
bull Formularea temei de cercetare
bull Aspecte manageriale
Documentarea bibliografică
Cercetarea bibliografică are misiunea de a realiza un compromis icircntre excesul de documente (anual se
publică icircn icircntreaga lume peste 20000 de reviste cu caracter medical) şi pierderea de informaţii pertinente
Cercetarea bibliografică necesită o selectare şi o evaluare a literaturii de specialitate pe o anumită problemă şi
se realizează prin parcurgerea a trei etape
a) Prima etapă este cercetarea bibliografică propriu-zisă adică identificarea publicaţiilor care se referă la
subiectul icircn discuţie
Etapele documentării bibliografice sunt
bull Definirea şi delimitarea precisă a subiectului de cercetat
bull Stabilirea unei liste de bdquocuvinte cheierdquo prin lectura referinţelor bibliografice
bull Traducerea icircn limbi de circulaţie internaţională
bull Stabilirea unei liste cu documentele de cercetat
bull Consultarea unor tratate sau cărţi de referinţă
bull Consultarea publicaţiilor primare
bull Redactarea fişelor bibliografice şi aranjarea lor icircn ordine alfabetică
bull Introducerea referinţelor bibliografice icircn textul propriu-zis
Literatura primară de specialitate
Reprezintă toate materialele scrise care conţin studii originale
Articole ştiinţifice Au calitatea esenţială că informaţiile publicate sunt recente intervalul de timp scurs de la
scriere la publicare fiind icircn general foarte scurt
4
Teze de doctorat licenţă Se pot găsi icircn bibliotecile instituţiilor de icircnvăţămacircnt superior Sunt utile pentru că
icircn general tratează pe larg o anumită problemă care poate fi de interes avacircnd şi o bibliografie recentă
Brevete şi mărci Sunt acele sisteme de protecţie a produselor şi tehnologiilor Sunt utile icircn general icircn
cercetarea experimentală
Literatura secundară de specialitate
Tratate de specialitate Sunt foarte importante icircn faza incipieintă a unui studiu pentru aprofundarea problemei
de cercetat Informaţiile prezente icircn astfel de publicaţii sunt ordonate cu noţiuni de bază definiţii teorii
posibile etc
Cărţi de referinţă Sunt monografii care studiază pe larg un fenomen putacircnd fi foarte utile atacirct cercetătorilor
debutanţi cacirct şi celor iniţiaţi
Literatura terţiară de specialitate este reprezentată de indexuri reviste cu extrase de articole şi rezumate
Cercetarea bibliografică bdquoon-linerdquo permite accesul la nenumărate surse de informare utilizacircnd icircn acest scop
motoare de căutare
b) A doua etapă este lectura critică activă a publicaţiilor selectate pentru a judeca valoarea publicaţiilor
indiferent dacă este vorba de calitatea cercetării sau de pertinenţa rezultatelor publicate
Evaluarea corectă critică a unui articol va permite cititorului să aprecieze dacă publicaţia este credibilă
rezultatele corespund realităţii (validitatea internă) respectiv dacă informaţiile conţinute icircn publicaţie sunt
aplicabile icircn practica medicală dacă se pot generaliza dacă sunt aplicabile icircn proiectul de cercetare al
viitorului investigator (validitatea externă)
Lectura critică a literaturii medicale se bazează pe folosirea unei grile de lectură care are meritul de a putea fi
aplicată tuturor tipurilor de publicaţii Această grilă are 8 criterii de evaluare pentru fiecare criteriu trebuie să
se răspundă la următoarele icircntrebări
bull este posibil să se găsească icircn articol informaţia pentru criteriul icircn cauză
bull dacă criteriul abordat este corect
bull dacă criteriul este incorect icircn ce măsură ameninţă validitatea studiului
Cele 8 criterii de evaluare sunt
1 Obiectivul vizează următoarele preocupări medicale
bull istoria naturală a unei boli evoluţia şi prognosticul ei
bull performanţa unui test diagnostic
bull impactul unei intervenţii (terapeutice de depistare de prevenţie sau de educaţie)
Lectura critică va aşeza articolul icircn una din aceste situaţii apoi icircn raport cu obiectivul va stabili dacă are
ipoteze de verificat
5
2 Tipul de studiu Cititorul trebuie să recunoască planul de studiul pentru a verifica dacă tipul de studiu este
adaptat icircntrebării puse Va merge progresiv cu urmărirea de la raportul de caz-seria de cazuri la studiul
transversal studiul caz-control studiul de cohortă şi trialul controlat
3 Factorii studiaţi (variabila independentă) pot fi factori de expunere sau de intervenţie Cititorul trebuie să
poată recunoaşte factorul să aprecieze cum a fost măsurat dacă s-a folosit aceeaşi metodă de măsurare pentru
loturile icircn studiu ce metodă de comparaţie s-a folosit dacă sunt erori (factor de confuzie)
4 Criteriul de raţionament este evenimentul sau situaţia presupusă a fi rezultatul factorului studiat boala
decesul supravieţuirea complicaţiile etc Definirea precisă şi metoda de măsurare a rezultatului expunerii va
permite cititorului să aprecieze validitatea informaţiilor
5 Populaţia studiată (eşantionul) Se va urmări dacă este definită populaţia de referinţă şi populaţia de
studiat analizacircndu-se corectitudinea selecţiei randomizarea proporţia de subiecţi la sfacircrşitul studiului
validitatea externă a rezultatelor
6 Analiza datelor Cititorul trebuie să aprecieze dacă s-au examinat toate erorile inclusiv factorul de confuzie
dacă nu validitatea studiului ar putea fi compromisă
7 Rezultatele Principalele aspecte pe care cititorul le va urmări la acest capitol sunt dacă ele se datoresc
numai şansei dacă s-a făcut calculul statistic dacă s-a apreciat relaţia expunere-efect (RR OR RA) dacă a
fost apreciată semnificaţia clinică sau biologică care nu este identică cu semnificaţia statistică
8 Sinteza lecturii critice analizează concluziile autorilor dacă ele răspund icircntrebărilor formulate la icircnceputul
studiului dacă rezultatele sunt aplicabile la populaţia studiată dacă rezultatele sunt acceptabile pentru practica
proprie a cititorului dacă rezultatele justifică vreo schimbare icircn practica clinică respectiv vor ameliora starea
pacienţilor Această abordare cere cititorului cunoaşterea noţiunilor de bază icircn metodologia cercetării
ştiinţifice fiind vorba icircn acelaşi timp şi de un demers clinic
c) A treia etapă icircn cercetarea bibliografică constă icircn combinarea datelor din mai multe studii referitoare la
acelaşi subiect şi care se realizează prin meta-analiză Tehnica meta-analizei permite să se sporească
eficacitatea testării ipotezelor să crească forţa statistică a rezultatelor şi să se obţină informaţii care nu pot fi
convenabil extrase din fiecare cercetare
Definirea fenomenului
Definirea fenomenului se bazează pe
bull Cunoaşterea prealabilă a problemei prin documentare riguroasă documentare care poate justifica pertinenţa
temei propuse (revista literaturii de specialitate)
Icircn prima etapă se cercetează bibliografia propriu-zisă adică se identifică publicaţiile care se referă la subiectul
icircn discuţie apoi se vor selecta publicaţiile necesare studiului apreciind validitatea lor (problemele de
documentare bibliografică vor constitui un capitol separat)
bull Formularea unei ipoteze ştiinţifice sub-etapă care reprezintă fondul problemei
6
Ipoteza este o afirmaţie (nu o icircntrebare) despre o posibilă relaţie icircntre factorii studiaţi şi criteriile de
raţionament Ipoteza poate fi ipoteză ldquonulărdquo - nu există această relaţie şi ldquoalternativărdquo - există relaţia Ipoteza
va trebui apoi dovedită sau respinsă testul statistic calculează probabilitatea conform căreia asociaţia observată
este reală sau ea survine din icircntacircmplare
bull Motivarea organizării studiului Trebuie făcută o motivare corectă legată de inexistenţa unor studii
referitoare la problema pe care o va dezbate studiul
Formularea temei de studiu
Pentru formularea temei de studiu trebuiesc menţionate obiectivul sau obiectivele şi tipul de studiu ales pentru
cercetarea respectivă Există icircn general patru tipuri de obiective
bull obiective care se referă la evoluţia şi prognosticul unei icircmbolnăviri obiective prin care se icircncearcă
icircnţelegerea şi cunoaşterea unor evenimente ce pot să apară la un pacient pe parcursul bolii
bull obiective care se referă la etiologia bolii (cauze de natură bacteriană virală parazitară) sau la cauzalitate
(relaţia factor de risc-boală)
bull obiective legate de performanţa unor teste de diagnostic sau de screening de evaluare a strategiei de
diagnostic sau de interpretare a unui test
bull obiective care se referă la impactul unei intervenţii evaluarea unei intervenţii terapeutice de depistare a unor
boli de prevenţie de educare pentru sănătate
Obiectivele unui studiu se icircmpart icircn obiectivul major unul din cele patru enumerate şi obiective
secundare care pot aborda şi alte fenomene biologice decacirct cel major cu condiţia să nu altereze realizarea
acestuia Alegerea tipului de studiu este stracircns legată de obiectivul ales Dacă obiectivul este descrierea
distribuţiei caracteristicilor unei populaţii aprecierea frecvenţei unui fenomen de sănătate analiza acelui
fenomen icircn funcţie de timp loc persoană se va alege un studiu epidemiologic descriptiv studiu care nu are o
ipoteză fixată anterior O ipoteză se poate formula ca rezultat al studiului descriptiv dar nu se va face
verificarea ei icircn cadrul studiului Dacă intenţia studiului este de a emite o judecată asupra unei posibile relaţii
icircntre factorii studiaţi atunci problema de cercetat este fundamentată de o ipoteză care trebuie verificată
dovedită iar studiul care realizează acest lucru respectiv limitele studiilor utilizate
Aspectele manageriale
Aspectele manageriale includ
bull justificarea bugetului estimarea sumei necesară realizării studiului și apreciarea durate studiului
bull defalcarea bugetului pe necesități legate de achziționare de aparatură reactanți truse etc pentru personal
(munca depusă pregătire deplasări icircn teren participări la congrese sau conferințe documentare) materiale
consumabile etc
7
32 Elaborarea proiectului
Protocolul de cercetare este un document care emite obiectivul și ipoteza studiului definește condițiile de
desfășurare și realizare a viitorului studiu clinic Elaborarea protocolului este importantă pentru cercetătorii
participanţi la studiu comisiile de etică şi finanţatori
Protocolul include mai multe formulare care trebuie să cuprindă
a) Titlul proiectului
b) Sumarul proiectului
c) Descrierea proiectului
d) Normele deontologice de cercetare
e) Modalitățile de diseminarea și valorificarea rezultatelor
f) Perspective de continuare a cercetării
g) Anexe
Prezentarea proiectului va include următoarele fișiere
bull resursele umane (membrii echipei afilierea acestora)
bull relevanța temei pentru dezvoltarea cunoașterii icircn domeniu
bull stadiul actual al cunoașterii și bibliografia aferentă
bull justificarea studiului
bull enunțarea obiectivelor și ipoteza de lucru
bull metodologia propriu-zisă
Referitor la metodologia utilizată vor trebui menționate
bull factorulfactorii studiați care reprezintă variabila independentă respectiv dacă este cazul modalitățile de
măsurare
bull criteriile de raționament- variabila dependentă (situația sau evenimentul ce se presupune a fi rezultatul
factorului studiat cum ar fi boala handicapul complicații decesul)
bull tipul de studiu care se va aplica icircmpreună cu design-ul acestuia
bull eșantioanele de lucru și modalitățile de eșantionaj
bull metodele de culegere și de prelucrare a datelor
bull planificarea activităților
bull structura bugetului fiind eligibile următoarele categorii de cheltuieli de capital (echipamente software
upgrading) pentru personal (full sau part-time instruire asigurări de sănătate) de informare (documentare
abonamente) mobilități (vizite la alte unități de cercetare participări la
congrese) materiale consumabile (truse reactanți papetărie) valorificare a rezultatelor (lucrări științifice de
etapă sau lucrarea finală) cheltuieli indirecte (de regie)
bull modalităţile de valorificare a rezultatelor
bull legături de alte proiecte
8
Protocolul mai conține anexe curriculum vitae al investigatorului principal și al coinvestigatorilor
calendarul activităților avizul Comisiei de etică documente speciale și
consimțămacircntul informat icircn cazul studiilor pe subiecți umani
Icircnainte de implementare protocolul va fi verificat de experți pentru eligibilitate (dacă sunt icircndeplinite
condițiile de acceptare finanțare) calitate și pertinență icircn sensul că protocolul trebuie să fie clar exprimat
corect icircntocmit bine așezat și cu repercursiuni favorabile pentru viitor
33 Culegerea informaţiei
Pentru a realiza o cercetare medicală culegerea datelor este prima etapă şi realizează icircn funcţie de
obiectivele propuse tipul studiului timpul disponibil şi resurse umane şi financiare
Există două mari posibilităţi de culegere
bull Icircn funcţie de elementele studiate
o Culegerea exaustivă Toţi subiecţii populaţiei pe care dorim să o studiem Greu de realizat din cauza
costurilor foarte mari sau a alterării populaţiei de studiu
o Prin eşantionare Este metoda folosită icircn studii medicale
bull Icircn funcţie de durata culegerii
o Transversală Se studiază un grup la un moment dat
o Longitudinală Extinsă in timp
- Retrospectivă ndash icircnregistrări medicale
- Prospectivă ndash date culese la intervale prestabilite de timp
Populaţia ţintă
Este orice colectivitate icircntreagă de oameni animale plante sau obiecte de la care putem colecta date Populaţia
ţintă este icircntregul grup care ne interesează pe care dorim să-l descriem sau să tragem concluzii despre el
Pentru a putea realiza generalizări spre populaţia ţintă deseori suntem obligaţi să folosim un eşantion (selecţie)
care icircnsă trebuie să fie reprezentativ pentru populaţia pe care vrem să o studiem Pentru fiecare populaţie de
studiu sunt posibile mai multe eşantioane Pe baza acestor eşantioane se calculează un estimator Pe baza
acestui estimator calculat care poate fi medie aritmetică procent etc se pot trage concluzii despre icircntreaga
populaţie Este foarte important ca investigatorul să definească foarte atent şi complet populaţia icircnainte de a
realiza eşantionul inclusiv descrierea criteriilor de includere şi excludere icircn populaţia de studiu
Eşantionul
Un eşantion este practic un grup de elemente selectate dintr-un grup mai extins (populaţia ţintă) Studiind
eşantionul selectat se pot trage concluzii despre grupul de unde a fost ales (populaţia ţintă)
Este icircn general ales pentru studiu pentru că
bull Populaţia ţintă este prea mare şi nu poate fi studiată ca icircntreg
bull Nu avem acces din diverse motive decacirct la parte din populaţia de studiu
9
bull Un studiu pe icircntreaga populaţie poate distruge populaţia
bull Eşantioanele pot fi studiate mai rapid
bull Costul şi resursele necesare studiului sunt mai reduse
Numărul elementelor dintr-un eşantion se numeşte talia sau volumul selecţiei
Acesta fiind icircn general mai mic decacirct icircntreaga populaţie poate fi observat icircn detaliu iar dacă este reprezentativ
se pot afla prin intermediul său proprietăţile populaţiei ţintă
Eşantionul trebuie să fie reprezentativ pentru populaţia generală De aceea dintre metodele de eşantionare se
folosesc tehnicile de randomizare Trebuie să satisfacă două condiţii principale
bull condiţie de ordin cantitativ talia să fie suficient de mare
bull condiţie de ordin calitativ trebuie extras aleator din populaţia ţintă
Metode de eşantionare
Putem vorbi icircn linii mari de două posibilităţi de eşantionare prin metode probabilistice şi prin metode
nonprobabilistice
Eşantionarea probabilistică este metoda cea mai folosită icircn studiile medicale fiind şi cea indicată pentru a
realiza reprezentativitatea calitativă
Icircn medicină se folosesc patru tipuri de eşantionări
1 Simplu randomizat
2 Sistematic
3 Stratificat
4 Cluster (icircn cuiburi)
1 Eşantionul simplu randomizat Fiecare element din populaţia ţintă are o şansă egală non zero de a fi
inclus icircn eşantion Se ia la icircntacircmplare un număr de elemente egal cu talia eşantionului Dezavantajul acestui tip
de eşantionare este că presupune cunoaşterea icircntregii populaţii ţintă
2 Eşantionul sistematic După aflarea taliei eşantionului şi a populaţiei ţintă se calculează factorul de
eşantionare k icircmpărţind talia populaţiei ţintă la volumul eşantionului Apoi fiecare al k-lea element este
selectat spre includere
Acelaşi mare dezavantaj apare şi icircn acest caz fiind obligatorie cunoaşterea icircntregii populaţii de studiu
3 Eşantionul stratificat Există icircn cele mai multe cazuri probleme medicale care studiindu-se pe eşantion
prezintă variabilităţi icircn funcţie de caracteristicile populaţiei (sex vacircrstă nivel de pregătire etc) Icircn acest caz
este obligatorie realizarea similitudinii demografice a eşantionului cu populaţia de studiu Din date provenite
de la Centrul de Statistică putem dezvolta ca procente o structură a populaţiei Această structură trebuie să se
regăsească (procentual) şi icircntre membrii eşantionului O importantă şansă ca reprezentativitatea calitativă să fie
corectă este conferită de respectarea
acestei similitudini demografice
10
4 Eşantionul bdquoclusterrdquo sau icircn cuiburi Icircn cazul unui studiu amplu cu scop de a investiga populaţia unei
icircntregi ţări sau regiuni putem ajunge icircn imposibilitatea de a alege şi mai ales investiga indivizi răspacircndiţi prin
icircntreaga zonă Din acest motiv se desemnează la icircntacircmplare un număr calculabil de
grupuri populaţionale extinse icircn toată zona de studiu Aceste grupuri poartă numele de bdquocuiburirdquo La nivelul
fiecărui bdquocuibrdquo se aplică o tehnică precedentă de selecţie a cazurilor Se poate sau de cele mai multe ori se face
la nivel de bdquocuibrdquo stratificarea iar apoi selecţia propriu-zisă se realizează sistematic sau simplu randomizat
Este metoda de eşantionare cel mai frecvent utilizată icircn cercetarea medicală de amploare Pentru ca eventualele
erori să nu se poată strecura s-a definit şi un indice DEF (design effect) cu care trebuie multiplicată talia
selecţiei care pentru eşantionarea icircn bdquocuiburirdquo este egal cu 2 astfel putem obţine şi o reprezentativitate
calitativă dar şi una cantitativă
Eşantionarea nonprobabilistică este o metodă neindicată icircn studiile medicale datorită lipsei de forţă icircn ceea ce
priveşte posibilitatea de aplicare a concluziilor asupra populaţiei de studiu
Se definesc şi icircn acest caz patru metode
1 Eşantion de convenienţă Membrii unui astfel de eşantion sunt aleşi numai pentru că sunt la icircndemacircnă
disponibili de a răspunde le un eventual chestionar
2 Eşantion pe cote Similar cu tipul de eşantion stratificat se referă la faptul că selecţia se face formacircnd
eşantionul din primele 30 de persoane care respectă un criteriu impus
3 Eşantion cu un scop Elementele incluse icircn eşantion sunt alese după un criteriu care exclude din start marea
majoritate a populaţiei
4 Eşantion raţional Selecţia se face prin prisma unui raţionament al celui care conduce studiul
Parametru şi estimator
Parametrul este o valoare de obicei necunoscută (şi care trebuie să fie estimată prin studiu) folosită pentru a
reprezenta o anumită caracteristică a populaţiei de studiu De exemplu media populaţiei (icircnălţime) este un
parametru populaţional Raportat la o populaţie parametrul este o valoare fixă şi exactă care nu variază
Fiecare eşantion extras din populaţie va indica o valoare a mediei care nu poate decacirct să estimeze parametrul
Icircn general parametrii sunt notaţi cu litere greceşti (ex Media = μ)
Estimatorul este o valoare calculată dintr-un eşantion studiat Este folosit pentru a putea aprecia parametrul
populaţional pe care icircn căutăm Este de asemenea posibil ca dintr-o populaţie să formăm mai multe eşantioane
mediile lor de cele mai multe ori nefiind identice icircntre ele şi nici identice cu media populaţiei Estimatorii
sunt notaţi cu litere latine (ex Media = μ)
Dacă valoarea mediei calculată pe eşantion este de exemplu 168 cm atunci putem estima ca valoarea mediei
icircn populaţie este 168 cm
11
Tipuri de culegere a datelor
1 Culegere de tip eşantion reprezentativ Grupul de indivizi incluşi icircn studiu sunt reprezentativi (calitativ şi
cantitativ) pentru populaţia generală Poate fi utilizat pentru studii descriptive (cel mai frecvent) dar uneori şi
pentru studii analitice
Este necesar pentru acest tip de culegere a datelor ca iniţial să fie cunoscută talia eşantionului (calculabilă icircn
funcţie de prevalenţă şi precizie) Pentru evaluarea datelor culese se utilizează tabelul de contingenţă 2 x 2
astfel (Figura 1)
Figura 1 - Tabelul de contingenţă 2 x 2
Unde
a ndash persoane expuse unui factor de risc care au boala studiată
b ndash persoane expuse unui factor de risc care nu au boala studiată
c - persoane neexpuse unui factor de risc care au boala studiată
d - persoane neexpuse unui factor de risc care nu au boala studiată
După aranjarea datelor icircn tabelul de contingenţă (2 x 2) se poate icircncepe analiza statistică a datelor atacirct ca
procente calculabile cacirct şi din punct de vedere a aplicării de teste statistice pentru elucidarea semnificaţiei
statistice
Este posibilă din acest tip de culegere de date calcularea
1 Prevalenţei unei boli
2 Frecvenţei expunerii
3 Gradul de asociere icircntre factorul eventual de risc şi boala
2 Culegerea de tip expus ndash neexpus Icircmparte subiecţii icircn două categorii expuşi sau neexpuşi factorului de risc
studiat Ca evoluţie următoare a studiului după o astfel de culegere a datelor se poate evalua icircn timp apariţia
icircmbolnăvirii despre care se efectuează studiul Icircn timp longitudinal prospectiv se poate calcula dacă factorul
studiat reprezintă un risc de icircmbolnăvire este indiferent sau chiar este cu efect protectiv Numărul subiecţilor
din cele două grupuri poate fi egal sau poate fi diferit Numărul acestora poate fi calculat icircn vederea obţinerii
unei bune reprezentativităţi cu ajutorul formulelor de selecţie Avacircnd icircn vedere calitatea longitudinală a
12
studiului este important ca numărul ales să fie mai mare pentru a putea suplinii eventualele pierderi din
urmărire Practic rezultatele sunt introduse icircn tabelul 2 x 2 de unde se pot calcula indicatorii doriţi (Figura 2)
Avacircnd icircn vedere modul de culegere a datelor este permisă calcularea de indicatori numai pe orizontală
orice comparare icircntre coloana dreaptă şi stacircngă fiind incorectă Avantajul acestui tip de culegere a datelor ar fi
eventualul număr mai redus de subiecţi dar dezavantajul major este cel al costurilor de urmărire icircn timp dar
trebuie luată icircn calcul şi pierderea de subiecţi din evidenţe Factorul controlat este deci prezenţa expunerii iar
factorul aleator este prezenţa bolii
Figura 2 Tabelul de contingenţă pentru tipul de culegere expus ndash neexpus
4 Culegerea de tip caz ndash martor Icircn acest caz ceea ce ghidează colectarea datelor este prezenţa sau absenţa
bolii icircn momentul prezent Se vor culege date de la două loturi constituite după criteriul de bolnav B+ şi de fără
boală B+ Datele culese sunt icircn trecut deci caracterul datelor va fi retrospectiv Icircn acest caz factorul controlat
este boala factorul aleator fiind expunerea (Figura 3)
Calculul de indicatori icircn acest caz se va putea efectua numai icircntre coloane orice calcul icircntre valorile de pe linii
fiind greşit Rezultate semnificative se pot obţine icircn acest caz utilizacircnd loturi mai mici de studiu prin
comparaţie cu tipul eşantion reprezentativ permiţacircnd icircn acelaşi timp studiul bolilor rare (cu prevalenţă mică)
Figura 3 Tabelul de contingenţă pentru tipul de culegere caz ndash martor
Metode de culegere a datelor
Metoda aleasă pentru culegerea datelor trebuie să fie aleasă după un atent studiu bibliografic icircn vederea
stabilirii celui mai eficient mod de a răspunde temei de studiu
Metodele de culegere trebuie să fie bine aplicabile şi consistente ca aport informaţional necesar
13
1 Fiziologice Sunt colectate date despre anumite caracteristici fiziologice ale pacienţilor (TA glicemie
colesterol etc) Această metodă aduce rezultate obiective cacirct timp instrumentul de evaluare este bine calibrat
şi prezintă variaţii mici
2 Metode observaţionale Instrumentul de culegere a datelor trebuie să fie sincronizat cu protocolul conceput
de cercetător Datele culese trebuie să fie de asemenea consistente adică să fie colectate de aceeaşi manieră
conducătorul studiului trebuind să instruiască investigatorii (colectorii de date) Icircnregistrarea datelor trebuie să
fie de asemenea sistematică şi bine standardizată Observaţii de control trebuie icircn mod obligatoriu făcute
pentru a putea aprecia icircn mod corect orice deviere datorată unor factorii externi Este obligatorie luarea icircn
consideraţie a aspectelor etice
3 Interviul Poate fi structurat cu un set specific de icircntrebări sau nestructurat cu o temă generală cu care se
icircncepe interviul Interviurile pot fi icircnregistrate sau intervievatorul poate nota pur şi simplu răspunsurile Există
două tipuri generice de interviu interviul de profunzime care se referă la o discuţie icircn general structurată cu
un număr de icircntrebări prestabilite icircn icircncăperea de studiu fiind doară intervievatorul şi persoana chestionată şi
interviul de grup unde prin conversaţii pornind de la temă generală expusă şi condusă de intervievator se
obţin date despre subiecţii participanţi la studiu Ambele metode de interviu au indicaţiile lor precise Un
interviu pe teme intime nu va putea fi corect icircn ceea ce priveşte datele colectate dacă se aplică un interviu de
grup
4 Chestionarul Document scris adresat unor persoane pentru a răspunde la una sau mai multe icircntrebări
Trebuie să aducă răspunsurile la icircntrebările care motivează studiul constituind ansamblul icircntrebărilor destinate
culegerii de informaţii (date) Redactarea chestionarului trebuie să ţină cont de structura acestuia introducere
conţinut exprimarea icircntrebărilor grafica chestionarului
5 Icircnregistrări preexistente
Icircn cercetarea medicală sunt cel mai frecvent utilizate Informaţiile dorite sunt deja existente ceea ce icirci revine
cercetătorului este ca să structureze datele icircn funcţie de scopul studiului pe care icircn conduce Aceste surse sunt
bull Foi de observaţie
bull Registre de consultaţie
bull Buletine de analize
bull Registre de operaţii
Icircn cazul icircn care nici o metodă de culegere a datelor nu este pe placul celui ce conduce studiul există
posibilitatea de a construi un instrument nou de culegere a datelor
Acest proces trebuie să urmărească nişte paşi obligatorii fiind mare consumator de timp
bull Definirea structurii cu care se va face măsurarea
bull Formularea itemilor de măsură
bull Analiza validităţii instrumentului de măsură ndash măsoară acesta fenomenul corect
bull Elaborarea de instrucţiuni de utilizare pentru investigatori
14
bull Pretestarea instrumentului
bull Aprecierea validităţii interne şi externe a datelor culese
Instrumente de cercetare
Formularea clară a temei de cercetare necesită o foarte bună definire a factorilor studiaţi şi a criteriilor de
judecată Acestea din urmă sunt ultimele care vor trebui definite icircn cadrul protocolului de studiu
Alegerea unui instrument de măsură
Nu există un instrument de măsură perfect sau universal corect Alegerea sa dintre cele existente şi cele deja
utilizate depind de trei factori
bull Obiectivul studiului
bull Boala studiată
bull Populaţia icircn studiu
De aceste trei elemente trebuie ţinut cont icircn fiecare etapă a dezvoltării instrumentului
Definirea obiectivului
Studiu transversal Dacă se doreşte studierea unui simptom sau a unei caracteristici ale populaţiei se poate
icircmpărţi populaţia de studiu icircn mai multe grupuri Este practic vorba de a determina diferenţele dintre subiecţi
icircn cea ce priveşte o variabilă necesară studiată printr-un studiu transversal (utilizarea dozării de Ac HBS
pentru a evalua progresele bolnavilor de hepatită tip B)
Studiu longitudinal Icircn acest caz nu se poate icircmpărţii populaţia de studiu icircn mai multe grupuri datele obţinute
fiind de la acelaşi subiect colectate după un interval de timp
Icircn funcţie de boală şi populaţie se aleg şi instrumentele de măsură cele mai adecvate
Instrumentele cercetării reprezintă un mecanism specific sau o strategie pe care cercetătorul o utilizează pentru
colectarea prelucrarea şi inferenţa datelor Aceste instrumente sunt
1 Studiul icircn bibliotecă
2 Computerul
3 Determinările experimentale
4 Statistica
5 Mintea umană
6 Facilităţi de limbaj şi comunicare
Determinările experimentale
Măsurarea constă icircn aprecierea şi cuantificarea fenomenelor calitativ sau cantitativ Interpretarea
datelor se referă la transformarea lor icircn unităţi de descoperire a unor fenomene mai puţin cercetate
Standardele acceptate se referă la norme medii distribuţii etc Tot icircn cadrul interpretării datelor datele
obţinute sunt caracterizate pe scale de valori nominal ordinal de interval sau de raport
Validarea şi reproductibilitatea măsurătorilor sunt aspecte importante şi foarte necesare pentru o
cercetare corect fundamentată care doreşte obţinerea unor concluzii pertinente
15
Statistica Este implicată icircn condensarea şi procesarea unui volum mai mare de date astfel icircncacirct să se poată
interpreta corect valorile obţinute şi să se permită comparările Utilizarea unor teste statistice specifice permite
determinarea semnificaţiei (diferenţei) statistice astfel icircncacirct estimatorii să poată fi aplicaţi la populaţia
generală Furnizează informaţii şi privind corelarea sau relaţionarea icircntre date
Mintea umană este cea care reuşeşte să integreze şi să icircnţeleagă rezultatele obţinute Semnificaţia ştiinţifică
este stabilită icircn funcţie de rezultatele statisticii de mintea umană conform afirmaţiei bdquosemnificaţia ştiinţifică
nu este egală cu semnificaţia statisticărdquo Metodele aplicate pentru a putea ajunge la o concluzie pertinentă sunt
logica deductivă raţionamentul inductiv şi gacircndirea critică
Limbaj şi comunicare Exprimarea orală sau icircn scris permite nuanţarea unor aspecte seci cifrice ale unor
studii Icircn acest mod devine mai evidentă semnificaţia ştiinţifică a unor rezultate statistice
34 Prelucrarea datelor
Instrumentele de prelucrare
Statistica este o ştiinţă ramură a matematicii care studiază evoluţia fenomenelor şi proceselor
colective pe baza observării lor ştiinţifice a culegerii şi prelucrării detaliate a informaţiilor statistice cu scopul
de a formula şi explica legile legităţile şi regularităţile ce le guvernează
Statistica permite deci aprecierea unor parametrii populaţionali prin studiul unui număr redus de
elemente ale populaţiei icircn studiu (ţintă) O populaţie poate fi definită printr-un şir de valori care pot fi grupate
icircn funcţie de parametrul studiat (glicemie colesterol TAD TAS etc) Pentru fiecare astfel de şir se defineşte
o variabilă (care va purta nume propriu glicemie colesterol etc) Practic variabila este considerată o funcţie
ia valori posibil diferite de la un element la altul icircn funcţie de caracteristicile proprii acestora Sunt clasificate
icircn două grupe variabile cantitative (caracteristică măsurabilă) şi calitative (caracteristică ce nu poate fi
măsurată)
La racircndul lor variabilele calitative pot fi
bull Nominale ndash grupuri de elemente ce nu pot fi ordonate (culoarea părului)
bull Nominale ordonate ndash concluziile pot fi grupate (eficienţa unui tratament slabă bună foarte bună)
bull Binare ndash apar numai două posibilităţi (bolnav sănătos)
Variabilele cantitative pot fi
bull Continue ndash o variabilă măsurabilă care poate lua o infinitate de valori
bull Discrete ndash variabile care nu pot lua decacirct valori icircntregi
Statistica descriptivă
Există două ramuri ale statisticii statistica descriptivă şi statistica inferenţială
Statistica descriptivă (după cum rezultă din denumire) se ocupă cu descrierea unor valori obţinute ale unei
variabile studiate
16
Valorile pe care variabila le ia se constituie icircntr-o serie statistică Indicatorii care definesc o variabilă (serie)
sunt
1 Ale tendinţei centrale
Media aritmetică - notată de regulă cu
Mediana - este acea valoare din şirul de date care icircmparte icircn două părţi egale şirul ordonat de valori (atenţie
şirul este ordonat crescător) situacircndu-se la mijlocul seriei statistice
Dacă numărul de valori n este un număr impar atunci mediana este valoarea unde
Dacă n este par deci avem un număr par de valori mediana este definitatilde ca fiind
unde k = n2
Modul - constituie valoarea care apare cel mai des deci valoarea cu numărul cel mai mare de apariţii
2 De dispersie
Amplitudinea - este diferenţa dintre valoarea maximă şi cea minimă
A = Amax - Amin
Amplitudinea relativă - notată A este raportul dintre amplitudinea absolută şi media aritmetică a seriei de
date
Varianţa notată este un indicator de icircmprăştiere a datelor Formula de calcul este
Abaterea standard (S) sau deviaţia standard reprezintă rădăcina pătrată din varianţă (dispersie)
Coeficientul de variaţie se calculează ca un raport procentual icircntre abaterea standard şi valoarea medie a şirului
de valori
Eroarea standard intervine icircn estimarea intervalelor de confidenţă Se calculează astfel
17
3 De asimetrie (skewness) indică distribuţia datelor dacă sunt sau nu distribuite normal
4 De boltire (kurtosis) estimează boltirea sau aplatizarea curbei de distribuţie
Prezentarea descriptivă a datelor se face prin icircnregistrarea datelor culese icircn tabele care să reprezinte icircn mod
sintetic valorile măsurate
Icircn concluzie statistica descriptivă permite
bull Stabilirea comparabilităţii icircntre grupurile de studiu şi aprecierea prezenţei erorilor sau confuziei
bull Reprezentarea datelor icircn tabele permite evaluarea fiecărui pacient şi dacă a existat pierderi din studiu
Statistica inferenţială
Statistica inferenţială (inductivă) este partea de analiză a datelor care permite extrapolarea unei
concluzii trase pe baza unui eşantion spre populaţia ţintă pentru care a fost efectuat studiul
Scopul analizei statistice este de a evidenţia efectul unui tratament sau al unui factor de risc prin date obţinute
din eşantionul studiat spre populaţia ţintă Aceasta implică testarea ipotezelor statistice sau altfel spus testarea
semnificaţiei statistice Este una dintre cele mai importante momente ale studiului Cum rezultatele sunt
obţinute prin studiul unui eşantion există posibilitatea ca acestea să fie datorate icircntacircmplării Testele
statistice ne ajută să apreciem icircn ce măsură rezultatele sunt icircntacircmplătoare şi mai ales icircn ce măsură şi dacă se
pot aplica populaţiei generale Icircn acest scop se impune o valoare limită alfa 005 care reprezintă limita
superioară a probabilităţii ca rezultatul obţinut să fie greşit (datorat icircntacircmplării) Astfel icircn funcţie de tipul
variabilelor şi indicatorii descriptivi aplicaţi şi evaluaţi se aplică teste de semnificaţie statistică (Tabelul 1)
Tabelul 1 Alegerea testelor de semnificaţie statistică
Tipul datelor
18
Diferenţierea variabilelor din punctul de vedere a distribuţiei se face folosind testul de normalitate
Kolmogorov ndash Smirnov
Testul statistic reprezintă metoda de comparaţie a două sau mai multe populaţii prin intermediul unor
variabile observate ale lor
Scopul unui test statistic este de a defini realitatea
Definirea icircntrebării de cercetare (ipoteza clinică)
Tratamentul cu Nebivolol este la fel de eficient ca şi cel cu Valsartan icircn tratamentul
hipertensiunii arteriale
Transpunerea icircntrebării de cercetare icircn termeni statistici (ipoteza statistică)
Media tensiunii arteriale a pacienţilor trataţi cu Valsartan nu diferă semnificativ de media
tensiunii arteriale a pacienţilor trataţi cu Nebivolol
Etapele unui test statistic
1 Formularea problemei icircn termenii ipotezelor statistice
2 Alegerea şi calcularea parametrului statistic al testului
3 Regiunea critică
4 Concluzia testului
1 Formularea problemei icircn termenii ipotezelor statistice
Ipoteza nulă ipoteza care trebuie testată testul efectuacircndu-se sub prezumţia că ipoteza nulă ar
fi adevărată
Ipoteza alternativă acea ipoteză care icircntr-un sens sau altul contrazice ipoteza nulă Această
ipoteză se mai numeşte şi ipoteza de lucru
Ipoteza nulă tipuri
O coadă (ldquoone-tailedrdquo sau ldquoone-siderdquo)
Media este mai mare
Media este mai mică
Două cozi (ldquoone-tailedrdquo sau ldquoone-siderdquo)
Media este egală
2 Alegerea şi calcularea parametrului statistic al testului
Parametrul statistic al testului exprimă icircntr-o anumită formă diferenţa dintre elementele comparate
Ţinacircnd seama de faptul că eşantionul sau eşantioanele utilizate sunt aleator extrase din populaţiile care
fac obiectul testului parametrul statistic este o variabilă aleatoare de selecţie care urmează o anumită
lege de probabilitate
Un parametru statistic al testului bun trebuie să icircndeplinească două condiţii
19
Trebuie să se comporte diferit atunci cacircnd ipoteza nulă H0 este adevărată faţă de situaţia icircn
care ipoteza alternativă H1 este adevărată
Distribuţia de probabilitate a parametrului statistic al testului sub prezumţia că H0 este
adevărată este cunoscută
3 Regiunea critică
- Trebuie să fim capabili să decidem icircn funcţie de valoarea parametrului statistic calculat care dintre
ipoteze cea nulă sau cea alternativă este adevărată
- Dacă valoarea parametrului statistic aparţine regiunii critice ipoteza nulă H0 va fi respinsă şi va fi
acceptată ipoteza alternativă H1
- Dacă valoarea parametrului statistic nu aparţine regiunii critice ipoteza nulă H0 va fi acceptată
- Decidem mărimea regiunii critice
Pentru aceasta trebuie să specificăm mărimea riscului de eroare pe care icircl acceptăm
Pe scurt definim nivelul de semnificaţie notat cu a sau mărimea riscului pe care
suntem dispuşi să ni-l asumăm icircn respingerea ipotezei nule H0 icircn cazul icircn care aceasta
este adevărată De obicei se alege un nivel de semnificaţie icircntre 1 şi 5
Probabilitatea unei erori de tipul I
probabilitatea de respingere a ipotezei nule H0 icircn favoarea ipotezei alternative H1 icircn
condiţiile icircn care H0 este adevărată
probabilitatea unei erori de tipul I se notează cu a şi se mai numeşte nivel de
semnificaţie al testului
Probabilitatea unei erori de tipul II
probabilitatea acceptării ipotezei nule icircn condiţiile icircn care ipoteza alternativă H1 este
adevărată
această probabilitate se notează cu b
- Unilaterală la dreapta ndash valoarea parametrului statistic al testului este mai mare sau egală cu
valoarea din dreapta a intervalului critic
- Unilaterală la stacircnga ndash valoarea parametrului statistic al testului este mai mică sau egală cu
valoarea din stacircnga a intervalului critic
- Bilaterală ndash valoarea parametrului statistic al testului este mai mică sau egală cu valoarea extremă
din stacircnga regiunii critice sau mai mare sau egală cu valoarea extremă din dreapta regiunii critice
valorile extreme ale regiunii critice avacircnd nivele egale de semnificaţie
4 Concluzia testului
- Ipoteza nulă H0 este respinsă dacă valoarea parametrului statistic aparţine regiunii critice
20
- Regiunea critică trebuie astfel aleasă icircncacirct dacă ipoteza alternativă H1 este adevărată
probabilitatea de respingere a ipotezei nule H0 este mai mare decacirct icircn cazul icircn care ipoteza nulă H0
ar fi adevărată
- Acceptarea ipotezei nule H0 atunci cacircnd ipoteza alternativă H1 este adevărată este cunoscută ca şi
eroarea de tipul II
a probabilitatea ei se notează cu b
b măsoară bdquonivelul de eroarerdquo
- Icircn testarea oricărei ipoteze statistice există patru situaţii care determină dacă decizia noastră este
corectă sau nu
Cazuri
H0 este adevărată H0 este falsă
Concluzie H0 se acceptă decizie corectă eroare de tipul
II
H0 se
respinge
eroare de tipul I decizie corectă
Luarea deciziei pe baza valorii probabilităţii p de semnificaţie a testului
Icircn momentul icircn care prelucrăm statistic o serie de date dorim să ştim dacă rezultatele obţinute sunt sau
nu semnificative statistic
Răspunsul la această icircntrebare este dat de valoarea lui p calculată de orice program statistic la
prelucrarea unor date
Icircn cazul testelor statistice ipoteza nulă este respinsă dacă nivelul de semnificaţie este mai mic decacirct
005 iar programele de prelucrare statistică a datelor vor afişa o steluţă () icircn tabelul rezultatelor
21
Dacă p le 005 respingem ipoteza nulă şi acceptăm ipoteza alternativă (am obţinut semnificaţia
statistică)
Dacă p gt 005 acceptăm ipoteza nulă (nu am obţinut semnificaţia statistică)
p = 013
NU respingem ipoteza nulă
Risc de eroare de tip II
α = 005
p = 002
Respingem ipoteza nulă
Risc de eroare de tip I
Semnificaţia lui p
Criteriu de luare a deciziei cu privire la o ipoteză statistică nulă
Cuantifică şansa ca o decizie de respingere a ipotezei nule să fie greşită
Măsură a semnificaţiei statistice şi NU CLINICĂ
22
Semnificaţia lui p (reguli empirice)
001 le p lt 005 rezultatul e semnificativ statistic
0001 le p lt 001 rezultatul e icircnalt semnificativ statistic
p lt 0001 rezultatul e foarte icircnalt semnificativ statistic
p ge 005 rezultatul e considerat nesemnificativ statistic
Limite ale valorii p
Valoarea p NU ne dă informaţii despre
Şansa de beneficiu a unui pacient individual
Procentul de pacienţi care vor avea un beneficiu icircn urma instituirii procedurii medicale
Gradul de beneficiu expectat pentru un anumit pacient
Puterea unui test statistic
Este capacitatea de a detecta o diferenţă acolo unde există
Creşterea volumului eşantionului determină creşterea puterii testului statistic aplicat
Valoarea este icircn relaţie directă cu eroarea de tip II
Puterea = 1 ndash β
Cea mai utilizată modalitate de creştere a puterii unui test statistic este de a creşte volumul
eşantionului
Tipul scalei de măsură ndash testul statistic
Denumire test Interval Nominal Observaţii
Corelaţie Pearson 2 0 Există o relaţie liniară
χ2 0 2
Student 1 1 Doar 2 grupuri
ANOVA 1 1 2 sau mai multe grupuri
Student perechi 1 1 Eşantioane perechi
Măsurători repetate (ANOVA) 1 1 Mai mult de 2 grupuri date
perechi
Inferenţa statistică pe date calitativ e
Tabela de contingenţă 2times2
Riscuri şi raţii
Testul χ2 (testarea asocierii icircn tabela de contingenţă)
Testul Fisher
23
Testul z pentru proporţii
Testul McNemar
Tabela de contingenţă 2times2
Scale de tip nominal (dicotomiale tabela de contingenţă de 2times2) sau ordinal (tabela de contingenţă de
rtimesc)
Frecvenţa absolută (numărul de evenimente per categorie)
Tabela de contingenţă de 2times2 4 categorii
AP = adevărat pozitiv
FP = fals pozitiv
FN = fals negativ
AN = adevărat negativ
Ulcer deschis Ulcer vindecat Total
Recurenţă + AP = 1 FP = 5 = 1+5 = 6
Recurenţă - FN = 7 AN = 16 = 7+16 = 23
Total =1+7=8 =5+16=21 29
Riscuri şi raţii Mărimi ale asocierii
Denumire Formula Definiţie
Rata falşilor pozitivi =FP(FP+AN) Probabilitatea unui test fals + (α)
Rata falşilor negativi =FN(FN+AP) Probabilitatea unui test fals ndash (β)
Sensibilitate =AP(AP+FN) Probabilitatea unui test real + (1- β)
Specificitate =AN(AN+FP) Probabilitatea unui test real ndash (1- α)
Acurateţe =(AP+AN)n Probabilitatea generală a unei decizii corecte
Valoarea predictivă pozitivă =AP(AP+FP) Probabilitatea ca un test pozitiv să fie corect
Valoarea predictivă negativă =AN(AN+FN) Probabilitatea ca un test negativ să fie corect
Riscul relativ =AP(FP+AN)FN(AP+FP)
Rata şansei =(AP∙AN)(FN∙FP)
Riscul atribuabil =AP(AP+FP)-FN(FN+AN)
24
Denumire Formula
Rata falşilor pozitivi = 5(5+1) = 08334
Rata falşilor negativi = 7(7+16) = 03043
Sensibilitate = 1(1+7) = 01250
Specificitate = 16(16+5) = 07619
Acurateţe = (1+16)29 = 05862
Valoarea predictivă pozitivă = 1(1+5) = 01667
Valoarea predictivă negativă = 16(16+7) = 06957
Riscul relativ = 1(5+16)7(1+5) = 2142 = 050
Rata şansei = (1∙16)(7∙5) = 04571
Riscul atribuabil = 1(1+5)-7(7+16) = 01667-03043=-01376
Testarea asocierii icircn tabela de contingenţă
Testul χ2
Nu trebuie utilizat pentru eşantioane de volum mic
Testul este valid doar dacă valoarea expectată (aşteptată) pentru fiecare celulă este cel puţin
egală cu 1 şi frecvenţa absolută observată este de minim 5
Dacă aceste condiţii nu sunt icircndeplinite se aplică testul exact al lui Fisher (Fisherrsquos Exact Test)
Indică dacă cele două variabile sunt sau nu independente DAR NU cuantifică puterea asocierii
dintre ele
Problema S-a investigat icircntr-un studiu asocierea dintre obezitatea (ca factor de risc) şi bolile
cardio-vasculare la persoanele icircn etate (gt 60 ani) Din totalul de 620 persoane investigate s-au
identificat 150 persoane cu obezitate şi boală cardio-vasculară 230 persoane fără obezitate şi
fără boală cardio-vasculară şi 60 persoane fără obezitate dar cu boală cardio-vasculară Există
o asociere icircntre obezitate şi boala cardio-vasculară (df=1 α=005 χ2critic = 384)
Testul χ2 exemplu
H025
Nu există asociere icircntre obezitate şi bolile cardio-vasculare
Obezitatea şi bolile cardio-vasculare sunt independente
H1
Există asociere icircntre obezitate şi bolile cardio-vasculare
Obezitatea şi bolile cardio-vasculare sunt asociate
a = 005 pragul de semnificaţie al testului
urmează o lege cu (r-1)(c-1) grade de libertate
χ2 = parametrul testului χ2
fio = frecvenţa observată
fit = frecvenţa teoretică
Regiunea critică este [χα2 yen)
Pentru α = 005 χα2 = 384
OBSERVAT BCV+ BCV- Total
Obezitate + AP = 150 FP = 180 330
Obezitate - FN = 60 AN = 230 290
Total 210 410 620
TEORETIC BCV+ BCV- Total
Obezitate + = 330times210620 = 330times410620 330
Obezitate - = 290times210620 = 290times410620 290
Total 210 410 620
TEORETIC BCV+ BCV- Total
Obezitate + = 330times210620 = 330times410620 330
26
Obezitate - = 290times210620 = 290times410620 290
Total 210 410 620
TEORETIC BCV+ BCV-
Obezitate + = 112 = 218
Obezitate - = 98 = 192
Deoarece 4177Icirc[384 yen) se respinge H0 cu un risc de eroare de 5
Există asociere icircntre obezitate şi bolile cardio-vasculare
Testul Fisher
Corecţie a testului χ2
Valoarea p asociată parametrului ne dă probabilitatea ca valoarea observată de independenţă să fie
atribuită doar şansei
O valoare p mică indică că există alte cauze decacirct şansa influenţează rezultatul şi astfel cele două
variabile investigate nu sunt independente
Testul Fisher = dispersia corectată a factorului x dispersia corectată a factorilor reziduali
Icircn acest context regula adunării dispersiilor se poate scrie unde
este variaţia lui y pe seama variaţiei variabilei x
este variaţia lui y pe seama influenţei factorilor reziduali (neicircnregistraţi)
este variaţia totală a caracteristicii y
Testul Fisher empiric se calculează după formula
27
se compară cu Ftab pentru nx şi nz grade de libertate la un anumit prag de semnificaţie stabilit
Dacă Fc gt Ftab rezultă că variaţia factorului de grupare x este semnificativă pentru variaţia caracteristicii y
Testul z pentru proporţii
1 Compararea unei frecvenţe observate cu o frecvenţă teoretică
2 Testarea egalităţii a două frecvenţe
Testul z Compararea unei frecvenţe observate cu o frecvenţă teoretică
Scop Investigarea semnificaţiei diferenţei icircntre o frecvenţă teoretică p (icircntr-o populaţie) şi o frecvenţă
observată f pe un eşantion reprezentativ (variabilă calitativă (binare))
Condiţii de aplicare Testul este corect aplicat dacă numărul n al observaţiilor eşantionului este
suficient de mare (n∙p n∙(1-p)gt10
Parametrul
n = volumul eşantionului
Suntem interesaţi de investigarea prevalenţei hepatitei B la personalul care lucrează icircn laboratoarele
clinicilor de boli infecţioase din Transilvania Se ştie din studii anterioare că prevalenţa hepatitei B icircn
populaţia generală din Transilvania este de 9 S-a luat icircn studiu un eşantion de 100 persoane şi s-a
obţinut o prevalenţă a hepatitei B de 6 Există diferenţă semnificativă icircntre frecvenţa hepatitei B la
personalul care lucrează icircn laboratoarele spitalelor de boli infecţioase din Transilvania faţă de
populaţia generală
f = 006 p = 009 n = 100
Ipoteza nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat
faţă de frecvenţa hepatitei B icircn populaţia generală
Ipoteza alternativă test bilateral Există diferenţă semnificativă icircntre frecvenţa hepatitei B la
nivelul eşantionului şi prevalenţa hepatitei B icircn populaţia generală
f = 006 p = 009 n = 100
Pragul de semnificaţie a = 005
Regiunea critică test bilateral (-yen -196 ]Egrave[196 yen)
28
Concluzia testului
Deoarece parametrul statistic calculat al testului nu aparţine regiunii critice se acceptă ipoteza
nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat faţă de
frecvenţa hepatitei B icircn populaţia generală
Testul McNemar
Evaluarea dependenţei variabilelor calitative perechi (dorim să determinăm dacă o anumită
caracteristică este sau nu asociată cu o anumită patologie)
Identificăm n pacienţi care prezintă patologia de interes (eg Cancer bronho-pulmonar) şi n
pacienţi cu aceleaşi caracteristici ca şi primul grup dar care nu o prezintă
Martor = da Martor = nu
Caz = da a b
Caz = nu c d
Testul McNemar - exemplu fumat vs cancer
Martor = da Martor = nu
Cancer = da a = 2 b = 5
Cancer = nu c = 0 d = 3
29
χ2critic(α=005) = 384
32 lt 384 rarr acceptăm ipoteza nulă
Fumatul nu este icircn relaţie cu apariţia cancerului bronho-pulmonar
Inferenţa statistică pe date cantitative
Variabile cantitative continue
Testul z şi Student (t) (o medie sau medii perechi)
Testul z şi Student (t) (testarea a două medii)
ANOVA (ge 3 medii)
Ranguri (variabile cantitative discrete sau cantitative care nu icircndeplinesc condiţia de
normalitate)
Testul sumei rangurilor Wilcoxon
Kruskal-Wallis (ge 3 eşantioane independente)
Friedman (ge 3 eşantioane dependente)
Teste de normalitate variabile cantitative continue
Shapiro-Wilk
Kolmogorov-Smirnov
Shapiro-Wilk
Chi-Square Goodness-of-Fit
Dacă datele urmează o distribuţie normală aplicăm un test parametric
Dacă datele nu urmează o distribuţie normală aplicăm un test de comparare al rangurilor
30
Testul Z de comparare a mediei unui eşantion cu media unei populaţii
Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ
extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie
s2 care se cunoaşte
Condiţii de aplicare
1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru
compararea mediei unui eşantion cu media unei populaţii)
2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal
distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă
3 Talia eşantionului este mare ( ge 30)
Ipoteze
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media
eşantionului şi media populaţiei
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
(-yen -196 ] Egrave [196 yen)
Parametrul testului
n = volumul eşantionului
= media eşantionului
s = deviaţia standard a populaţiei
Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)
Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard
cunoscută
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi
media standard
Condiţii de aplicare
Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se
realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această
condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea
31
Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai
puternic
Numărul de grade de libertate (df) df = n-1
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
Parametrul testului
n = volumul eşantionului
micro0 = media standard
= media eşantionului
s = deviaţia standard a eşantionului
Testul ANOVA compararea mediilor a mai multe eşantioane
H0 = toate mediile sunt egale
H1 = nu toate mediile sunt egale
Condiţii de aplicare
1 Datele sunt independente unele faţă de celelalte
2 Datele fiecărui grup sunt normal distribuite
3 Deviaţia standard este aceeaşi pentru toate grupurile
Id Medicament
A B C D E F
1 5 6 7 10 5 9
2 6 8 8 11 8 8
3 7 7 9 13 6 7
4 8 9 11 12 4 5
32
5 9 10 10 9 7 6
Suma 35 40 45 55 30 35
Media 7 8 9 11 6 7
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =
= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)
Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2
F = (suma pătratelor(icircntre))(suma pătratelor(icircn))
Suma pătratelor (icircntre) = 16times5 = 80
Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60
Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn
interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare
SP df Media pătratelor F = MPicircntreMPicircn
Icircntre 80 5 = 805 = 16 = 1625 = 64
Icircn 60 24 = 6024 = 25
Total 140 29 -
Testul sumei rangurilor Wilcoxon
Aplicat pentru
Un set de observaţii provenite dintr-o valoare ipotetică comună
Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)
Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero
Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace
Suma rangurilor pentru diferenţele negative = 2+3+1 = 6
Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30
33
Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului
egal cu 8 = 0109
Icircnainte După Diferenţa Rang
64 66 -2 2
66 58 8 5
67 68 -1 3
71 65 6 4
72 75 -3 1
76 67 9 6
78 59 19 8
89 74 15 7
Testul Kruskal-Wallis (ge 3 eşantioane independente)
Test de ranguri aplicate pe mai mult de 3 eşantioane
H = parametrul testului
n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)
Tk = suma rangurilor
Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie
pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni
34
df = k-1 (k = numărul de eşantioane)
df = 3-1 = 2
Hcritic(α=005) = 599
H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie
pozitivă şi respectiv biopsie negativă
Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie
a tipului de studiu pe eşantioane perechi)
1 Definirea numărului de tratamente k
2 Obţinerea rangurilor pentru fiecare tratament
3 Sumarea rangurilor fiecărui tratament
4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)
5 Dacă Fr gt Frcritic rarr respingem H0
Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost
măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi
n = 9 k = 3 T12 = 225 T2
2 = 38025 T32 = 38025
Frcritic = 599
Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de
prostată
35
De reţinut
Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei
Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-
of-Fit
Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z
Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t
Compararea mediilor a 3 sau mai multe eşantioane ANOVA
Compararea mediilor a două populaţii (σ) testul Z
Compararea mediilor a două eşantioane (s) testul t
Compararea mediilor a două eşantioane perechi (s) testul t
ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi
cu cel pentru compararea a două eşantioane perechi
Ranguri
Distribuţia datelor nu are importanţă
Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)
Trei sau mai multe eşantioane Kruskal-Wallis
Trei sau mai multe eşantioane perechi Friedman
Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia
Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a
datelor)
Variabile nominale
Un singur eşantion sau eşantioane perechi
Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte
Eşantioane perechi testul Mc Nemar
Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2
Icircn analiza proporţiilor există teste diferite pentru
Compararea unei frecvenţe cu o frecvenţă cunoscută
Compararea a două frecvenţe
Semnificaţia statistică
Valoarea p (p value)
Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor
două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E
posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării
aleatorii
36
Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală
urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii
Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este
probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un
experiment de dimensiunea acestuia
Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că
diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii
diferite
Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca
fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă
ar fi fost adevărată
Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă
1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe
baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De
fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001
2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie
3 Se aplică testul statistic aferent pentru a calcula valoarea p
4 Se compară valoarea p cu valoarea ndash prag
5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe
semnificativă dpdv statisticrdquo
6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e
semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să
conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă
Teste de semnificaţie
Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului
populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)
Testarea ipotezelor implică posibile erori
Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile
sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui
grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul
icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005
ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există
37
nici o diferenţă
Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ
statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de
ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost
ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau
dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă
cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă
semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe
ipotetice variate icircn cazul icircn care ele există
Măsuri ale frecvenţei
Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)
Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate
Generic formula pe care se bazează toate cele trei este
unde x şi y sunt cantităţile de comparat
Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea
unei frecvenţe pe grupe de sex vacircrstă etc
Proporţia implică icircn mod necesar ca x să fie inclus icircn y
Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară
frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp
Pentru calcularea unei rate trebuie ţinut cont de trei aspecte
bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin
bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp
bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo
Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un
tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei
populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei
aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)
38
Indicatori
Rata de incidenţă
Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă
icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii
Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o
perioadă de timp
Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de
timp x
Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei
susceptibili de a dezvolta icircmbolnăvirea studiată
Numitorul poate fi
bull Numărul mediu al populaţiei icircn perioada de timp studiată
bull Mărimea populaţiei icircn mijlocul perioadei de studiu
bull Mărimea populaţiei la icircnceputul studiului
Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă
Este obligatorie menţionarea perioadei de timp
Prevalenţa
Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la
un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă
schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa
momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)
39
Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include
numai cazuri noi respectiv include cazuri noi şi vechi
Rata de atac
Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este
folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp
raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori
Rata persoană-timp
Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din
momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte
migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost
observate
Riscul relativ (RR)
Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment
legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele
prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două
grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la
bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la
bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai
mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo
Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2
Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn
cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă
(Tabelul 1)
Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR
Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la
neexpuşi
40
Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de
culegere a datelor
Odds ratio (OR)
Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin
raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general
studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)
Tabelul 2 Tabelul 2 x 2 pentru calcularea OR
Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală
Rate de mortalitate
Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp
specificată Există mai multe tipuri de rate de mortalitate
o Mortalitate specifică pe sex
o Mortalitate specifică pe rasă
o Mortalitate specifică pe boală
o Mortalitate neonatală
o Mortalitate postneonatală
o Mortalitate infantilă
o Mortalitate maternă
Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP
41
Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de
viaţă şi vacircrsta la care survine decesul dacă este prematur
Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu
Ani de viaţă pierduţi datorat dizabilităţii
Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt
utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru
cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite
grupuri
Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de
risc şi o boală se folosesc riscul relativ şi odds ratio
35 Analiza şi interpretarea datelor
După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date
trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul
Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor
colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului
studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu
plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde
prezenţa biostatisticianului este necesară
Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu
elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat
iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului
iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate
depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori
testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere
clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza
Interpretarea rezultatelor statistice
Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne
motive (număr mic de date) acceptarea ei să fie falsă
Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine
gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia
ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument
de decizie Intervalul de confidenţă
42
Interpretarea statistica ne interpretarea clinică
Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă
Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice
obţinute pe eşantionul studiat
Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare
Ce interpretăm Rezultatele
personale obţinute icircn urma studiului
care au fost prezentate icircn secţiunea bdquoRezultaterdquo
Explicăm rezultatele obţinute
Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale
Interpretarea trebuie să se realizeze icircn
lumina limitelor studiului
contextul cultural social şi educaţional al locului unde s-a realizat cercetarea
contextul a ceea ce se cunoaşte din literatura de specialitate
Interpretăm doar rezultatele personale obţinute icircn urma studiului
Interpretarea statistică nu este tot una cu interpretarea clinică
Interpretarea statistică este importantă
Interpretarea clinică este foarte importantă
Intervalul de confidenţă
Media calculată pe baza unui eşantion nu va echivala media populaţiei
Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului
Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a
populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a
populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)
pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru
orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare
dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de
confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de
date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de
5
Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel
Dacă valoarea p este mică
Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare
aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o
medie diferită Diferenţa este semnificativă dpdv statistic
43
Icircn continuare
Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa
reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică
pentru a fi interesante din punct de vedere ştiinţific
Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC
oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care
este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a
obţine o concluzie clară
Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o
diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că
datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din
punct de vedere ştiinţific
Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul
detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat
Erorile studiilor medicale
Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura
anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară
caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea
asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri
legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias
Erorile potenţiale icircn studiile epidemiologice
1 Erori icircntacircmplătoare
2 Erori sistematice
3 Confuzia
4 Validitatea
1 Erori icircntacircmplătoare
Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a
parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel
de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot
fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii
(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor
de măsură (eroarea de măsurare)
44
2 Erori sistematice
Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate
care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu
acurateţe mare Acurateţea nu este afectată de mărimea eşantionului
Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de
experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea
dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus
şi greu de cuantificat (consum de alcool personalitate etc)
Principalele tipuri de erori din această categorie sunt
bull Biasul de selecţie
bull Biasul de informaţie
Biasul de selecţie
Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul
trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion
inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale
persoanelor incluse
Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se
ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia
Biasul de informaţie
Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de
instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze
expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere
nesemnificativă sau chiar să nu şi-o amintească de loc
3 Confuzia
Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune
prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este
cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă
de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte
important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor
protector
4 Validitatea
Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă
Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte
estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional
Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă
45
conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se
demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)
Validitatea externă se poate realiza numai dacă studiul este valid intern
Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii
studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de
studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt
laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi
validă din punct de vedere intern)
3 6 Prezentarea rezultatelor
După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite
Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor
icircntr-o formă bdquodigerabilărdquo este necesară
Scopul prezentării datelor
1 Transmiterea concluziilor studiului
a Datele corecte şi importante merită comunicate
b Datele trebuie să confirme sau să infirme ipoteza studiului
c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală
2 Acordarea posibilităţii altor cercetători să aprecieze studiul
a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti
b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor
prezentate
Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru
fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie
statistică
Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de
valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras
(Tabel 3)
Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)
46
Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct
numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor
precum şi prezentarea acestora sub formă inteligibilă
Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care
convin cercetătorului
Prezentarea datelor se poate face
1 Figuri şi tabele icircn articole scrise
2 Figuri şi tabele icircn prezentări orale
3 Figuri şi tabele icircn postere
4 Text scris sau incluse icircn text
5 Site-uri de WEB
Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor
Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie
Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele
exprimacircnd exact ceea ce acestea exprimă
Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate
anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel
să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se
acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca
mai sus sugestive sunt formatele simple şi puţin icircncărcate
Dacă nu există reguli impuse se respectă
1 Mesaj simplu fără falsificarea datelor
2 De obicei este necesar atacirct tabelul cacirct şi graficul
3 Să fie simplu şi clar
Tabele
Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile
coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică
elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de
1 Se folosesc doar linii orizontale
2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn
evidenţi prin linie de separare (Tabelul 4)
Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland
Noua Zeelandă)
(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)
47
3 Numerele sunt aliniate icircn funcţie de virgulă
4 Indicii statistici sunt explicaţi sub tabel
5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană
6 Abrevierile pot fi folosite
7 Numărul de zecimale trebuie limitat la maxim două
8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel
9 Plasarea legendei este obligatorie sub tabel
10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)
Icircn cazul prezentărilor orale sau a posterelor este indicat ca
1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării
2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte
3 Folosirea de simboluri este permisă
Clasificarea tabelelor
Tabelele se clasifică după
i) conţinut
bull cu distribuţii de frecvenţe
bull de clase de frecvenţe
bull de contingenţă
ii) structura
bull cu doua coloane
bull cu subclasificări
bull ldquomasterrdquo
Tabele ce conţin distribuţii de frecvenţe
O modalitate comodă de a prezenta o mulţime de date brute este
1 Se ordonează datele in ordine crescătoare
2 Se determine frecvenţa fiecărei valori
3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane
(Tabelul 5)
Tabelul 5 Distribuţii de frecvenţă absolută
48
Tabelul claselor de frecvenţe
1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă
2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)
Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)
Tabele de contingenţă
1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a
tabelelor de contingenţă
2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a
combinaţiilor de perechi ordonate de valori
3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre
a factor de risc si
b starea sănătăţii
4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)
5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)
Tabelul 7 Tabel de contingenţă 2 x 2
49
Grafice
Există două categorii de moduri grafice sub care se pot prezenta datele
1 Ilustraţii şi fotografii
2 Grafice
1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă
pentru lucrare
2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit
Putem vorbi despre mai multe tipuri de grafice
bull Grafice pentru reprezentarea datelor cantitative
1048707 Grafic cartezian (X Y)
1048707 Histograma
1048707 Poligonul de frecvenţe
1048707 Diagrama bdquoscatterrdquo
bull Grafice pentru reprezentarea datelor calitative
1048707 Grafic cu bare
1048707 Diagrama tip bdquoboxplotrdquo
1048707 Diagrama bdquopierdquo
1048707 Cartograma
Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi
dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)
Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)
Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie
Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)
Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)
50
Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir
de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele
două variabile studiate (Figura 6)
Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2
(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2
rămacircne aproximativ constantă)
Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea
comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea
comparativă a mai multor variabile
Figura 7 Grafic calitativ cu bare
51
Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo
Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două
posibilităţi reprezentate grafic este mai frecventă (Figura 8)
Figura 8 Reprezentare tip bdquopierdquo
Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli
sau a oricărui element comparativ Se foloseşte de epidemiologi
Rezultate
Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare
Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o
manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu
explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția
bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la
ilustraţii tabele grafice
Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi
nici rezultatele care invalidează eventual ipoteza
Discuţii
Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd
cultura ştiinţifică şi inteligenţa autorilor
Acest capitol răspunde la trei obiective
Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia
calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de
selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează
rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv
52
este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn
care a fost abordată problema fără a face o revistă a literaturii
Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea
rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul
Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor
afirmaţii nesusţinute de conţinutul lucrării
Concluzii
Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate
să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie
Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de
concluzii va scădea valoarea lucrării
Bibliografia (lista referinţelor citarea icircn text)
Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn
lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente
Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli
- să conţină cele mai importante şi recente lucrări
- să includă numai lucrări publicate
- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate
Bibliografie
Elisabeta Jaba ndash Statistică Ed Economică 1998
Mihai Ţarcă ndash Statistică volI Ed UAIC 1979
Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale
Ed University Press 2009
Sorana Daniela Bolboacă ndash Metodologia cercetării curs
53
Teze de doctorat licenţă Se pot găsi icircn bibliotecile instituţiilor de icircnvăţămacircnt superior Sunt utile pentru că
icircn general tratează pe larg o anumită problemă care poate fi de interes avacircnd şi o bibliografie recentă
Brevete şi mărci Sunt acele sisteme de protecţie a produselor şi tehnologiilor Sunt utile icircn general icircn
cercetarea experimentală
Literatura secundară de specialitate
Tratate de specialitate Sunt foarte importante icircn faza incipieintă a unui studiu pentru aprofundarea problemei
de cercetat Informaţiile prezente icircn astfel de publicaţii sunt ordonate cu noţiuni de bază definiţii teorii
posibile etc
Cărţi de referinţă Sunt monografii care studiază pe larg un fenomen putacircnd fi foarte utile atacirct cercetătorilor
debutanţi cacirct şi celor iniţiaţi
Literatura terţiară de specialitate este reprezentată de indexuri reviste cu extrase de articole şi rezumate
Cercetarea bibliografică bdquoon-linerdquo permite accesul la nenumărate surse de informare utilizacircnd icircn acest scop
motoare de căutare
b) A doua etapă este lectura critică activă a publicaţiilor selectate pentru a judeca valoarea publicaţiilor
indiferent dacă este vorba de calitatea cercetării sau de pertinenţa rezultatelor publicate
Evaluarea corectă critică a unui articol va permite cititorului să aprecieze dacă publicaţia este credibilă
rezultatele corespund realităţii (validitatea internă) respectiv dacă informaţiile conţinute icircn publicaţie sunt
aplicabile icircn practica medicală dacă se pot generaliza dacă sunt aplicabile icircn proiectul de cercetare al
viitorului investigator (validitatea externă)
Lectura critică a literaturii medicale se bazează pe folosirea unei grile de lectură care are meritul de a putea fi
aplicată tuturor tipurilor de publicaţii Această grilă are 8 criterii de evaluare pentru fiecare criteriu trebuie să
se răspundă la următoarele icircntrebări
bull este posibil să se găsească icircn articol informaţia pentru criteriul icircn cauză
bull dacă criteriul abordat este corect
bull dacă criteriul este incorect icircn ce măsură ameninţă validitatea studiului
Cele 8 criterii de evaluare sunt
1 Obiectivul vizează următoarele preocupări medicale
bull istoria naturală a unei boli evoluţia şi prognosticul ei
bull performanţa unui test diagnostic
bull impactul unei intervenţii (terapeutice de depistare de prevenţie sau de educaţie)
Lectura critică va aşeza articolul icircn una din aceste situaţii apoi icircn raport cu obiectivul va stabili dacă are
ipoteze de verificat
5
2 Tipul de studiu Cititorul trebuie să recunoască planul de studiul pentru a verifica dacă tipul de studiu este
adaptat icircntrebării puse Va merge progresiv cu urmărirea de la raportul de caz-seria de cazuri la studiul
transversal studiul caz-control studiul de cohortă şi trialul controlat
3 Factorii studiaţi (variabila independentă) pot fi factori de expunere sau de intervenţie Cititorul trebuie să
poată recunoaşte factorul să aprecieze cum a fost măsurat dacă s-a folosit aceeaşi metodă de măsurare pentru
loturile icircn studiu ce metodă de comparaţie s-a folosit dacă sunt erori (factor de confuzie)
4 Criteriul de raţionament este evenimentul sau situaţia presupusă a fi rezultatul factorului studiat boala
decesul supravieţuirea complicaţiile etc Definirea precisă şi metoda de măsurare a rezultatului expunerii va
permite cititorului să aprecieze validitatea informaţiilor
5 Populaţia studiată (eşantionul) Se va urmări dacă este definită populaţia de referinţă şi populaţia de
studiat analizacircndu-se corectitudinea selecţiei randomizarea proporţia de subiecţi la sfacircrşitul studiului
validitatea externă a rezultatelor
6 Analiza datelor Cititorul trebuie să aprecieze dacă s-au examinat toate erorile inclusiv factorul de confuzie
dacă nu validitatea studiului ar putea fi compromisă
7 Rezultatele Principalele aspecte pe care cititorul le va urmări la acest capitol sunt dacă ele se datoresc
numai şansei dacă s-a făcut calculul statistic dacă s-a apreciat relaţia expunere-efect (RR OR RA) dacă a
fost apreciată semnificaţia clinică sau biologică care nu este identică cu semnificaţia statistică
8 Sinteza lecturii critice analizează concluziile autorilor dacă ele răspund icircntrebărilor formulate la icircnceputul
studiului dacă rezultatele sunt aplicabile la populaţia studiată dacă rezultatele sunt acceptabile pentru practica
proprie a cititorului dacă rezultatele justifică vreo schimbare icircn practica clinică respectiv vor ameliora starea
pacienţilor Această abordare cere cititorului cunoaşterea noţiunilor de bază icircn metodologia cercetării
ştiinţifice fiind vorba icircn acelaşi timp şi de un demers clinic
c) A treia etapă icircn cercetarea bibliografică constă icircn combinarea datelor din mai multe studii referitoare la
acelaşi subiect şi care se realizează prin meta-analiză Tehnica meta-analizei permite să se sporească
eficacitatea testării ipotezelor să crească forţa statistică a rezultatelor şi să se obţină informaţii care nu pot fi
convenabil extrase din fiecare cercetare
Definirea fenomenului
Definirea fenomenului se bazează pe
bull Cunoaşterea prealabilă a problemei prin documentare riguroasă documentare care poate justifica pertinenţa
temei propuse (revista literaturii de specialitate)
Icircn prima etapă se cercetează bibliografia propriu-zisă adică se identifică publicaţiile care se referă la subiectul
icircn discuţie apoi se vor selecta publicaţiile necesare studiului apreciind validitatea lor (problemele de
documentare bibliografică vor constitui un capitol separat)
bull Formularea unei ipoteze ştiinţifice sub-etapă care reprezintă fondul problemei
6
Ipoteza este o afirmaţie (nu o icircntrebare) despre o posibilă relaţie icircntre factorii studiaţi şi criteriile de
raţionament Ipoteza poate fi ipoteză ldquonulărdquo - nu există această relaţie şi ldquoalternativărdquo - există relaţia Ipoteza
va trebui apoi dovedită sau respinsă testul statistic calculează probabilitatea conform căreia asociaţia observată
este reală sau ea survine din icircntacircmplare
bull Motivarea organizării studiului Trebuie făcută o motivare corectă legată de inexistenţa unor studii
referitoare la problema pe care o va dezbate studiul
Formularea temei de studiu
Pentru formularea temei de studiu trebuiesc menţionate obiectivul sau obiectivele şi tipul de studiu ales pentru
cercetarea respectivă Există icircn general patru tipuri de obiective
bull obiective care se referă la evoluţia şi prognosticul unei icircmbolnăviri obiective prin care se icircncearcă
icircnţelegerea şi cunoaşterea unor evenimente ce pot să apară la un pacient pe parcursul bolii
bull obiective care se referă la etiologia bolii (cauze de natură bacteriană virală parazitară) sau la cauzalitate
(relaţia factor de risc-boală)
bull obiective legate de performanţa unor teste de diagnostic sau de screening de evaluare a strategiei de
diagnostic sau de interpretare a unui test
bull obiective care se referă la impactul unei intervenţii evaluarea unei intervenţii terapeutice de depistare a unor
boli de prevenţie de educare pentru sănătate
Obiectivele unui studiu se icircmpart icircn obiectivul major unul din cele patru enumerate şi obiective
secundare care pot aborda şi alte fenomene biologice decacirct cel major cu condiţia să nu altereze realizarea
acestuia Alegerea tipului de studiu este stracircns legată de obiectivul ales Dacă obiectivul este descrierea
distribuţiei caracteristicilor unei populaţii aprecierea frecvenţei unui fenomen de sănătate analiza acelui
fenomen icircn funcţie de timp loc persoană se va alege un studiu epidemiologic descriptiv studiu care nu are o
ipoteză fixată anterior O ipoteză se poate formula ca rezultat al studiului descriptiv dar nu se va face
verificarea ei icircn cadrul studiului Dacă intenţia studiului este de a emite o judecată asupra unei posibile relaţii
icircntre factorii studiaţi atunci problema de cercetat este fundamentată de o ipoteză care trebuie verificată
dovedită iar studiul care realizează acest lucru respectiv limitele studiilor utilizate
Aspectele manageriale
Aspectele manageriale includ
bull justificarea bugetului estimarea sumei necesară realizării studiului și apreciarea durate studiului
bull defalcarea bugetului pe necesități legate de achziționare de aparatură reactanți truse etc pentru personal
(munca depusă pregătire deplasări icircn teren participări la congrese sau conferințe documentare) materiale
consumabile etc
7
32 Elaborarea proiectului
Protocolul de cercetare este un document care emite obiectivul și ipoteza studiului definește condițiile de
desfășurare și realizare a viitorului studiu clinic Elaborarea protocolului este importantă pentru cercetătorii
participanţi la studiu comisiile de etică şi finanţatori
Protocolul include mai multe formulare care trebuie să cuprindă
a) Titlul proiectului
b) Sumarul proiectului
c) Descrierea proiectului
d) Normele deontologice de cercetare
e) Modalitățile de diseminarea și valorificarea rezultatelor
f) Perspective de continuare a cercetării
g) Anexe
Prezentarea proiectului va include următoarele fișiere
bull resursele umane (membrii echipei afilierea acestora)
bull relevanța temei pentru dezvoltarea cunoașterii icircn domeniu
bull stadiul actual al cunoașterii și bibliografia aferentă
bull justificarea studiului
bull enunțarea obiectivelor și ipoteza de lucru
bull metodologia propriu-zisă
Referitor la metodologia utilizată vor trebui menționate
bull factorulfactorii studiați care reprezintă variabila independentă respectiv dacă este cazul modalitățile de
măsurare
bull criteriile de raționament- variabila dependentă (situația sau evenimentul ce se presupune a fi rezultatul
factorului studiat cum ar fi boala handicapul complicații decesul)
bull tipul de studiu care se va aplica icircmpreună cu design-ul acestuia
bull eșantioanele de lucru și modalitățile de eșantionaj
bull metodele de culegere și de prelucrare a datelor
bull planificarea activităților
bull structura bugetului fiind eligibile următoarele categorii de cheltuieli de capital (echipamente software
upgrading) pentru personal (full sau part-time instruire asigurări de sănătate) de informare (documentare
abonamente) mobilități (vizite la alte unități de cercetare participări la
congrese) materiale consumabile (truse reactanți papetărie) valorificare a rezultatelor (lucrări științifice de
etapă sau lucrarea finală) cheltuieli indirecte (de regie)
bull modalităţile de valorificare a rezultatelor
bull legături de alte proiecte
8
Protocolul mai conține anexe curriculum vitae al investigatorului principal și al coinvestigatorilor
calendarul activităților avizul Comisiei de etică documente speciale și
consimțămacircntul informat icircn cazul studiilor pe subiecți umani
Icircnainte de implementare protocolul va fi verificat de experți pentru eligibilitate (dacă sunt icircndeplinite
condițiile de acceptare finanțare) calitate și pertinență icircn sensul că protocolul trebuie să fie clar exprimat
corect icircntocmit bine așezat și cu repercursiuni favorabile pentru viitor
33 Culegerea informaţiei
Pentru a realiza o cercetare medicală culegerea datelor este prima etapă şi realizează icircn funcţie de
obiectivele propuse tipul studiului timpul disponibil şi resurse umane şi financiare
Există două mari posibilităţi de culegere
bull Icircn funcţie de elementele studiate
o Culegerea exaustivă Toţi subiecţii populaţiei pe care dorim să o studiem Greu de realizat din cauza
costurilor foarte mari sau a alterării populaţiei de studiu
o Prin eşantionare Este metoda folosită icircn studii medicale
bull Icircn funcţie de durata culegerii
o Transversală Se studiază un grup la un moment dat
o Longitudinală Extinsă in timp
- Retrospectivă ndash icircnregistrări medicale
- Prospectivă ndash date culese la intervale prestabilite de timp
Populaţia ţintă
Este orice colectivitate icircntreagă de oameni animale plante sau obiecte de la care putem colecta date Populaţia
ţintă este icircntregul grup care ne interesează pe care dorim să-l descriem sau să tragem concluzii despre el
Pentru a putea realiza generalizări spre populaţia ţintă deseori suntem obligaţi să folosim un eşantion (selecţie)
care icircnsă trebuie să fie reprezentativ pentru populaţia pe care vrem să o studiem Pentru fiecare populaţie de
studiu sunt posibile mai multe eşantioane Pe baza acestor eşantioane se calculează un estimator Pe baza
acestui estimator calculat care poate fi medie aritmetică procent etc se pot trage concluzii despre icircntreaga
populaţie Este foarte important ca investigatorul să definească foarte atent şi complet populaţia icircnainte de a
realiza eşantionul inclusiv descrierea criteriilor de includere şi excludere icircn populaţia de studiu
Eşantionul
Un eşantion este practic un grup de elemente selectate dintr-un grup mai extins (populaţia ţintă) Studiind
eşantionul selectat se pot trage concluzii despre grupul de unde a fost ales (populaţia ţintă)
Este icircn general ales pentru studiu pentru că
bull Populaţia ţintă este prea mare şi nu poate fi studiată ca icircntreg
bull Nu avem acces din diverse motive decacirct la parte din populaţia de studiu
9
bull Un studiu pe icircntreaga populaţie poate distruge populaţia
bull Eşantioanele pot fi studiate mai rapid
bull Costul şi resursele necesare studiului sunt mai reduse
Numărul elementelor dintr-un eşantion se numeşte talia sau volumul selecţiei
Acesta fiind icircn general mai mic decacirct icircntreaga populaţie poate fi observat icircn detaliu iar dacă este reprezentativ
se pot afla prin intermediul său proprietăţile populaţiei ţintă
Eşantionul trebuie să fie reprezentativ pentru populaţia generală De aceea dintre metodele de eşantionare se
folosesc tehnicile de randomizare Trebuie să satisfacă două condiţii principale
bull condiţie de ordin cantitativ talia să fie suficient de mare
bull condiţie de ordin calitativ trebuie extras aleator din populaţia ţintă
Metode de eşantionare
Putem vorbi icircn linii mari de două posibilităţi de eşantionare prin metode probabilistice şi prin metode
nonprobabilistice
Eşantionarea probabilistică este metoda cea mai folosită icircn studiile medicale fiind şi cea indicată pentru a
realiza reprezentativitatea calitativă
Icircn medicină se folosesc patru tipuri de eşantionări
1 Simplu randomizat
2 Sistematic
3 Stratificat
4 Cluster (icircn cuiburi)
1 Eşantionul simplu randomizat Fiecare element din populaţia ţintă are o şansă egală non zero de a fi
inclus icircn eşantion Se ia la icircntacircmplare un număr de elemente egal cu talia eşantionului Dezavantajul acestui tip
de eşantionare este că presupune cunoaşterea icircntregii populaţii ţintă
2 Eşantionul sistematic După aflarea taliei eşantionului şi a populaţiei ţintă se calculează factorul de
eşantionare k icircmpărţind talia populaţiei ţintă la volumul eşantionului Apoi fiecare al k-lea element este
selectat spre includere
Acelaşi mare dezavantaj apare şi icircn acest caz fiind obligatorie cunoaşterea icircntregii populaţii de studiu
3 Eşantionul stratificat Există icircn cele mai multe cazuri probleme medicale care studiindu-se pe eşantion
prezintă variabilităţi icircn funcţie de caracteristicile populaţiei (sex vacircrstă nivel de pregătire etc) Icircn acest caz
este obligatorie realizarea similitudinii demografice a eşantionului cu populaţia de studiu Din date provenite
de la Centrul de Statistică putem dezvolta ca procente o structură a populaţiei Această structură trebuie să se
regăsească (procentual) şi icircntre membrii eşantionului O importantă şansă ca reprezentativitatea calitativă să fie
corectă este conferită de respectarea
acestei similitudini demografice
10
4 Eşantionul bdquoclusterrdquo sau icircn cuiburi Icircn cazul unui studiu amplu cu scop de a investiga populaţia unei
icircntregi ţări sau regiuni putem ajunge icircn imposibilitatea de a alege şi mai ales investiga indivizi răspacircndiţi prin
icircntreaga zonă Din acest motiv se desemnează la icircntacircmplare un număr calculabil de
grupuri populaţionale extinse icircn toată zona de studiu Aceste grupuri poartă numele de bdquocuiburirdquo La nivelul
fiecărui bdquocuibrdquo se aplică o tehnică precedentă de selecţie a cazurilor Se poate sau de cele mai multe ori se face
la nivel de bdquocuibrdquo stratificarea iar apoi selecţia propriu-zisă se realizează sistematic sau simplu randomizat
Este metoda de eşantionare cel mai frecvent utilizată icircn cercetarea medicală de amploare Pentru ca eventualele
erori să nu se poată strecura s-a definit şi un indice DEF (design effect) cu care trebuie multiplicată talia
selecţiei care pentru eşantionarea icircn bdquocuiburirdquo este egal cu 2 astfel putem obţine şi o reprezentativitate
calitativă dar şi una cantitativă
Eşantionarea nonprobabilistică este o metodă neindicată icircn studiile medicale datorită lipsei de forţă icircn ceea ce
priveşte posibilitatea de aplicare a concluziilor asupra populaţiei de studiu
Se definesc şi icircn acest caz patru metode
1 Eşantion de convenienţă Membrii unui astfel de eşantion sunt aleşi numai pentru că sunt la icircndemacircnă
disponibili de a răspunde le un eventual chestionar
2 Eşantion pe cote Similar cu tipul de eşantion stratificat se referă la faptul că selecţia se face formacircnd
eşantionul din primele 30 de persoane care respectă un criteriu impus
3 Eşantion cu un scop Elementele incluse icircn eşantion sunt alese după un criteriu care exclude din start marea
majoritate a populaţiei
4 Eşantion raţional Selecţia se face prin prisma unui raţionament al celui care conduce studiul
Parametru şi estimator
Parametrul este o valoare de obicei necunoscută (şi care trebuie să fie estimată prin studiu) folosită pentru a
reprezenta o anumită caracteristică a populaţiei de studiu De exemplu media populaţiei (icircnălţime) este un
parametru populaţional Raportat la o populaţie parametrul este o valoare fixă şi exactă care nu variază
Fiecare eşantion extras din populaţie va indica o valoare a mediei care nu poate decacirct să estimeze parametrul
Icircn general parametrii sunt notaţi cu litere greceşti (ex Media = μ)
Estimatorul este o valoare calculată dintr-un eşantion studiat Este folosit pentru a putea aprecia parametrul
populaţional pe care icircn căutăm Este de asemenea posibil ca dintr-o populaţie să formăm mai multe eşantioane
mediile lor de cele mai multe ori nefiind identice icircntre ele şi nici identice cu media populaţiei Estimatorii
sunt notaţi cu litere latine (ex Media = μ)
Dacă valoarea mediei calculată pe eşantion este de exemplu 168 cm atunci putem estima ca valoarea mediei
icircn populaţie este 168 cm
11
Tipuri de culegere a datelor
1 Culegere de tip eşantion reprezentativ Grupul de indivizi incluşi icircn studiu sunt reprezentativi (calitativ şi
cantitativ) pentru populaţia generală Poate fi utilizat pentru studii descriptive (cel mai frecvent) dar uneori şi
pentru studii analitice
Este necesar pentru acest tip de culegere a datelor ca iniţial să fie cunoscută talia eşantionului (calculabilă icircn
funcţie de prevalenţă şi precizie) Pentru evaluarea datelor culese se utilizează tabelul de contingenţă 2 x 2
astfel (Figura 1)
Figura 1 - Tabelul de contingenţă 2 x 2
Unde
a ndash persoane expuse unui factor de risc care au boala studiată
b ndash persoane expuse unui factor de risc care nu au boala studiată
c - persoane neexpuse unui factor de risc care au boala studiată
d - persoane neexpuse unui factor de risc care nu au boala studiată
După aranjarea datelor icircn tabelul de contingenţă (2 x 2) se poate icircncepe analiza statistică a datelor atacirct ca
procente calculabile cacirct şi din punct de vedere a aplicării de teste statistice pentru elucidarea semnificaţiei
statistice
Este posibilă din acest tip de culegere de date calcularea
1 Prevalenţei unei boli
2 Frecvenţei expunerii
3 Gradul de asociere icircntre factorul eventual de risc şi boala
2 Culegerea de tip expus ndash neexpus Icircmparte subiecţii icircn două categorii expuşi sau neexpuşi factorului de risc
studiat Ca evoluţie următoare a studiului după o astfel de culegere a datelor se poate evalua icircn timp apariţia
icircmbolnăvirii despre care se efectuează studiul Icircn timp longitudinal prospectiv se poate calcula dacă factorul
studiat reprezintă un risc de icircmbolnăvire este indiferent sau chiar este cu efect protectiv Numărul subiecţilor
din cele două grupuri poate fi egal sau poate fi diferit Numărul acestora poate fi calculat icircn vederea obţinerii
unei bune reprezentativităţi cu ajutorul formulelor de selecţie Avacircnd icircn vedere calitatea longitudinală a
12
studiului este important ca numărul ales să fie mai mare pentru a putea suplinii eventualele pierderi din
urmărire Practic rezultatele sunt introduse icircn tabelul 2 x 2 de unde se pot calcula indicatorii doriţi (Figura 2)
Avacircnd icircn vedere modul de culegere a datelor este permisă calcularea de indicatori numai pe orizontală
orice comparare icircntre coloana dreaptă şi stacircngă fiind incorectă Avantajul acestui tip de culegere a datelor ar fi
eventualul număr mai redus de subiecţi dar dezavantajul major este cel al costurilor de urmărire icircn timp dar
trebuie luată icircn calcul şi pierderea de subiecţi din evidenţe Factorul controlat este deci prezenţa expunerii iar
factorul aleator este prezenţa bolii
Figura 2 Tabelul de contingenţă pentru tipul de culegere expus ndash neexpus
4 Culegerea de tip caz ndash martor Icircn acest caz ceea ce ghidează colectarea datelor este prezenţa sau absenţa
bolii icircn momentul prezent Se vor culege date de la două loturi constituite după criteriul de bolnav B+ şi de fără
boală B+ Datele culese sunt icircn trecut deci caracterul datelor va fi retrospectiv Icircn acest caz factorul controlat
este boala factorul aleator fiind expunerea (Figura 3)
Calculul de indicatori icircn acest caz se va putea efectua numai icircntre coloane orice calcul icircntre valorile de pe linii
fiind greşit Rezultate semnificative se pot obţine icircn acest caz utilizacircnd loturi mai mici de studiu prin
comparaţie cu tipul eşantion reprezentativ permiţacircnd icircn acelaşi timp studiul bolilor rare (cu prevalenţă mică)
Figura 3 Tabelul de contingenţă pentru tipul de culegere caz ndash martor
Metode de culegere a datelor
Metoda aleasă pentru culegerea datelor trebuie să fie aleasă după un atent studiu bibliografic icircn vederea
stabilirii celui mai eficient mod de a răspunde temei de studiu
Metodele de culegere trebuie să fie bine aplicabile şi consistente ca aport informaţional necesar
13
1 Fiziologice Sunt colectate date despre anumite caracteristici fiziologice ale pacienţilor (TA glicemie
colesterol etc) Această metodă aduce rezultate obiective cacirct timp instrumentul de evaluare este bine calibrat
şi prezintă variaţii mici
2 Metode observaţionale Instrumentul de culegere a datelor trebuie să fie sincronizat cu protocolul conceput
de cercetător Datele culese trebuie să fie de asemenea consistente adică să fie colectate de aceeaşi manieră
conducătorul studiului trebuind să instruiască investigatorii (colectorii de date) Icircnregistrarea datelor trebuie să
fie de asemenea sistematică şi bine standardizată Observaţii de control trebuie icircn mod obligatoriu făcute
pentru a putea aprecia icircn mod corect orice deviere datorată unor factorii externi Este obligatorie luarea icircn
consideraţie a aspectelor etice
3 Interviul Poate fi structurat cu un set specific de icircntrebări sau nestructurat cu o temă generală cu care se
icircncepe interviul Interviurile pot fi icircnregistrate sau intervievatorul poate nota pur şi simplu răspunsurile Există
două tipuri generice de interviu interviul de profunzime care se referă la o discuţie icircn general structurată cu
un număr de icircntrebări prestabilite icircn icircncăperea de studiu fiind doară intervievatorul şi persoana chestionată şi
interviul de grup unde prin conversaţii pornind de la temă generală expusă şi condusă de intervievator se
obţin date despre subiecţii participanţi la studiu Ambele metode de interviu au indicaţiile lor precise Un
interviu pe teme intime nu va putea fi corect icircn ceea ce priveşte datele colectate dacă se aplică un interviu de
grup
4 Chestionarul Document scris adresat unor persoane pentru a răspunde la una sau mai multe icircntrebări
Trebuie să aducă răspunsurile la icircntrebările care motivează studiul constituind ansamblul icircntrebărilor destinate
culegerii de informaţii (date) Redactarea chestionarului trebuie să ţină cont de structura acestuia introducere
conţinut exprimarea icircntrebărilor grafica chestionarului
5 Icircnregistrări preexistente
Icircn cercetarea medicală sunt cel mai frecvent utilizate Informaţiile dorite sunt deja existente ceea ce icirci revine
cercetătorului este ca să structureze datele icircn funcţie de scopul studiului pe care icircn conduce Aceste surse sunt
bull Foi de observaţie
bull Registre de consultaţie
bull Buletine de analize
bull Registre de operaţii
Icircn cazul icircn care nici o metodă de culegere a datelor nu este pe placul celui ce conduce studiul există
posibilitatea de a construi un instrument nou de culegere a datelor
Acest proces trebuie să urmărească nişte paşi obligatorii fiind mare consumator de timp
bull Definirea structurii cu care se va face măsurarea
bull Formularea itemilor de măsură
bull Analiza validităţii instrumentului de măsură ndash măsoară acesta fenomenul corect
bull Elaborarea de instrucţiuni de utilizare pentru investigatori
14
bull Pretestarea instrumentului
bull Aprecierea validităţii interne şi externe a datelor culese
Instrumente de cercetare
Formularea clară a temei de cercetare necesită o foarte bună definire a factorilor studiaţi şi a criteriilor de
judecată Acestea din urmă sunt ultimele care vor trebui definite icircn cadrul protocolului de studiu
Alegerea unui instrument de măsură
Nu există un instrument de măsură perfect sau universal corect Alegerea sa dintre cele existente şi cele deja
utilizate depind de trei factori
bull Obiectivul studiului
bull Boala studiată
bull Populaţia icircn studiu
De aceste trei elemente trebuie ţinut cont icircn fiecare etapă a dezvoltării instrumentului
Definirea obiectivului
Studiu transversal Dacă se doreşte studierea unui simptom sau a unei caracteristici ale populaţiei se poate
icircmpărţi populaţia de studiu icircn mai multe grupuri Este practic vorba de a determina diferenţele dintre subiecţi
icircn cea ce priveşte o variabilă necesară studiată printr-un studiu transversal (utilizarea dozării de Ac HBS
pentru a evalua progresele bolnavilor de hepatită tip B)
Studiu longitudinal Icircn acest caz nu se poate icircmpărţii populaţia de studiu icircn mai multe grupuri datele obţinute
fiind de la acelaşi subiect colectate după un interval de timp
Icircn funcţie de boală şi populaţie se aleg şi instrumentele de măsură cele mai adecvate
Instrumentele cercetării reprezintă un mecanism specific sau o strategie pe care cercetătorul o utilizează pentru
colectarea prelucrarea şi inferenţa datelor Aceste instrumente sunt
1 Studiul icircn bibliotecă
2 Computerul
3 Determinările experimentale
4 Statistica
5 Mintea umană
6 Facilităţi de limbaj şi comunicare
Determinările experimentale
Măsurarea constă icircn aprecierea şi cuantificarea fenomenelor calitativ sau cantitativ Interpretarea
datelor se referă la transformarea lor icircn unităţi de descoperire a unor fenomene mai puţin cercetate
Standardele acceptate se referă la norme medii distribuţii etc Tot icircn cadrul interpretării datelor datele
obţinute sunt caracterizate pe scale de valori nominal ordinal de interval sau de raport
Validarea şi reproductibilitatea măsurătorilor sunt aspecte importante şi foarte necesare pentru o
cercetare corect fundamentată care doreşte obţinerea unor concluzii pertinente
15
Statistica Este implicată icircn condensarea şi procesarea unui volum mai mare de date astfel icircncacirct să se poată
interpreta corect valorile obţinute şi să se permită comparările Utilizarea unor teste statistice specifice permite
determinarea semnificaţiei (diferenţei) statistice astfel icircncacirct estimatorii să poată fi aplicaţi la populaţia
generală Furnizează informaţii şi privind corelarea sau relaţionarea icircntre date
Mintea umană este cea care reuşeşte să integreze şi să icircnţeleagă rezultatele obţinute Semnificaţia ştiinţifică
este stabilită icircn funcţie de rezultatele statisticii de mintea umană conform afirmaţiei bdquosemnificaţia ştiinţifică
nu este egală cu semnificaţia statisticărdquo Metodele aplicate pentru a putea ajunge la o concluzie pertinentă sunt
logica deductivă raţionamentul inductiv şi gacircndirea critică
Limbaj şi comunicare Exprimarea orală sau icircn scris permite nuanţarea unor aspecte seci cifrice ale unor
studii Icircn acest mod devine mai evidentă semnificaţia ştiinţifică a unor rezultate statistice
34 Prelucrarea datelor
Instrumentele de prelucrare
Statistica este o ştiinţă ramură a matematicii care studiază evoluţia fenomenelor şi proceselor
colective pe baza observării lor ştiinţifice a culegerii şi prelucrării detaliate a informaţiilor statistice cu scopul
de a formula şi explica legile legităţile şi regularităţile ce le guvernează
Statistica permite deci aprecierea unor parametrii populaţionali prin studiul unui număr redus de
elemente ale populaţiei icircn studiu (ţintă) O populaţie poate fi definită printr-un şir de valori care pot fi grupate
icircn funcţie de parametrul studiat (glicemie colesterol TAD TAS etc) Pentru fiecare astfel de şir se defineşte
o variabilă (care va purta nume propriu glicemie colesterol etc) Practic variabila este considerată o funcţie
ia valori posibil diferite de la un element la altul icircn funcţie de caracteristicile proprii acestora Sunt clasificate
icircn două grupe variabile cantitative (caracteristică măsurabilă) şi calitative (caracteristică ce nu poate fi
măsurată)
La racircndul lor variabilele calitative pot fi
bull Nominale ndash grupuri de elemente ce nu pot fi ordonate (culoarea părului)
bull Nominale ordonate ndash concluziile pot fi grupate (eficienţa unui tratament slabă bună foarte bună)
bull Binare ndash apar numai două posibilităţi (bolnav sănătos)
Variabilele cantitative pot fi
bull Continue ndash o variabilă măsurabilă care poate lua o infinitate de valori
bull Discrete ndash variabile care nu pot lua decacirct valori icircntregi
Statistica descriptivă
Există două ramuri ale statisticii statistica descriptivă şi statistica inferenţială
Statistica descriptivă (după cum rezultă din denumire) se ocupă cu descrierea unor valori obţinute ale unei
variabile studiate
16
Valorile pe care variabila le ia se constituie icircntr-o serie statistică Indicatorii care definesc o variabilă (serie)
sunt
1 Ale tendinţei centrale
Media aritmetică - notată de regulă cu
Mediana - este acea valoare din şirul de date care icircmparte icircn două părţi egale şirul ordonat de valori (atenţie
şirul este ordonat crescător) situacircndu-se la mijlocul seriei statistice
Dacă numărul de valori n este un număr impar atunci mediana este valoarea unde
Dacă n este par deci avem un număr par de valori mediana este definitatilde ca fiind
unde k = n2
Modul - constituie valoarea care apare cel mai des deci valoarea cu numărul cel mai mare de apariţii
2 De dispersie
Amplitudinea - este diferenţa dintre valoarea maximă şi cea minimă
A = Amax - Amin
Amplitudinea relativă - notată A este raportul dintre amplitudinea absolută şi media aritmetică a seriei de
date
Varianţa notată este un indicator de icircmprăştiere a datelor Formula de calcul este
Abaterea standard (S) sau deviaţia standard reprezintă rădăcina pătrată din varianţă (dispersie)
Coeficientul de variaţie se calculează ca un raport procentual icircntre abaterea standard şi valoarea medie a şirului
de valori
Eroarea standard intervine icircn estimarea intervalelor de confidenţă Se calculează astfel
17
3 De asimetrie (skewness) indică distribuţia datelor dacă sunt sau nu distribuite normal
4 De boltire (kurtosis) estimează boltirea sau aplatizarea curbei de distribuţie
Prezentarea descriptivă a datelor se face prin icircnregistrarea datelor culese icircn tabele care să reprezinte icircn mod
sintetic valorile măsurate
Icircn concluzie statistica descriptivă permite
bull Stabilirea comparabilităţii icircntre grupurile de studiu şi aprecierea prezenţei erorilor sau confuziei
bull Reprezentarea datelor icircn tabele permite evaluarea fiecărui pacient şi dacă a existat pierderi din studiu
Statistica inferenţială
Statistica inferenţială (inductivă) este partea de analiză a datelor care permite extrapolarea unei
concluzii trase pe baza unui eşantion spre populaţia ţintă pentru care a fost efectuat studiul
Scopul analizei statistice este de a evidenţia efectul unui tratament sau al unui factor de risc prin date obţinute
din eşantionul studiat spre populaţia ţintă Aceasta implică testarea ipotezelor statistice sau altfel spus testarea
semnificaţiei statistice Este una dintre cele mai importante momente ale studiului Cum rezultatele sunt
obţinute prin studiul unui eşantion există posibilitatea ca acestea să fie datorate icircntacircmplării Testele
statistice ne ajută să apreciem icircn ce măsură rezultatele sunt icircntacircmplătoare şi mai ales icircn ce măsură şi dacă se
pot aplica populaţiei generale Icircn acest scop se impune o valoare limită alfa 005 care reprezintă limita
superioară a probabilităţii ca rezultatul obţinut să fie greşit (datorat icircntacircmplării) Astfel icircn funcţie de tipul
variabilelor şi indicatorii descriptivi aplicaţi şi evaluaţi se aplică teste de semnificaţie statistică (Tabelul 1)
Tabelul 1 Alegerea testelor de semnificaţie statistică
Tipul datelor
18
Diferenţierea variabilelor din punctul de vedere a distribuţiei se face folosind testul de normalitate
Kolmogorov ndash Smirnov
Testul statistic reprezintă metoda de comparaţie a două sau mai multe populaţii prin intermediul unor
variabile observate ale lor
Scopul unui test statistic este de a defini realitatea
Definirea icircntrebării de cercetare (ipoteza clinică)
Tratamentul cu Nebivolol este la fel de eficient ca şi cel cu Valsartan icircn tratamentul
hipertensiunii arteriale
Transpunerea icircntrebării de cercetare icircn termeni statistici (ipoteza statistică)
Media tensiunii arteriale a pacienţilor trataţi cu Valsartan nu diferă semnificativ de media
tensiunii arteriale a pacienţilor trataţi cu Nebivolol
Etapele unui test statistic
1 Formularea problemei icircn termenii ipotezelor statistice
2 Alegerea şi calcularea parametrului statistic al testului
3 Regiunea critică
4 Concluzia testului
1 Formularea problemei icircn termenii ipotezelor statistice
Ipoteza nulă ipoteza care trebuie testată testul efectuacircndu-se sub prezumţia că ipoteza nulă ar
fi adevărată
Ipoteza alternativă acea ipoteză care icircntr-un sens sau altul contrazice ipoteza nulă Această
ipoteză se mai numeşte şi ipoteza de lucru
Ipoteza nulă tipuri
O coadă (ldquoone-tailedrdquo sau ldquoone-siderdquo)
Media este mai mare
Media este mai mică
Două cozi (ldquoone-tailedrdquo sau ldquoone-siderdquo)
Media este egală
2 Alegerea şi calcularea parametrului statistic al testului
Parametrul statistic al testului exprimă icircntr-o anumită formă diferenţa dintre elementele comparate
Ţinacircnd seama de faptul că eşantionul sau eşantioanele utilizate sunt aleator extrase din populaţiile care
fac obiectul testului parametrul statistic este o variabilă aleatoare de selecţie care urmează o anumită
lege de probabilitate
Un parametru statistic al testului bun trebuie să icircndeplinească două condiţii
19
Trebuie să se comporte diferit atunci cacircnd ipoteza nulă H0 este adevărată faţă de situaţia icircn
care ipoteza alternativă H1 este adevărată
Distribuţia de probabilitate a parametrului statistic al testului sub prezumţia că H0 este
adevărată este cunoscută
3 Regiunea critică
- Trebuie să fim capabili să decidem icircn funcţie de valoarea parametrului statistic calculat care dintre
ipoteze cea nulă sau cea alternativă este adevărată
- Dacă valoarea parametrului statistic aparţine regiunii critice ipoteza nulă H0 va fi respinsă şi va fi
acceptată ipoteza alternativă H1
- Dacă valoarea parametrului statistic nu aparţine regiunii critice ipoteza nulă H0 va fi acceptată
- Decidem mărimea regiunii critice
Pentru aceasta trebuie să specificăm mărimea riscului de eroare pe care icircl acceptăm
Pe scurt definim nivelul de semnificaţie notat cu a sau mărimea riscului pe care
suntem dispuşi să ni-l asumăm icircn respingerea ipotezei nule H0 icircn cazul icircn care aceasta
este adevărată De obicei se alege un nivel de semnificaţie icircntre 1 şi 5
Probabilitatea unei erori de tipul I
probabilitatea de respingere a ipotezei nule H0 icircn favoarea ipotezei alternative H1 icircn
condiţiile icircn care H0 este adevărată
probabilitatea unei erori de tipul I se notează cu a şi se mai numeşte nivel de
semnificaţie al testului
Probabilitatea unei erori de tipul II
probabilitatea acceptării ipotezei nule icircn condiţiile icircn care ipoteza alternativă H1 este
adevărată
această probabilitate se notează cu b
- Unilaterală la dreapta ndash valoarea parametrului statistic al testului este mai mare sau egală cu
valoarea din dreapta a intervalului critic
- Unilaterală la stacircnga ndash valoarea parametrului statistic al testului este mai mică sau egală cu
valoarea din stacircnga a intervalului critic
- Bilaterală ndash valoarea parametrului statistic al testului este mai mică sau egală cu valoarea extremă
din stacircnga regiunii critice sau mai mare sau egală cu valoarea extremă din dreapta regiunii critice
valorile extreme ale regiunii critice avacircnd nivele egale de semnificaţie
4 Concluzia testului
- Ipoteza nulă H0 este respinsă dacă valoarea parametrului statistic aparţine regiunii critice
20
- Regiunea critică trebuie astfel aleasă icircncacirct dacă ipoteza alternativă H1 este adevărată
probabilitatea de respingere a ipotezei nule H0 este mai mare decacirct icircn cazul icircn care ipoteza nulă H0
ar fi adevărată
- Acceptarea ipotezei nule H0 atunci cacircnd ipoteza alternativă H1 este adevărată este cunoscută ca şi
eroarea de tipul II
a probabilitatea ei se notează cu b
b măsoară bdquonivelul de eroarerdquo
- Icircn testarea oricărei ipoteze statistice există patru situaţii care determină dacă decizia noastră este
corectă sau nu
Cazuri
H0 este adevărată H0 este falsă
Concluzie H0 se acceptă decizie corectă eroare de tipul
II
H0 se
respinge
eroare de tipul I decizie corectă
Luarea deciziei pe baza valorii probabilităţii p de semnificaţie a testului
Icircn momentul icircn care prelucrăm statistic o serie de date dorim să ştim dacă rezultatele obţinute sunt sau
nu semnificative statistic
Răspunsul la această icircntrebare este dat de valoarea lui p calculată de orice program statistic la
prelucrarea unor date
Icircn cazul testelor statistice ipoteza nulă este respinsă dacă nivelul de semnificaţie este mai mic decacirct
005 iar programele de prelucrare statistică a datelor vor afişa o steluţă () icircn tabelul rezultatelor
21
Dacă p le 005 respingem ipoteza nulă şi acceptăm ipoteza alternativă (am obţinut semnificaţia
statistică)
Dacă p gt 005 acceptăm ipoteza nulă (nu am obţinut semnificaţia statistică)
p = 013
NU respingem ipoteza nulă
Risc de eroare de tip II
α = 005
p = 002
Respingem ipoteza nulă
Risc de eroare de tip I
Semnificaţia lui p
Criteriu de luare a deciziei cu privire la o ipoteză statistică nulă
Cuantifică şansa ca o decizie de respingere a ipotezei nule să fie greşită
Măsură a semnificaţiei statistice şi NU CLINICĂ
22
Semnificaţia lui p (reguli empirice)
001 le p lt 005 rezultatul e semnificativ statistic
0001 le p lt 001 rezultatul e icircnalt semnificativ statistic
p lt 0001 rezultatul e foarte icircnalt semnificativ statistic
p ge 005 rezultatul e considerat nesemnificativ statistic
Limite ale valorii p
Valoarea p NU ne dă informaţii despre
Şansa de beneficiu a unui pacient individual
Procentul de pacienţi care vor avea un beneficiu icircn urma instituirii procedurii medicale
Gradul de beneficiu expectat pentru un anumit pacient
Puterea unui test statistic
Este capacitatea de a detecta o diferenţă acolo unde există
Creşterea volumului eşantionului determină creşterea puterii testului statistic aplicat
Valoarea este icircn relaţie directă cu eroarea de tip II
Puterea = 1 ndash β
Cea mai utilizată modalitate de creştere a puterii unui test statistic este de a creşte volumul
eşantionului
Tipul scalei de măsură ndash testul statistic
Denumire test Interval Nominal Observaţii
Corelaţie Pearson 2 0 Există o relaţie liniară
χ2 0 2
Student 1 1 Doar 2 grupuri
ANOVA 1 1 2 sau mai multe grupuri
Student perechi 1 1 Eşantioane perechi
Măsurători repetate (ANOVA) 1 1 Mai mult de 2 grupuri date
perechi
Inferenţa statistică pe date calitativ e
Tabela de contingenţă 2times2
Riscuri şi raţii
Testul χ2 (testarea asocierii icircn tabela de contingenţă)
Testul Fisher
23
Testul z pentru proporţii
Testul McNemar
Tabela de contingenţă 2times2
Scale de tip nominal (dicotomiale tabela de contingenţă de 2times2) sau ordinal (tabela de contingenţă de
rtimesc)
Frecvenţa absolută (numărul de evenimente per categorie)
Tabela de contingenţă de 2times2 4 categorii
AP = adevărat pozitiv
FP = fals pozitiv
FN = fals negativ
AN = adevărat negativ
Ulcer deschis Ulcer vindecat Total
Recurenţă + AP = 1 FP = 5 = 1+5 = 6
Recurenţă - FN = 7 AN = 16 = 7+16 = 23
Total =1+7=8 =5+16=21 29
Riscuri şi raţii Mărimi ale asocierii
Denumire Formula Definiţie
Rata falşilor pozitivi =FP(FP+AN) Probabilitatea unui test fals + (α)
Rata falşilor negativi =FN(FN+AP) Probabilitatea unui test fals ndash (β)
Sensibilitate =AP(AP+FN) Probabilitatea unui test real + (1- β)
Specificitate =AN(AN+FP) Probabilitatea unui test real ndash (1- α)
Acurateţe =(AP+AN)n Probabilitatea generală a unei decizii corecte
Valoarea predictivă pozitivă =AP(AP+FP) Probabilitatea ca un test pozitiv să fie corect
Valoarea predictivă negativă =AN(AN+FN) Probabilitatea ca un test negativ să fie corect
Riscul relativ =AP(FP+AN)FN(AP+FP)
Rata şansei =(AP∙AN)(FN∙FP)
Riscul atribuabil =AP(AP+FP)-FN(FN+AN)
24
Denumire Formula
Rata falşilor pozitivi = 5(5+1) = 08334
Rata falşilor negativi = 7(7+16) = 03043
Sensibilitate = 1(1+7) = 01250
Specificitate = 16(16+5) = 07619
Acurateţe = (1+16)29 = 05862
Valoarea predictivă pozitivă = 1(1+5) = 01667
Valoarea predictivă negativă = 16(16+7) = 06957
Riscul relativ = 1(5+16)7(1+5) = 2142 = 050
Rata şansei = (1∙16)(7∙5) = 04571
Riscul atribuabil = 1(1+5)-7(7+16) = 01667-03043=-01376
Testarea asocierii icircn tabela de contingenţă
Testul χ2
Nu trebuie utilizat pentru eşantioane de volum mic
Testul este valid doar dacă valoarea expectată (aşteptată) pentru fiecare celulă este cel puţin
egală cu 1 şi frecvenţa absolută observată este de minim 5
Dacă aceste condiţii nu sunt icircndeplinite se aplică testul exact al lui Fisher (Fisherrsquos Exact Test)
Indică dacă cele două variabile sunt sau nu independente DAR NU cuantifică puterea asocierii
dintre ele
Problema S-a investigat icircntr-un studiu asocierea dintre obezitatea (ca factor de risc) şi bolile
cardio-vasculare la persoanele icircn etate (gt 60 ani) Din totalul de 620 persoane investigate s-au
identificat 150 persoane cu obezitate şi boală cardio-vasculară 230 persoane fără obezitate şi
fără boală cardio-vasculară şi 60 persoane fără obezitate dar cu boală cardio-vasculară Există
o asociere icircntre obezitate şi boala cardio-vasculară (df=1 α=005 χ2critic = 384)
Testul χ2 exemplu
H025
Nu există asociere icircntre obezitate şi bolile cardio-vasculare
Obezitatea şi bolile cardio-vasculare sunt independente
H1
Există asociere icircntre obezitate şi bolile cardio-vasculare
Obezitatea şi bolile cardio-vasculare sunt asociate
a = 005 pragul de semnificaţie al testului
urmează o lege cu (r-1)(c-1) grade de libertate
χ2 = parametrul testului χ2
fio = frecvenţa observată
fit = frecvenţa teoretică
Regiunea critică este [χα2 yen)
Pentru α = 005 χα2 = 384
OBSERVAT BCV+ BCV- Total
Obezitate + AP = 150 FP = 180 330
Obezitate - FN = 60 AN = 230 290
Total 210 410 620
TEORETIC BCV+ BCV- Total
Obezitate + = 330times210620 = 330times410620 330
Obezitate - = 290times210620 = 290times410620 290
Total 210 410 620
TEORETIC BCV+ BCV- Total
Obezitate + = 330times210620 = 330times410620 330
26
Obezitate - = 290times210620 = 290times410620 290
Total 210 410 620
TEORETIC BCV+ BCV-
Obezitate + = 112 = 218
Obezitate - = 98 = 192
Deoarece 4177Icirc[384 yen) se respinge H0 cu un risc de eroare de 5
Există asociere icircntre obezitate şi bolile cardio-vasculare
Testul Fisher
Corecţie a testului χ2
Valoarea p asociată parametrului ne dă probabilitatea ca valoarea observată de independenţă să fie
atribuită doar şansei
O valoare p mică indică că există alte cauze decacirct şansa influenţează rezultatul şi astfel cele două
variabile investigate nu sunt independente
Testul Fisher = dispersia corectată a factorului x dispersia corectată a factorilor reziduali
Icircn acest context regula adunării dispersiilor se poate scrie unde
este variaţia lui y pe seama variaţiei variabilei x
este variaţia lui y pe seama influenţei factorilor reziduali (neicircnregistraţi)
este variaţia totală a caracteristicii y
Testul Fisher empiric se calculează după formula
27
se compară cu Ftab pentru nx şi nz grade de libertate la un anumit prag de semnificaţie stabilit
Dacă Fc gt Ftab rezultă că variaţia factorului de grupare x este semnificativă pentru variaţia caracteristicii y
Testul z pentru proporţii
1 Compararea unei frecvenţe observate cu o frecvenţă teoretică
2 Testarea egalităţii a două frecvenţe
Testul z Compararea unei frecvenţe observate cu o frecvenţă teoretică
Scop Investigarea semnificaţiei diferenţei icircntre o frecvenţă teoretică p (icircntr-o populaţie) şi o frecvenţă
observată f pe un eşantion reprezentativ (variabilă calitativă (binare))
Condiţii de aplicare Testul este corect aplicat dacă numărul n al observaţiilor eşantionului este
suficient de mare (n∙p n∙(1-p)gt10
Parametrul
n = volumul eşantionului
Suntem interesaţi de investigarea prevalenţei hepatitei B la personalul care lucrează icircn laboratoarele
clinicilor de boli infecţioase din Transilvania Se ştie din studii anterioare că prevalenţa hepatitei B icircn
populaţia generală din Transilvania este de 9 S-a luat icircn studiu un eşantion de 100 persoane şi s-a
obţinut o prevalenţă a hepatitei B de 6 Există diferenţă semnificativă icircntre frecvenţa hepatitei B la
personalul care lucrează icircn laboratoarele spitalelor de boli infecţioase din Transilvania faţă de
populaţia generală
f = 006 p = 009 n = 100
Ipoteza nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat
faţă de frecvenţa hepatitei B icircn populaţia generală
Ipoteza alternativă test bilateral Există diferenţă semnificativă icircntre frecvenţa hepatitei B la
nivelul eşantionului şi prevalenţa hepatitei B icircn populaţia generală
f = 006 p = 009 n = 100
Pragul de semnificaţie a = 005
Regiunea critică test bilateral (-yen -196 ]Egrave[196 yen)
28
Concluzia testului
Deoarece parametrul statistic calculat al testului nu aparţine regiunii critice se acceptă ipoteza
nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat faţă de
frecvenţa hepatitei B icircn populaţia generală
Testul McNemar
Evaluarea dependenţei variabilelor calitative perechi (dorim să determinăm dacă o anumită
caracteristică este sau nu asociată cu o anumită patologie)
Identificăm n pacienţi care prezintă patologia de interes (eg Cancer bronho-pulmonar) şi n
pacienţi cu aceleaşi caracteristici ca şi primul grup dar care nu o prezintă
Martor = da Martor = nu
Caz = da a b
Caz = nu c d
Testul McNemar - exemplu fumat vs cancer
Martor = da Martor = nu
Cancer = da a = 2 b = 5
Cancer = nu c = 0 d = 3
29
χ2critic(α=005) = 384
32 lt 384 rarr acceptăm ipoteza nulă
Fumatul nu este icircn relaţie cu apariţia cancerului bronho-pulmonar
Inferenţa statistică pe date cantitative
Variabile cantitative continue
Testul z şi Student (t) (o medie sau medii perechi)
Testul z şi Student (t) (testarea a două medii)
ANOVA (ge 3 medii)
Ranguri (variabile cantitative discrete sau cantitative care nu icircndeplinesc condiţia de
normalitate)
Testul sumei rangurilor Wilcoxon
Kruskal-Wallis (ge 3 eşantioane independente)
Friedman (ge 3 eşantioane dependente)
Teste de normalitate variabile cantitative continue
Shapiro-Wilk
Kolmogorov-Smirnov
Shapiro-Wilk
Chi-Square Goodness-of-Fit
Dacă datele urmează o distribuţie normală aplicăm un test parametric
Dacă datele nu urmează o distribuţie normală aplicăm un test de comparare al rangurilor
30
Testul Z de comparare a mediei unui eşantion cu media unei populaţii
Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ
extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie
s2 care se cunoaşte
Condiţii de aplicare
1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru
compararea mediei unui eşantion cu media unei populaţii)
2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal
distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă
3 Talia eşantionului este mare ( ge 30)
Ipoteze
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media
eşantionului şi media populaţiei
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
(-yen -196 ] Egrave [196 yen)
Parametrul testului
n = volumul eşantionului
= media eşantionului
s = deviaţia standard a populaţiei
Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)
Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard
cunoscută
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi
media standard
Condiţii de aplicare
Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se
realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această
condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea
31
Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai
puternic
Numărul de grade de libertate (df) df = n-1
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
Parametrul testului
n = volumul eşantionului
micro0 = media standard
= media eşantionului
s = deviaţia standard a eşantionului
Testul ANOVA compararea mediilor a mai multe eşantioane
H0 = toate mediile sunt egale
H1 = nu toate mediile sunt egale
Condiţii de aplicare
1 Datele sunt independente unele faţă de celelalte
2 Datele fiecărui grup sunt normal distribuite
3 Deviaţia standard este aceeaşi pentru toate grupurile
Id Medicament
A B C D E F
1 5 6 7 10 5 9
2 6 8 8 11 8 8
3 7 7 9 13 6 7
4 8 9 11 12 4 5
32
5 9 10 10 9 7 6
Suma 35 40 45 55 30 35
Media 7 8 9 11 6 7
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =
= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)
Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2
F = (suma pătratelor(icircntre))(suma pătratelor(icircn))
Suma pătratelor (icircntre) = 16times5 = 80
Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60
Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn
interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare
SP df Media pătratelor F = MPicircntreMPicircn
Icircntre 80 5 = 805 = 16 = 1625 = 64
Icircn 60 24 = 6024 = 25
Total 140 29 -
Testul sumei rangurilor Wilcoxon
Aplicat pentru
Un set de observaţii provenite dintr-o valoare ipotetică comună
Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)
Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero
Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace
Suma rangurilor pentru diferenţele negative = 2+3+1 = 6
Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30
33
Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului
egal cu 8 = 0109
Icircnainte După Diferenţa Rang
64 66 -2 2
66 58 8 5
67 68 -1 3
71 65 6 4
72 75 -3 1
76 67 9 6
78 59 19 8
89 74 15 7
Testul Kruskal-Wallis (ge 3 eşantioane independente)
Test de ranguri aplicate pe mai mult de 3 eşantioane
H = parametrul testului
n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)
Tk = suma rangurilor
Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie
pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni
34
df = k-1 (k = numărul de eşantioane)
df = 3-1 = 2
Hcritic(α=005) = 599
H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie
pozitivă şi respectiv biopsie negativă
Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie
a tipului de studiu pe eşantioane perechi)
1 Definirea numărului de tratamente k
2 Obţinerea rangurilor pentru fiecare tratament
3 Sumarea rangurilor fiecărui tratament
4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)
5 Dacă Fr gt Frcritic rarr respingem H0
Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost
măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi
n = 9 k = 3 T12 = 225 T2
2 = 38025 T32 = 38025
Frcritic = 599
Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de
prostată
35
De reţinut
Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei
Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-
of-Fit
Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z
Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t
Compararea mediilor a 3 sau mai multe eşantioane ANOVA
Compararea mediilor a două populaţii (σ) testul Z
Compararea mediilor a două eşantioane (s) testul t
Compararea mediilor a două eşantioane perechi (s) testul t
ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi
cu cel pentru compararea a două eşantioane perechi
Ranguri
Distribuţia datelor nu are importanţă
Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)
Trei sau mai multe eşantioane Kruskal-Wallis
Trei sau mai multe eşantioane perechi Friedman
Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia
Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a
datelor)
Variabile nominale
Un singur eşantion sau eşantioane perechi
Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte
Eşantioane perechi testul Mc Nemar
Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2
Icircn analiza proporţiilor există teste diferite pentru
Compararea unei frecvenţe cu o frecvenţă cunoscută
Compararea a două frecvenţe
Semnificaţia statistică
Valoarea p (p value)
Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor
două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E
posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării
aleatorii
36
Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală
urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii
Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este
probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un
experiment de dimensiunea acestuia
Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că
diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii
diferite
Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca
fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă
ar fi fost adevărată
Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă
1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe
baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De
fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001
2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie
3 Se aplică testul statistic aferent pentru a calcula valoarea p
4 Se compară valoarea p cu valoarea ndash prag
5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe
semnificativă dpdv statisticrdquo
6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e
semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să
conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă
Teste de semnificaţie
Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului
populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)
Testarea ipotezelor implică posibile erori
Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile
sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui
grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul
icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005
ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există
37
nici o diferenţă
Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ
statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de
ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost
ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau
dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă
cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă
semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe
ipotetice variate icircn cazul icircn care ele există
Măsuri ale frecvenţei
Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)
Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate
Generic formula pe care se bazează toate cele trei este
unde x şi y sunt cantităţile de comparat
Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea
unei frecvenţe pe grupe de sex vacircrstă etc
Proporţia implică icircn mod necesar ca x să fie inclus icircn y
Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară
frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp
Pentru calcularea unei rate trebuie ţinut cont de trei aspecte
bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin
bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp
bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo
Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un
tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei
populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei
aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)
38
Indicatori
Rata de incidenţă
Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă
icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii
Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o
perioadă de timp
Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de
timp x
Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei
susceptibili de a dezvolta icircmbolnăvirea studiată
Numitorul poate fi
bull Numărul mediu al populaţiei icircn perioada de timp studiată
bull Mărimea populaţiei icircn mijlocul perioadei de studiu
bull Mărimea populaţiei la icircnceputul studiului
Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă
Este obligatorie menţionarea perioadei de timp
Prevalenţa
Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la
un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă
schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa
momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)
39
Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include
numai cazuri noi respectiv include cazuri noi şi vechi
Rata de atac
Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este
folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp
raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori
Rata persoană-timp
Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din
momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte
migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost
observate
Riscul relativ (RR)
Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment
legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele
prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două
grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la
bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la
bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai
mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo
Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2
Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn
cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă
(Tabelul 1)
Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR
Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la
neexpuşi
40
Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de
culegere a datelor
Odds ratio (OR)
Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin
raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general
studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)
Tabelul 2 Tabelul 2 x 2 pentru calcularea OR
Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală
Rate de mortalitate
Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp
specificată Există mai multe tipuri de rate de mortalitate
o Mortalitate specifică pe sex
o Mortalitate specifică pe rasă
o Mortalitate specifică pe boală
o Mortalitate neonatală
o Mortalitate postneonatală
o Mortalitate infantilă
o Mortalitate maternă
Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP
41
Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de
viaţă şi vacircrsta la care survine decesul dacă este prematur
Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu
Ani de viaţă pierduţi datorat dizabilităţii
Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt
utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru
cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite
grupuri
Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de
risc şi o boală se folosesc riscul relativ şi odds ratio
35 Analiza şi interpretarea datelor
După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date
trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul
Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor
colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului
studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu
plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde
prezenţa biostatisticianului este necesară
Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu
elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat
iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului
iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate
depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori
testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere
clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza
Interpretarea rezultatelor statistice
Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne
motive (număr mic de date) acceptarea ei să fie falsă
Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine
gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia
ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument
de decizie Intervalul de confidenţă
42
Interpretarea statistica ne interpretarea clinică
Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă
Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice
obţinute pe eşantionul studiat
Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare
Ce interpretăm Rezultatele
personale obţinute icircn urma studiului
care au fost prezentate icircn secţiunea bdquoRezultaterdquo
Explicăm rezultatele obţinute
Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale
Interpretarea trebuie să se realizeze icircn
lumina limitelor studiului
contextul cultural social şi educaţional al locului unde s-a realizat cercetarea
contextul a ceea ce se cunoaşte din literatura de specialitate
Interpretăm doar rezultatele personale obţinute icircn urma studiului
Interpretarea statistică nu este tot una cu interpretarea clinică
Interpretarea statistică este importantă
Interpretarea clinică este foarte importantă
Intervalul de confidenţă
Media calculată pe baza unui eşantion nu va echivala media populaţiei
Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului
Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a
populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a
populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)
pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru
orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare
dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de
confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de
date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de
5
Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel
Dacă valoarea p este mică
Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare
aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o
medie diferită Diferenţa este semnificativă dpdv statistic
43
Icircn continuare
Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa
reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică
pentru a fi interesante din punct de vedere ştiinţific
Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC
oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care
este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a
obţine o concluzie clară
Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o
diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că
datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din
punct de vedere ştiinţific
Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul
detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat
Erorile studiilor medicale
Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura
anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară
caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea
asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri
legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias
Erorile potenţiale icircn studiile epidemiologice
1 Erori icircntacircmplătoare
2 Erori sistematice
3 Confuzia
4 Validitatea
1 Erori icircntacircmplătoare
Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a
parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel
de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot
fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii
(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor
de măsură (eroarea de măsurare)
44
2 Erori sistematice
Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate
care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu
acurateţe mare Acurateţea nu este afectată de mărimea eşantionului
Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de
experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea
dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus
şi greu de cuantificat (consum de alcool personalitate etc)
Principalele tipuri de erori din această categorie sunt
bull Biasul de selecţie
bull Biasul de informaţie
Biasul de selecţie
Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul
trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion
inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale
persoanelor incluse
Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se
ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia
Biasul de informaţie
Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de
instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze
expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere
nesemnificativă sau chiar să nu şi-o amintească de loc
3 Confuzia
Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune
prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este
cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă
de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte
important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor
protector
4 Validitatea
Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă
Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte
estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional
Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă
45
conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se
demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)
Validitatea externă se poate realiza numai dacă studiul este valid intern
Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii
studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de
studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt
laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi
validă din punct de vedere intern)
3 6 Prezentarea rezultatelor
După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite
Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor
icircntr-o formă bdquodigerabilărdquo este necesară
Scopul prezentării datelor
1 Transmiterea concluziilor studiului
a Datele corecte şi importante merită comunicate
b Datele trebuie să confirme sau să infirme ipoteza studiului
c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală
2 Acordarea posibilităţii altor cercetători să aprecieze studiul
a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti
b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor
prezentate
Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru
fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie
statistică
Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de
valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras
(Tabel 3)
Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)
46
Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct
numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor
precum şi prezentarea acestora sub formă inteligibilă
Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care
convin cercetătorului
Prezentarea datelor se poate face
1 Figuri şi tabele icircn articole scrise
2 Figuri şi tabele icircn prezentări orale
3 Figuri şi tabele icircn postere
4 Text scris sau incluse icircn text
5 Site-uri de WEB
Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor
Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie
Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele
exprimacircnd exact ceea ce acestea exprimă
Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate
anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel
să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se
acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca
mai sus sugestive sunt formatele simple şi puţin icircncărcate
Dacă nu există reguli impuse se respectă
1 Mesaj simplu fără falsificarea datelor
2 De obicei este necesar atacirct tabelul cacirct şi graficul
3 Să fie simplu şi clar
Tabele
Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile
coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică
elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de
1 Se folosesc doar linii orizontale
2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn
evidenţi prin linie de separare (Tabelul 4)
Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland
Noua Zeelandă)
(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)
47
3 Numerele sunt aliniate icircn funcţie de virgulă
4 Indicii statistici sunt explicaţi sub tabel
5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană
6 Abrevierile pot fi folosite
7 Numărul de zecimale trebuie limitat la maxim două
8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel
9 Plasarea legendei este obligatorie sub tabel
10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)
Icircn cazul prezentărilor orale sau a posterelor este indicat ca
1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării
2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte
3 Folosirea de simboluri este permisă
Clasificarea tabelelor
Tabelele se clasifică după
i) conţinut
bull cu distribuţii de frecvenţe
bull de clase de frecvenţe
bull de contingenţă
ii) structura
bull cu doua coloane
bull cu subclasificări
bull ldquomasterrdquo
Tabele ce conţin distribuţii de frecvenţe
O modalitate comodă de a prezenta o mulţime de date brute este
1 Se ordonează datele in ordine crescătoare
2 Se determine frecvenţa fiecărei valori
3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane
(Tabelul 5)
Tabelul 5 Distribuţii de frecvenţă absolută
48
Tabelul claselor de frecvenţe
1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă
2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)
Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)
Tabele de contingenţă
1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a
tabelelor de contingenţă
2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a
combinaţiilor de perechi ordonate de valori
3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre
a factor de risc si
b starea sănătăţii
4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)
5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)
Tabelul 7 Tabel de contingenţă 2 x 2
49
Grafice
Există două categorii de moduri grafice sub care se pot prezenta datele
1 Ilustraţii şi fotografii
2 Grafice
1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă
pentru lucrare
2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit
Putem vorbi despre mai multe tipuri de grafice
bull Grafice pentru reprezentarea datelor cantitative
1048707 Grafic cartezian (X Y)
1048707 Histograma
1048707 Poligonul de frecvenţe
1048707 Diagrama bdquoscatterrdquo
bull Grafice pentru reprezentarea datelor calitative
1048707 Grafic cu bare
1048707 Diagrama tip bdquoboxplotrdquo
1048707 Diagrama bdquopierdquo
1048707 Cartograma
Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi
dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)
Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)
Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie
Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)
Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)
50
Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir
de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele
două variabile studiate (Figura 6)
Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2
(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2
rămacircne aproximativ constantă)
Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea
comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea
comparativă a mai multor variabile
Figura 7 Grafic calitativ cu bare
51
Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo
Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două
posibilităţi reprezentate grafic este mai frecventă (Figura 8)
Figura 8 Reprezentare tip bdquopierdquo
Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli
sau a oricărui element comparativ Se foloseşte de epidemiologi
Rezultate
Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare
Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o
manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu
explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția
bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la
ilustraţii tabele grafice
Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi
nici rezultatele care invalidează eventual ipoteza
Discuţii
Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd
cultura ştiinţifică şi inteligenţa autorilor
Acest capitol răspunde la trei obiective
Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia
calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de
selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează
rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv
52
este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn
care a fost abordată problema fără a face o revistă a literaturii
Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea
rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul
Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor
afirmaţii nesusţinute de conţinutul lucrării
Concluzii
Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate
să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie
Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de
concluzii va scădea valoarea lucrării
Bibliografia (lista referinţelor citarea icircn text)
Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn
lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente
Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli
- să conţină cele mai importante şi recente lucrări
- să includă numai lucrări publicate
- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate
Bibliografie
Elisabeta Jaba ndash Statistică Ed Economică 1998
Mihai Ţarcă ndash Statistică volI Ed UAIC 1979
Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale
Ed University Press 2009
Sorana Daniela Bolboacă ndash Metodologia cercetării curs
53
2 Tipul de studiu Cititorul trebuie să recunoască planul de studiul pentru a verifica dacă tipul de studiu este
adaptat icircntrebării puse Va merge progresiv cu urmărirea de la raportul de caz-seria de cazuri la studiul
transversal studiul caz-control studiul de cohortă şi trialul controlat
3 Factorii studiaţi (variabila independentă) pot fi factori de expunere sau de intervenţie Cititorul trebuie să
poată recunoaşte factorul să aprecieze cum a fost măsurat dacă s-a folosit aceeaşi metodă de măsurare pentru
loturile icircn studiu ce metodă de comparaţie s-a folosit dacă sunt erori (factor de confuzie)
4 Criteriul de raţionament este evenimentul sau situaţia presupusă a fi rezultatul factorului studiat boala
decesul supravieţuirea complicaţiile etc Definirea precisă şi metoda de măsurare a rezultatului expunerii va
permite cititorului să aprecieze validitatea informaţiilor
5 Populaţia studiată (eşantionul) Se va urmări dacă este definită populaţia de referinţă şi populaţia de
studiat analizacircndu-se corectitudinea selecţiei randomizarea proporţia de subiecţi la sfacircrşitul studiului
validitatea externă a rezultatelor
6 Analiza datelor Cititorul trebuie să aprecieze dacă s-au examinat toate erorile inclusiv factorul de confuzie
dacă nu validitatea studiului ar putea fi compromisă
7 Rezultatele Principalele aspecte pe care cititorul le va urmări la acest capitol sunt dacă ele se datoresc
numai şansei dacă s-a făcut calculul statistic dacă s-a apreciat relaţia expunere-efect (RR OR RA) dacă a
fost apreciată semnificaţia clinică sau biologică care nu este identică cu semnificaţia statistică
8 Sinteza lecturii critice analizează concluziile autorilor dacă ele răspund icircntrebărilor formulate la icircnceputul
studiului dacă rezultatele sunt aplicabile la populaţia studiată dacă rezultatele sunt acceptabile pentru practica
proprie a cititorului dacă rezultatele justifică vreo schimbare icircn practica clinică respectiv vor ameliora starea
pacienţilor Această abordare cere cititorului cunoaşterea noţiunilor de bază icircn metodologia cercetării
ştiinţifice fiind vorba icircn acelaşi timp şi de un demers clinic
c) A treia etapă icircn cercetarea bibliografică constă icircn combinarea datelor din mai multe studii referitoare la
acelaşi subiect şi care se realizează prin meta-analiză Tehnica meta-analizei permite să se sporească
eficacitatea testării ipotezelor să crească forţa statistică a rezultatelor şi să se obţină informaţii care nu pot fi
convenabil extrase din fiecare cercetare
Definirea fenomenului
Definirea fenomenului se bazează pe
bull Cunoaşterea prealabilă a problemei prin documentare riguroasă documentare care poate justifica pertinenţa
temei propuse (revista literaturii de specialitate)
Icircn prima etapă se cercetează bibliografia propriu-zisă adică se identifică publicaţiile care se referă la subiectul
icircn discuţie apoi se vor selecta publicaţiile necesare studiului apreciind validitatea lor (problemele de
documentare bibliografică vor constitui un capitol separat)
bull Formularea unei ipoteze ştiinţifice sub-etapă care reprezintă fondul problemei
6
Ipoteza este o afirmaţie (nu o icircntrebare) despre o posibilă relaţie icircntre factorii studiaţi şi criteriile de
raţionament Ipoteza poate fi ipoteză ldquonulărdquo - nu există această relaţie şi ldquoalternativărdquo - există relaţia Ipoteza
va trebui apoi dovedită sau respinsă testul statistic calculează probabilitatea conform căreia asociaţia observată
este reală sau ea survine din icircntacircmplare
bull Motivarea organizării studiului Trebuie făcută o motivare corectă legată de inexistenţa unor studii
referitoare la problema pe care o va dezbate studiul
Formularea temei de studiu
Pentru formularea temei de studiu trebuiesc menţionate obiectivul sau obiectivele şi tipul de studiu ales pentru
cercetarea respectivă Există icircn general patru tipuri de obiective
bull obiective care se referă la evoluţia şi prognosticul unei icircmbolnăviri obiective prin care se icircncearcă
icircnţelegerea şi cunoaşterea unor evenimente ce pot să apară la un pacient pe parcursul bolii
bull obiective care se referă la etiologia bolii (cauze de natură bacteriană virală parazitară) sau la cauzalitate
(relaţia factor de risc-boală)
bull obiective legate de performanţa unor teste de diagnostic sau de screening de evaluare a strategiei de
diagnostic sau de interpretare a unui test
bull obiective care se referă la impactul unei intervenţii evaluarea unei intervenţii terapeutice de depistare a unor
boli de prevenţie de educare pentru sănătate
Obiectivele unui studiu se icircmpart icircn obiectivul major unul din cele patru enumerate şi obiective
secundare care pot aborda şi alte fenomene biologice decacirct cel major cu condiţia să nu altereze realizarea
acestuia Alegerea tipului de studiu este stracircns legată de obiectivul ales Dacă obiectivul este descrierea
distribuţiei caracteristicilor unei populaţii aprecierea frecvenţei unui fenomen de sănătate analiza acelui
fenomen icircn funcţie de timp loc persoană se va alege un studiu epidemiologic descriptiv studiu care nu are o
ipoteză fixată anterior O ipoteză se poate formula ca rezultat al studiului descriptiv dar nu se va face
verificarea ei icircn cadrul studiului Dacă intenţia studiului este de a emite o judecată asupra unei posibile relaţii
icircntre factorii studiaţi atunci problema de cercetat este fundamentată de o ipoteză care trebuie verificată
dovedită iar studiul care realizează acest lucru respectiv limitele studiilor utilizate
Aspectele manageriale
Aspectele manageriale includ
bull justificarea bugetului estimarea sumei necesară realizării studiului și apreciarea durate studiului
bull defalcarea bugetului pe necesități legate de achziționare de aparatură reactanți truse etc pentru personal
(munca depusă pregătire deplasări icircn teren participări la congrese sau conferințe documentare) materiale
consumabile etc
7
32 Elaborarea proiectului
Protocolul de cercetare este un document care emite obiectivul și ipoteza studiului definește condițiile de
desfășurare și realizare a viitorului studiu clinic Elaborarea protocolului este importantă pentru cercetătorii
participanţi la studiu comisiile de etică şi finanţatori
Protocolul include mai multe formulare care trebuie să cuprindă
a) Titlul proiectului
b) Sumarul proiectului
c) Descrierea proiectului
d) Normele deontologice de cercetare
e) Modalitățile de diseminarea și valorificarea rezultatelor
f) Perspective de continuare a cercetării
g) Anexe
Prezentarea proiectului va include următoarele fișiere
bull resursele umane (membrii echipei afilierea acestora)
bull relevanța temei pentru dezvoltarea cunoașterii icircn domeniu
bull stadiul actual al cunoașterii și bibliografia aferentă
bull justificarea studiului
bull enunțarea obiectivelor și ipoteza de lucru
bull metodologia propriu-zisă
Referitor la metodologia utilizată vor trebui menționate
bull factorulfactorii studiați care reprezintă variabila independentă respectiv dacă este cazul modalitățile de
măsurare
bull criteriile de raționament- variabila dependentă (situația sau evenimentul ce se presupune a fi rezultatul
factorului studiat cum ar fi boala handicapul complicații decesul)
bull tipul de studiu care se va aplica icircmpreună cu design-ul acestuia
bull eșantioanele de lucru și modalitățile de eșantionaj
bull metodele de culegere și de prelucrare a datelor
bull planificarea activităților
bull structura bugetului fiind eligibile următoarele categorii de cheltuieli de capital (echipamente software
upgrading) pentru personal (full sau part-time instruire asigurări de sănătate) de informare (documentare
abonamente) mobilități (vizite la alte unități de cercetare participări la
congrese) materiale consumabile (truse reactanți papetărie) valorificare a rezultatelor (lucrări științifice de
etapă sau lucrarea finală) cheltuieli indirecte (de regie)
bull modalităţile de valorificare a rezultatelor
bull legături de alte proiecte
8
Protocolul mai conține anexe curriculum vitae al investigatorului principal și al coinvestigatorilor
calendarul activităților avizul Comisiei de etică documente speciale și
consimțămacircntul informat icircn cazul studiilor pe subiecți umani
Icircnainte de implementare protocolul va fi verificat de experți pentru eligibilitate (dacă sunt icircndeplinite
condițiile de acceptare finanțare) calitate și pertinență icircn sensul că protocolul trebuie să fie clar exprimat
corect icircntocmit bine așezat și cu repercursiuni favorabile pentru viitor
33 Culegerea informaţiei
Pentru a realiza o cercetare medicală culegerea datelor este prima etapă şi realizează icircn funcţie de
obiectivele propuse tipul studiului timpul disponibil şi resurse umane şi financiare
Există două mari posibilităţi de culegere
bull Icircn funcţie de elementele studiate
o Culegerea exaustivă Toţi subiecţii populaţiei pe care dorim să o studiem Greu de realizat din cauza
costurilor foarte mari sau a alterării populaţiei de studiu
o Prin eşantionare Este metoda folosită icircn studii medicale
bull Icircn funcţie de durata culegerii
o Transversală Se studiază un grup la un moment dat
o Longitudinală Extinsă in timp
- Retrospectivă ndash icircnregistrări medicale
- Prospectivă ndash date culese la intervale prestabilite de timp
Populaţia ţintă
Este orice colectivitate icircntreagă de oameni animale plante sau obiecte de la care putem colecta date Populaţia
ţintă este icircntregul grup care ne interesează pe care dorim să-l descriem sau să tragem concluzii despre el
Pentru a putea realiza generalizări spre populaţia ţintă deseori suntem obligaţi să folosim un eşantion (selecţie)
care icircnsă trebuie să fie reprezentativ pentru populaţia pe care vrem să o studiem Pentru fiecare populaţie de
studiu sunt posibile mai multe eşantioane Pe baza acestor eşantioane se calculează un estimator Pe baza
acestui estimator calculat care poate fi medie aritmetică procent etc se pot trage concluzii despre icircntreaga
populaţie Este foarte important ca investigatorul să definească foarte atent şi complet populaţia icircnainte de a
realiza eşantionul inclusiv descrierea criteriilor de includere şi excludere icircn populaţia de studiu
Eşantionul
Un eşantion este practic un grup de elemente selectate dintr-un grup mai extins (populaţia ţintă) Studiind
eşantionul selectat se pot trage concluzii despre grupul de unde a fost ales (populaţia ţintă)
Este icircn general ales pentru studiu pentru că
bull Populaţia ţintă este prea mare şi nu poate fi studiată ca icircntreg
bull Nu avem acces din diverse motive decacirct la parte din populaţia de studiu
9
bull Un studiu pe icircntreaga populaţie poate distruge populaţia
bull Eşantioanele pot fi studiate mai rapid
bull Costul şi resursele necesare studiului sunt mai reduse
Numărul elementelor dintr-un eşantion se numeşte talia sau volumul selecţiei
Acesta fiind icircn general mai mic decacirct icircntreaga populaţie poate fi observat icircn detaliu iar dacă este reprezentativ
se pot afla prin intermediul său proprietăţile populaţiei ţintă
Eşantionul trebuie să fie reprezentativ pentru populaţia generală De aceea dintre metodele de eşantionare se
folosesc tehnicile de randomizare Trebuie să satisfacă două condiţii principale
bull condiţie de ordin cantitativ talia să fie suficient de mare
bull condiţie de ordin calitativ trebuie extras aleator din populaţia ţintă
Metode de eşantionare
Putem vorbi icircn linii mari de două posibilităţi de eşantionare prin metode probabilistice şi prin metode
nonprobabilistice
Eşantionarea probabilistică este metoda cea mai folosită icircn studiile medicale fiind şi cea indicată pentru a
realiza reprezentativitatea calitativă
Icircn medicină se folosesc patru tipuri de eşantionări
1 Simplu randomizat
2 Sistematic
3 Stratificat
4 Cluster (icircn cuiburi)
1 Eşantionul simplu randomizat Fiecare element din populaţia ţintă are o şansă egală non zero de a fi
inclus icircn eşantion Se ia la icircntacircmplare un număr de elemente egal cu talia eşantionului Dezavantajul acestui tip
de eşantionare este că presupune cunoaşterea icircntregii populaţii ţintă
2 Eşantionul sistematic După aflarea taliei eşantionului şi a populaţiei ţintă se calculează factorul de
eşantionare k icircmpărţind talia populaţiei ţintă la volumul eşantionului Apoi fiecare al k-lea element este
selectat spre includere
Acelaşi mare dezavantaj apare şi icircn acest caz fiind obligatorie cunoaşterea icircntregii populaţii de studiu
3 Eşantionul stratificat Există icircn cele mai multe cazuri probleme medicale care studiindu-se pe eşantion
prezintă variabilităţi icircn funcţie de caracteristicile populaţiei (sex vacircrstă nivel de pregătire etc) Icircn acest caz
este obligatorie realizarea similitudinii demografice a eşantionului cu populaţia de studiu Din date provenite
de la Centrul de Statistică putem dezvolta ca procente o structură a populaţiei Această structură trebuie să se
regăsească (procentual) şi icircntre membrii eşantionului O importantă şansă ca reprezentativitatea calitativă să fie
corectă este conferită de respectarea
acestei similitudini demografice
10
4 Eşantionul bdquoclusterrdquo sau icircn cuiburi Icircn cazul unui studiu amplu cu scop de a investiga populaţia unei
icircntregi ţări sau regiuni putem ajunge icircn imposibilitatea de a alege şi mai ales investiga indivizi răspacircndiţi prin
icircntreaga zonă Din acest motiv se desemnează la icircntacircmplare un număr calculabil de
grupuri populaţionale extinse icircn toată zona de studiu Aceste grupuri poartă numele de bdquocuiburirdquo La nivelul
fiecărui bdquocuibrdquo se aplică o tehnică precedentă de selecţie a cazurilor Se poate sau de cele mai multe ori se face
la nivel de bdquocuibrdquo stratificarea iar apoi selecţia propriu-zisă se realizează sistematic sau simplu randomizat
Este metoda de eşantionare cel mai frecvent utilizată icircn cercetarea medicală de amploare Pentru ca eventualele
erori să nu se poată strecura s-a definit şi un indice DEF (design effect) cu care trebuie multiplicată talia
selecţiei care pentru eşantionarea icircn bdquocuiburirdquo este egal cu 2 astfel putem obţine şi o reprezentativitate
calitativă dar şi una cantitativă
Eşantionarea nonprobabilistică este o metodă neindicată icircn studiile medicale datorită lipsei de forţă icircn ceea ce
priveşte posibilitatea de aplicare a concluziilor asupra populaţiei de studiu
Se definesc şi icircn acest caz patru metode
1 Eşantion de convenienţă Membrii unui astfel de eşantion sunt aleşi numai pentru că sunt la icircndemacircnă
disponibili de a răspunde le un eventual chestionar
2 Eşantion pe cote Similar cu tipul de eşantion stratificat se referă la faptul că selecţia se face formacircnd
eşantionul din primele 30 de persoane care respectă un criteriu impus
3 Eşantion cu un scop Elementele incluse icircn eşantion sunt alese după un criteriu care exclude din start marea
majoritate a populaţiei
4 Eşantion raţional Selecţia se face prin prisma unui raţionament al celui care conduce studiul
Parametru şi estimator
Parametrul este o valoare de obicei necunoscută (şi care trebuie să fie estimată prin studiu) folosită pentru a
reprezenta o anumită caracteristică a populaţiei de studiu De exemplu media populaţiei (icircnălţime) este un
parametru populaţional Raportat la o populaţie parametrul este o valoare fixă şi exactă care nu variază
Fiecare eşantion extras din populaţie va indica o valoare a mediei care nu poate decacirct să estimeze parametrul
Icircn general parametrii sunt notaţi cu litere greceşti (ex Media = μ)
Estimatorul este o valoare calculată dintr-un eşantion studiat Este folosit pentru a putea aprecia parametrul
populaţional pe care icircn căutăm Este de asemenea posibil ca dintr-o populaţie să formăm mai multe eşantioane
mediile lor de cele mai multe ori nefiind identice icircntre ele şi nici identice cu media populaţiei Estimatorii
sunt notaţi cu litere latine (ex Media = μ)
Dacă valoarea mediei calculată pe eşantion este de exemplu 168 cm atunci putem estima ca valoarea mediei
icircn populaţie este 168 cm
11
Tipuri de culegere a datelor
1 Culegere de tip eşantion reprezentativ Grupul de indivizi incluşi icircn studiu sunt reprezentativi (calitativ şi
cantitativ) pentru populaţia generală Poate fi utilizat pentru studii descriptive (cel mai frecvent) dar uneori şi
pentru studii analitice
Este necesar pentru acest tip de culegere a datelor ca iniţial să fie cunoscută talia eşantionului (calculabilă icircn
funcţie de prevalenţă şi precizie) Pentru evaluarea datelor culese se utilizează tabelul de contingenţă 2 x 2
astfel (Figura 1)
Figura 1 - Tabelul de contingenţă 2 x 2
Unde
a ndash persoane expuse unui factor de risc care au boala studiată
b ndash persoane expuse unui factor de risc care nu au boala studiată
c - persoane neexpuse unui factor de risc care au boala studiată
d - persoane neexpuse unui factor de risc care nu au boala studiată
După aranjarea datelor icircn tabelul de contingenţă (2 x 2) se poate icircncepe analiza statistică a datelor atacirct ca
procente calculabile cacirct şi din punct de vedere a aplicării de teste statistice pentru elucidarea semnificaţiei
statistice
Este posibilă din acest tip de culegere de date calcularea
1 Prevalenţei unei boli
2 Frecvenţei expunerii
3 Gradul de asociere icircntre factorul eventual de risc şi boala
2 Culegerea de tip expus ndash neexpus Icircmparte subiecţii icircn două categorii expuşi sau neexpuşi factorului de risc
studiat Ca evoluţie următoare a studiului după o astfel de culegere a datelor se poate evalua icircn timp apariţia
icircmbolnăvirii despre care se efectuează studiul Icircn timp longitudinal prospectiv se poate calcula dacă factorul
studiat reprezintă un risc de icircmbolnăvire este indiferent sau chiar este cu efect protectiv Numărul subiecţilor
din cele două grupuri poate fi egal sau poate fi diferit Numărul acestora poate fi calculat icircn vederea obţinerii
unei bune reprezentativităţi cu ajutorul formulelor de selecţie Avacircnd icircn vedere calitatea longitudinală a
12
studiului este important ca numărul ales să fie mai mare pentru a putea suplinii eventualele pierderi din
urmărire Practic rezultatele sunt introduse icircn tabelul 2 x 2 de unde se pot calcula indicatorii doriţi (Figura 2)
Avacircnd icircn vedere modul de culegere a datelor este permisă calcularea de indicatori numai pe orizontală
orice comparare icircntre coloana dreaptă şi stacircngă fiind incorectă Avantajul acestui tip de culegere a datelor ar fi
eventualul număr mai redus de subiecţi dar dezavantajul major este cel al costurilor de urmărire icircn timp dar
trebuie luată icircn calcul şi pierderea de subiecţi din evidenţe Factorul controlat este deci prezenţa expunerii iar
factorul aleator este prezenţa bolii
Figura 2 Tabelul de contingenţă pentru tipul de culegere expus ndash neexpus
4 Culegerea de tip caz ndash martor Icircn acest caz ceea ce ghidează colectarea datelor este prezenţa sau absenţa
bolii icircn momentul prezent Se vor culege date de la două loturi constituite după criteriul de bolnav B+ şi de fără
boală B+ Datele culese sunt icircn trecut deci caracterul datelor va fi retrospectiv Icircn acest caz factorul controlat
este boala factorul aleator fiind expunerea (Figura 3)
Calculul de indicatori icircn acest caz se va putea efectua numai icircntre coloane orice calcul icircntre valorile de pe linii
fiind greşit Rezultate semnificative se pot obţine icircn acest caz utilizacircnd loturi mai mici de studiu prin
comparaţie cu tipul eşantion reprezentativ permiţacircnd icircn acelaşi timp studiul bolilor rare (cu prevalenţă mică)
Figura 3 Tabelul de contingenţă pentru tipul de culegere caz ndash martor
Metode de culegere a datelor
Metoda aleasă pentru culegerea datelor trebuie să fie aleasă după un atent studiu bibliografic icircn vederea
stabilirii celui mai eficient mod de a răspunde temei de studiu
Metodele de culegere trebuie să fie bine aplicabile şi consistente ca aport informaţional necesar
13
1 Fiziologice Sunt colectate date despre anumite caracteristici fiziologice ale pacienţilor (TA glicemie
colesterol etc) Această metodă aduce rezultate obiective cacirct timp instrumentul de evaluare este bine calibrat
şi prezintă variaţii mici
2 Metode observaţionale Instrumentul de culegere a datelor trebuie să fie sincronizat cu protocolul conceput
de cercetător Datele culese trebuie să fie de asemenea consistente adică să fie colectate de aceeaşi manieră
conducătorul studiului trebuind să instruiască investigatorii (colectorii de date) Icircnregistrarea datelor trebuie să
fie de asemenea sistematică şi bine standardizată Observaţii de control trebuie icircn mod obligatoriu făcute
pentru a putea aprecia icircn mod corect orice deviere datorată unor factorii externi Este obligatorie luarea icircn
consideraţie a aspectelor etice
3 Interviul Poate fi structurat cu un set specific de icircntrebări sau nestructurat cu o temă generală cu care se
icircncepe interviul Interviurile pot fi icircnregistrate sau intervievatorul poate nota pur şi simplu răspunsurile Există
două tipuri generice de interviu interviul de profunzime care se referă la o discuţie icircn general structurată cu
un număr de icircntrebări prestabilite icircn icircncăperea de studiu fiind doară intervievatorul şi persoana chestionată şi
interviul de grup unde prin conversaţii pornind de la temă generală expusă şi condusă de intervievator se
obţin date despre subiecţii participanţi la studiu Ambele metode de interviu au indicaţiile lor precise Un
interviu pe teme intime nu va putea fi corect icircn ceea ce priveşte datele colectate dacă se aplică un interviu de
grup
4 Chestionarul Document scris adresat unor persoane pentru a răspunde la una sau mai multe icircntrebări
Trebuie să aducă răspunsurile la icircntrebările care motivează studiul constituind ansamblul icircntrebărilor destinate
culegerii de informaţii (date) Redactarea chestionarului trebuie să ţină cont de structura acestuia introducere
conţinut exprimarea icircntrebărilor grafica chestionarului
5 Icircnregistrări preexistente
Icircn cercetarea medicală sunt cel mai frecvent utilizate Informaţiile dorite sunt deja existente ceea ce icirci revine
cercetătorului este ca să structureze datele icircn funcţie de scopul studiului pe care icircn conduce Aceste surse sunt
bull Foi de observaţie
bull Registre de consultaţie
bull Buletine de analize
bull Registre de operaţii
Icircn cazul icircn care nici o metodă de culegere a datelor nu este pe placul celui ce conduce studiul există
posibilitatea de a construi un instrument nou de culegere a datelor
Acest proces trebuie să urmărească nişte paşi obligatorii fiind mare consumator de timp
bull Definirea structurii cu care se va face măsurarea
bull Formularea itemilor de măsură
bull Analiza validităţii instrumentului de măsură ndash măsoară acesta fenomenul corect
bull Elaborarea de instrucţiuni de utilizare pentru investigatori
14
bull Pretestarea instrumentului
bull Aprecierea validităţii interne şi externe a datelor culese
Instrumente de cercetare
Formularea clară a temei de cercetare necesită o foarte bună definire a factorilor studiaţi şi a criteriilor de
judecată Acestea din urmă sunt ultimele care vor trebui definite icircn cadrul protocolului de studiu
Alegerea unui instrument de măsură
Nu există un instrument de măsură perfect sau universal corect Alegerea sa dintre cele existente şi cele deja
utilizate depind de trei factori
bull Obiectivul studiului
bull Boala studiată
bull Populaţia icircn studiu
De aceste trei elemente trebuie ţinut cont icircn fiecare etapă a dezvoltării instrumentului
Definirea obiectivului
Studiu transversal Dacă se doreşte studierea unui simptom sau a unei caracteristici ale populaţiei se poate
icircmpărţi populaţia de studiu icircn mai multe grupuri Este practic vorba de a determina diferenţele dintre subiecţi
icircn cea ce priveşte o variabilă necesară studiată printr-un studiu transversal (utilizarea dozării de Ac HBS
pentru a evalua progresele bolnavilor de hepatită tip B)
Studiu longitudinal Icircn acest caz nu se poate icircmpărţii populaţia de studiu icircn mai multe grupuri datele obţinute
fiind de la acelaşi subiect colectate după un interval de timp
Icircn funcţie de boală şi populaţie se aleg şi instrumentele de măsură cele mai adecvate
Instrumentele cercetării reprezintă un mecanism specific sau o strategie pe care cercetătorul o utilizează pentru
colectarea prelucrarea şi inferenţa datelor Aceste instrumente sunt
1 Studiul icircn bibliotecă
2 Computerul
3 Determinările experimentale
4 Statistica
5 Mintea umană
6 Facilităţi de limbaj şi comunicare
Determinările experimentale
Măsurarea constă icircn aprecierea şi cuantificarea fenomenelor calitativ sau cantitativ Interpretarea
datelor se referă la transformarea lor icircn unităţi de descoperire a unor fenomene mai puţin cercetate
Standardele acceptate se referă la norme medii distribuţii etc Tot icircn cadrul interpretării datelor datele
obţinute sunt caracterizate pe scale de valori nominal ordinal de interval sau de raport
Validarea şi reproductibilitatea măsurătorilor sunt aspecte importante şi foarte necesare pentru o
cercetare corect fundamentată care doreşte obţinerea unor concluzii pertinente
15
Statistica Este implicată icircn condensarea şi procesarea unui volum mai mare de date astfel icircncacirct să se poată
interpreta corect valorile obţinute şi să se permită comparările Utilizarea unor teste statistice specifice permite
determinarea semnificaţiei (diferenţei) statistice astfel icircncacirct estimatorii să poată fi aplicaţi la populaţia
generală Furnizează informaţii şi privind corelarea sau relaţionarea icircntre date
Mintea umană este cea care reuşeşte să integreze şi să icircnţeleagă rezultatele obţinute Semnificaţia ştiinţifică
este stabilită icircn funcţie de rezultatele statisticii de mintea umană conform afirmaţiei bdquosemnificaţia ştiinţifică
nu este egală cu semnificaţia statisticărdquo Metodele aplicate pentru a putea ajunge la o concluzie pertinentă sunt
logica deductivă raţionamentul inductiv şi gacircndirea critică
Limbaj şi comunicare Exprimarea orală sau icircn scris permite nuanţarea unor aspecte seci cifrice ale unor
studii Icircn acest mod devine mai evidentă semnificaţia ştiinţifică a unor rezultate statistice
34 Prelucrarea datelor
Instrumentele de prelucrare
Statistica este o ştiinţă ramură a matematicii care studiază evoluţia fenomenelor şi proceselor
colective pe baza observării lor ştiinţifice a culegerii şi prelucrării detaliate a informaţiilor statistice cu scopul
de a formula şi explica legile legităţile şi regularităţile ce le guvernează
Statistica permite deci aprecierea unor parametrii populaţionali prin studiul unui număr redus de
elemente ale populaţiei icircn studiu (ţintă) O populaţie poate fi definită printr-un şir de valori care pot fi grupate
icircn funcţie de parametrul studiat (glicemie colesterol TAD TAS etc) Pentru fiecare astfel de şir se defineşte
o variabilă (care va purta nume propriu glicemie colesterol etc) Practic variabila este considerată o funcţie
ia valori posibil diferite de la un element la altul icircn funcţie de caracteristicile proprii acestora Sunt clasificate
icircn două grupe variabile cantitative (caracteristică măsurabilă) şi calitative (caracteristică ce nu poate fi
măsurată)
La racircndul lor variabilele calitative pot fi
bull Nominale ndash grupuri de elemente ce nu pot fi ordonate (culoarea părului)
bull Nominale ordonate ndash concluziile pot fi grupate (eficienţa unui tratament slabă bună foarte bună)
bull Binare ndash apar numai două posibilităţi (bolnav sănătos)
Variabilele cantitative pot fi
bull Continue ndash o variabilă măsurabilă care poate lua o infinitate de valori
bull Discrete ndash variabile care nu pot lua decacirct valori icircntregi
Statistica descriptivă
Există două ramuri ale statisticii statistica descriptivă şi statistica inferenţială
Statistica descriptivă (după cum rezultă din denumire) se ocupă cu descrierea unor valori obţinute ale unei
variabile studiate
16
Valorile pe care variabila le ia se constituie icircntr-o serie statistică Indicatorii care definesc o variabilă (serie)
sunt
1 Ale tendinţei centrale
Media aritmetică - notată de regulă cu
Mediana - este acea valoare din şirul de date care icircmparte icircn două părţi egale şirul ordonat de valori (atenţie
şirul este ordonat crescător) situacircndu-se la mijlocul seriei statistice
Dacă numărul de valori n este un număr impar atunci mediana este valoarea unde
Dacă n este par deci avem un număr par de valori mediana este definitatilde ca fiind
unde k = n2
Modul - constituie valoarea care apare cel mai des deci valoarea cu numărul cel mai mare de apariţii
2 De dispersie
Amplitudinea - este diferenţa dintre valoarea maximă şi cea minimă
A = Amax - Amin
Amplitudinea relativă - notată A este raportul dintre amplitudinea absolută şi media aritmetică a seriei de
date
Varianţa notată este un indicator de icircmprăştiere a datelor Formula de calcul este
Abaterea standard (S) sau deviaţia standard reprezintă rădăcina pătrată din varianţă (dispersie)
Coeficientul de variaţie se calculează ca un raport procentual icircntre abaterea standard şi valoarea medie a şirului
de valori
Eroarea standard intervine icircn estimarea intervalelor de confidenţă Se calculează astfel
17
3 De asimetrie (skewness) indică distribuţia datelor dacă sunt sau nu distribuite normal
4 De boltire (kurtosis) estimează boltirea sau aplatizarea curbei de distribuţie
Prezentarea descriptivă a datelor se face prin icircnregistrarea datelor culese icircn tabele care să reprezinte icircn mod
sintetic valorile măsurate
Icircn concluzie statistica descriptivă permite
bull Stabilirea comparabilităţii icircntre grupurile de studiu şi aprecierea prezenţei erorilor sau confuziei
bull Reprezentarea datelor icircn tabele permite evaluarea fiecărui pacient şi dacă a existat pierderi din studiu
Statistica inferenţială
Statistica inferenţială (inductivă) este partea de analiză a datelor care permite extrapolarea unei
concluzii trase pe baza unui eşantion spre populaţia ţintă pentru care a fost efectuat studiul
Scopul analizei statistice este de a evidenţia efectul unui tratament sau al unui factor de risc prin date obţinute
din eşantionul studiat spre populaţia ţintă Aceasta implică testarea ipotezelor statistice sau altfel spus testarea
semnificaţiei statistice Este una dintre cele mai importante momente ale studiului Cum rezultatele sunt
obţinute prin studiul unui eşantion există posibilitatea ca acestea să fie datorate icircntacircmplării Testele
statistice ne ajută să apreciem icircn ce măsură rezultatele sunt icircntacircmplătoare şi mai ales icircn ce măsură şi dacă se
pot aplica populaţiei generale Icircn acest scop se impune o valoare limită alfa 005 care reprezintă limita
superioară a probabilităţii ca rezultatul obţinut să fie greşit (datorat icircntacircmplării) Astfel icircn funcţie de tipul
variabilelor şi indicatorii descriptivi aplicaţi şi evaluaţi se aplică teste de semnificaţie statistică (Tabelul 1)
Tabelul 1 Alegerea testelor de semnificaţie statistică
Tipul datelor
18
Diferenţierea variabilelor din punctul de vedere a distribuţiei se face folosind testul de normalitate
Kolmogorov ndash Smirnov
Testul statistic reprezintă metoda de comparaţie a două sau mai multe populaţii prin intermediul unor
variabile observate ale lor
Scopul unui test statistic este de a defini realitatea
Definirea icircntrebării de cercetare (ipoteza clinică)
Tratamentul cu Nebivolol este la fel de eficient ca şi cel cu Valsartan icircn tratamentul
hipertensiunii arteriale
Transpunerea icircntrebării de cercetare icircn termeni statistici (ipoteza statistică)
Media tensiunii arteriale a pacienţilor trataţi cu Valsartan nu diferă semnificativ de media
tensiunii arteriale a pacienţilor trataţi cu Nebivolol
Etapele unui test statistic
1 Formularea problemei icircn termenii ipotezelor statistice
2 Alegerea şi calcularea parametrului statistic al testului
3 Regiunea critică
4 Concluzia testului
1 Formularea problemei icircn termenii ipotezelor statistice
Ipoteza nulă ipoteza care trebuie testată testul efectuacircndu-se sub prezumţia că ipoteza nulă ar
fi adevărată
Ipoteza alternativă acea ipoteză care icircntr-un sens sau altul contrazice ipoteza nulă Această
ipoteză se mai numeşte şi ipoteza de lucru
Ipoteza nulă tipuri
O coadă (ldquoone-tailedrdquo sau ldquoone-siderdquo)
Media este mai mare
Media este mai mică
Două cozi (ldquoone-tailedrdquo sau ldquoone-siderdquo)
Media este egală
2 Alegerea şi calcularea parametrului statistic al testului
Parametrul statistic al testului exprimă icircntr-o anumită formă diferenţa dintre elementele comparate
Ţinacircnd seama de faptul că eşantionul sau eşantioanele utilizate sunt aleator extrase din populaţiile care
fac obiectul testului parametrul statistic este o variabilă aleatoare de selecţie care urmează o anumită
lege de probabilitate
Un parametru statistic al testului bun trebuie să icircndeplinească două condiţii
19
Trebuie să se comporte diferit atunci cacircnd ipoteza nulă H0 este adevărată faţă de situaţia icircn
care ipoteza alternativă H1 este adevărată
Distribuţia de probabilitate a parametrului statistic al testului sub prezumţia că H0 este
adevărată este cunoscută
3 Regiunea critică
- Trebuie să fim capabili să decidem icircn funcţie de valoarea parametrului statistic calculat care dintre
ipoteze cea nulă sau cea alternativă este adevărată
- Dacă valoarea parametrului statistic aparţine regiunii critice ipoteza nulă H0 va fi respinsă şi va fi
acceptată ipoteza alternativă H1
- Dacă valoarea parametrului statistic nu aparţine regiunii critice ipoteza nulă H0 va fi acceptată
- Decidem mărimea regiunii critice
Pentru aceasta trebuie să specificăm mărimea riscului de eroare pe care icircl acceptăm
Pe scurt definim nivelul de semnificaţie notat cu a sau mărimea riscului pe care
suntem dispuşi să ni-l asumăm icircn respingerea ipotezei nule H0 icircn cazul icircn care aceasta
este adevărată De obicei se alege un nivel de semnificaţie icircntre 1 şi 5
Probabilitatea unei erori de tipul I
probabilitatea de respingere a ipotezei nule H0 icircn favoarea ipotezei alternative H1 icircn
condiţiile icircn care H0 este adevărată
probabilitatea unei erori de tipul I se notează cu a şi se mai numeşte nivel de
semnificaţie al testului
Probabilitatea unei erori de tipul II
probabilitatea acceptării ipotezei nule icircn condiţiile icircn care ipoteza alternativă H1 este
adevărată
această probabilitate se notează cu b
- Unilaterală la dreapta ndash valoarea parametrului statistic al testului este mai mare sau egală cu
valoarea din dreapta a intervalului critic
- Unilaterală la stacircnga ndash valoarea parametrului statistic al testului este mai mică sau egală cu
valoarea din stacircnga a intervalului critic
- Bilaterală ndash valoarea parametrului statistic al testului este mai mică sau egală cu valoarea extremă
din stacircnga regiunii critice sau mai mare sau egală cu valoarea extremă din dreapta regiunii critice
valorile extreme ale regiunii critice avacircnd nivele egale de semnificaţie
4 Concluzia testului
- Ipoteza nulă H0 este respinsă dacă valoarea parametrului statistic aparţine regiunii critice
20
- Regiunea critică trebuie astfel aleasă icircncacirct dacă ipoteza alternativă H1 este adevărată
probabilitatea de respingere a ipotezei nule H0 este mai mare decacirct icircn cazul icircn care ipoteza nulă H0
ar fi adevărată
- Acceptarea ipotezei nule H0 atunci cacircnd ipoteza alternativă H1 este adevărată este cunoscută ca şi
eroarea de tipul II
a probabilitatea ei se notează cu b
b măsoară bdquonivelul de eroarerdquo
- Icircn testarea oricărei ipoteze statistice există patru situaţii care determină dacă decizia noastră este
corectă sau nu
Cazuri
H0 este adevărată H0 este falsă
Concluzie H0 se acceptă decizie corectă eroare de tipul
II
H0 se
respinge
eroare de tipul I decizie corectă
Luarea deciziei pe baza valorii probabilităţii p de semnificaţie a testului
Icircn momentul icircn care prelucrăm statistic o serie de date dorim să ştim dacă rezultatele obţinute sunt sau
nu semnificative statistic
Răspunsul la această icircntrebare este dat de valoarea lui p calculată de orice program statistic la
prelucrarea unor date
Icircn cazul testelor statistice ipoteza nulă este respinsă dacă nivelul de semnificaţie este mai mic decacirct
005 iar programele de prelucrare statistică a datelor vor afişa o steluţă () icircn tabelul rezultatelor
21
Dacă p le 005 respingem ipoteza nulă şi acceptăm ipoteza alternativă (am obţinut semnificaţia
statistică)
Dacă p gt 005 acceptăm ipoteza nulă (nu am obţinut semnificaţia statistică)
p = 013
NU respingem ipoteza nulă
Risc de eroare de tip II
α = 005
p = 002
Respingem ipoteza nulă
Risc de eroare de tip I
Semnificaţia lui p
Criteriu de luare a deciziei cu privire la o ipoteză statistică nulă
Cuantifică şansa ca o decizie de respingere a ipotezei nule să fie greşită
Măsură a semnificaţiei statistice şi NU CLINICĂ
22
Semnificaţia lui p (reguli empirice)
001 le p lt 005 rezultatul e semnificativ statistic
0001 le p lt 001 rezultatul e icircnalt semnificativ statistic
p lt 0001 rezultatul e foarte icircnalt semnificativ statistic
p ge 005 rezultatul e considerat nesemnificativ statistic
Limite ale valorii p
Valoarea p NU ne dă informaţii despre
Şansa de beneficiu a unui pacient individual
Procentul de pacienţi care vor avea un beneficiu icircn urma instituirii procedurii medicale
Gradul de beneficiu expectat pentru un anumit pacient
Puterea unui test statistic
Este capacitatea de a detecta o diferenţă acolo unde există
Creşterea volumului eşantionului determină creşterea puterii testului statistic aplicat
Valoarea este icircn relaţie directă cu eroarea de tip II
Puterea = 1 ndash β
Cea mai utilizată modalitate de creştere a puterii unui test statistic este de a creşte volumul
eşantionului
Tipul scalei de măsură ndash testul statistic
Denumire test Interval Nominal Observaţii
Corelaţie Pearson 2 0 Există o relaţie liniară
χ2 0 2
Student 1 1 Doar 2 grupuri
ANOVA 1 1 2 sau mai multe grupuri
Student perechi 1 1 Eşantioane perechi
Măsurători repetate (ANOVA) 1 1 Mai mult de 2 grupuri date
perechi
Inferenţa statistică pe date calitativ e
Tabela de contingenţă 2times2
Riscuri şi raţii
Testul χ2 (testarea asocierii icircn tabela de contingenţă)
Testul Fisher
23
Testul z pentru proporţii
Testul McNemar
Tabela de contingenţă 2times2
Scale de tip nominal (dicotomiale tabela de contingenţă de 2times2) sau ordinal (tabela de contingenţă de
rtimesc)
Frecvenţa absolută (numărul de evenimente per categorie)
Tabela de contingenţă de 2times2 4 categorii
AP = adevărat pozitiv
FP = fals pozitiv
FN = fals negativ
AN = adevărat negativ
Ulcer deschis Ulcer vindecat Total
Recurenţă + AP = 1 FP = 5 = 1+5 = 6
Recurenţă - FN = 7 AN = 16 = 7+16 = 23
Total =1+7=8 =5+16=21 29
Riscuri şi raţii Mărimi ale asocierii
Denumire Formula Definiţie
Rata falşilor pozitivi =FP(FP+AN) Probabilitatea unui test fals + (α)
Rata falşilor negativi =FN(FN+AP) Probabilitatea unui test fals ndash (β)
Sensibilitate =AP(AP+FN) Probabilitatea unui test real + (1- β)
Specificitate =AN(AN+FP) Probabilitatea unui test real ndash (1- α)
Acurateţe =(AP+AN)n Probabilitatea generală a unei decizii corecte
Valoarea predictivă pozitivă =AP(AP+FP) Probabilitatea ca un test pozitiv să fie corect
Valoarea predictivă negativă =AN(AN+FN) Probabilitatea ca un test negativ să fie corect
Riscul relativ =AP(FP+AN)FN(AP+FP)
Rata şansei =(AP∙AN)(FN∙FP)
Riscul atribuabil =AP(AP+FP)-FN(FN+AN)
24
Denumire Formula
Rata falşilor pozitivi = 5(5+1) = 08334
Rata falşilor negativi = 7(7+16) = 03043
Sensibilitate = 1(1+7) = 01250
Specificitate = 16(16+5) = 07619
Acurateţe = (1+16)29 = 05862
Valoarea predictivă pozitivă = 1(1+5) = 01667
Valoarea predictivă negativă = 16(16+7) = 06957
Riscul relativ = 1(5+16)7(1+5) = 2142 = 050
Rata şansei = (1∙16)(7∙5) = 04571
Riscul atribuabil = 1(1+5)-7(7+16) = 01667-03043=-01376
Testarea asocierii icircn tabela de contingenţă
Testul χ2
Nu trebuie utilizat pentru eşantioane de volum mic
Testul este valid doar dacă valoarea expectată (aşteptată) pentru fiecare celulă este cel puţin
egală cu 1 şi frecvenţa absolută observată este de minim 5
Dacă aceste condiţii nu sunt icircndeplinite se aplică testul exact al lui Fisher (Fisherrsquos Exact Test)
Indică dacă cele două variabile sunt sau nu independente DAR NU cuantifică puterea asocierii
dintre ele
Problema S-a investigat icircntr-un studiu asocierea dintre obezitatea (ca factor de risc) şi bolile
cardio-vasculare la persoanele icircn etate (gt 60 ani) Din totalul de 620 persoane investigate s-au
identificat 150 persoane cu obezitate şi boală cardio-vasculară 230 persoane fără obezitate şi
fără boală cardio-vasculară şi 60 persoane fără obezitate dar cu boală cardio-vasculară Există
o asociere icircntre obezitate şi boala cardio-vasculară (df=1 α=005 χ2critic = 384)
Testul χ2 exemplu
H025
Nu există asociere icircntre obezitate şi bolile cardio-vasculare
Obezitatea şi bolile cardio-vasculare sunt independente
H1
Există asociere icircntre obezitate şi bolile cardio-vasculare
Obezitatea şi bolile cardio-vasculare sunt asociate
a = 005 pragul de semnificaţie al testului
urmează o lege cu (r-1)(c-1) grade de libertate
χ2 = parametrul testului χ2
fio = frecvenţa observată
fit = frecvenţa teoretică
Regiunea critică este [χα2 yen)
Pentru α = 005 χα2 = 384
OBSERVAT BCV+ BCV- Total
Obezitate + AP = 150 FP = 180 330
Obezitate - FN = 60 AN = 230 290
Total 210 410 620
TEORETIC BCV+ BCV- Total
Obezitate + = 330times210620 = 330times410620 330
Obezitate - = 290times210620 = 290times410620 290
Total 210 410 620
TEORETIC BCV+ BCV- Total
Obezitate + = 330times210620 = 330times410620 330
26
Obezitate - = 290times210620 = 290times410620 290
Total 210 410 620
TEORETIC BCV+ BCV-
Obezitate + = 112 = 218
Obezitate - = 98 = 192
Deoarece 4177Icirc[384 yen) se respinge H0 cu un risc de eroare de 5
Există asociere icircntre obezitate şi bolile cardio-vasculare
Testul Fisher
Corecţie a testului χ2
Valoarea p asociată parametrului ne dă probabilitatea ca valoarea observată de independenţă să fie
atribuită doar şansei
O valoare p mică indică că există alte cauze decacirct şansa influenţează rezultatul şi astfel cele două
variabile investigate nu sunt independente
Testul Fisher = dispersia corectată a factorului x dispersia corectată a factorilor reziduali
Icircn acest context regula adunării dispersiilor se poate scrie unde
este variaţia lui y pe seama variaţiei variabilei x
este variaţia lui y pe seama influenţei factorilor reziduali (neicircnregistraţi)
este variaţia totală a caracteristicii y
Testul Fisher empiric se calculează după formula
27
se compară cu Ftab pentru nx şi nz grade de libertate la un anumit prag de semnificaţie stabilit
Dacă Fc gt Ftab rezultă că variaţia factorului de grupare x este semnificativă pentru variaţia caracteristicii y
Testul z pentru proporţii
1 Compararea unei frecvenţe observate cu o frecvenţă teoretică
2 Testarea egalităţii a două frecvenţe
Testul z Compararea unei frecvenţe observate cu o frecvenţă teoretică
Scop Investigarea semnificaţiei diferenţei icircntre o frecvenţă teoretică p (icircntr-o populaţie) şi o frecvenţă
observată f pe un eşantion reprezentativ (variabilă calitativă (binare))
Condiţii de aplicare Testul este corect aplicat dacă numărul n al observaţiilor eşantionului este
suficient de mare (n∙p n∙(1-p)gt10
Parametrul
n = volumul eşantionului
Suntem interesaţi de investigarea prevalenţei hepatitei B la personalul care lucrează icircn laboratoarele
clinicilor de boli infecţioase din Transilvania Se ştie din studii anterioare că prevalenţa hepatitei B icircn
populaţia generală din Transilvania este de 9 S-a luat icircn studiu un eşantion de 100 persoane şi s-a
obţinut o prevalenţă a hepatitei B de 6 Există diferenţă semnificativă icircntre frecvenţa hepatitei B la
personalul care lucrează icircn laboratoarele spitalelor de boli infecţioase din Transilvania faţă de
populaţia generală
f = 006 p = 009 n = 100
Ipoteza nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat
faţă de frecvenţa hepatitei B icircn populaţia generală
Ipoteza alternativă test bilateral Există diferenţă semnificativă icircntre frecvenţa hepatitei B la
nivelul eşantionului şi prevalenţa hepatitei B icircn populaţia generală
f = 006 p = 009 n = 100
Pragul de semnificaţie a = 005
Regiunea critică test bilateral (-yen -196 ]Egrave[196 yen)
28
Concluzia testului
Deoarece parametrul statistic calculat al testului nu aparţine regiunii critice se acceptă ipoteza
nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat faţă de
frecvenţa hepatitei B icircn populaţia generală
Testul McNemar
Evaluarea dependenţei variabilelor calitative perechi (dorim să determinăm dacă o anumită
caracteristică este sau nu asociată cu o anumită patologie)
Identificăm n pacienţi care prezintă patologia de interes (eg Cancer bronho-pulmonar) şi n
pacienţi cu aceleaşi caracteristici ca şi primul grup dar care nu o prezintă
Martor = da Martor = nu
Caz = da a b
Caz = nu c d
Testul McNemar - exemplu fumat vs cancer
Martor = da Martor = nu
Cancer = da a = 2 b = 5
Cancer = nu c = 0 d = 3
29
χ2critic(α=005) = 384
32 lt 384 rarr acceptăm ipoteza nulă
Fumatul nu este icircn relaţie cu apariţia cancerului bronho-pulmonar
Inferenţa statistică pe date cantitative
Variabile cantitative continue
Testul z şi Student (t) (o medie sau medii perechi)
Testul z şi Student (t) (testarea a două medii)
ANOVA (ge 3 medii)
Ranguri (variabile cantitative discrete sau cantitative care nu icircndeplinesc condiţia de
normalitate)
Testul sumei rangurilor Wilcoxon
Kruskal-Wallis (ge 3 eşantioane independente)
Friedman (ge 3 eşantioane dependente)
Teste de normalitate variabile cantitative continue
Shapiro-Wilk
Kolmogorov-Smirnov
Shapiro-Wilk
Chi-Square Goodness-of-Fit
Dacă datele urmează o distribuţie normală aplicăm un test parametric
Dacă datele nu urmează o distribuţie normală aplicăm un test de comparare al rangurilor
30
Testul Z de comparare a mediei unui eşantion cu media unei populaţii
Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ
extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie
s2 care se cunoaşte
Condiţii de aplicare
1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru
compararea mediei unui eşantion cu media unei populaţii)
2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal
distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă
3 Talia eşantionului este mare ( ge 30)
Ipoteze
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media
eşantionului şi media populaţiei
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
(-yen -196 ] Egrave [196 yen)
Parametrul testului
n = volumul eşantionului
= media eşantionului
s = deviaţia standard a populaţiei
Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)
Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard
cunoscută
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi
media standard
Condiţii de aplicare
Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se
realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această
condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea
31
Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai
puternic
Numărul de grade de libertate (df) df = n-1
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
Parametrul testului
n = volumul eşantionului
micro0 = media standard
= media eşantionului
s = deviaţia standard a eşantionului
Testul ANOVA compararea mediilor a mai multe eşantioane
H0 = toate mediile sunt egale
H1 = nu toate mediile sunt egale
Condiţii de aplicare
1 Datele sunt independente unele faţă de celelalte
2 Datele fiecărui grup sunt normal distribuite
3 Deviaţia standard este aceeaşi pentru toate grupurile
Id Medicament
A B C D E F
1 5 6 7 10 5 9
2 6 8 8 11 8 8
3 7 7 9 13 6 7
4 8 9 11 12 4 5
32
5 9 10 10 9 7 6
Suma 35 40 45 55 30 35
Media 7 8 9 11 6 7
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =
= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)
Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2
F = (suma pătratelor(icircntre))(suma pătratelor(icircn))
Suma pătratelor (icircntre) = 16times5 = 80
Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60
Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn
interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare
SP df Media pătratelor F = MPicircntreMPicircn
Icircntre 80 5 = 805 = 16 = 1625 = 64
Icircn 60 24 = 6024 = 25
Total 140 29 -
Testul sumei rangurilor Wilcoxon
Aplicat pentru
Un set de observaţii provenite dintr-o valoare ipotetică comună
Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)
Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero
Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace
Suma rangurilor pentru diferenţele negative = 2+3+1 = 6
Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30
33
Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului
egal cu 8 = 0109
Icircnainte După Diferenţa Rang
64 66 -2 2
66 58 8 5
67 68 -1 3
71 65 6 4
72 75 -3 1
76 67 9 6
78 59 19 8
89 74 15 7
Testul Kruskal-Wallis (ge 3 eşantioane independente)
Test de ranguri aplicate pe mai mult de 3 eşantioane
H = parametrul testului
n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)
Tk = suma rangurilor
Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie
pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni
34
df = k-1 (k = numărul de eşantioane)
df = 3-1 = 2
Hcritic(α=005) = 599
H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie
pozitivă şi respectiv biopsie negativă
Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie
a tipului de studiu pe eşantioane perechi)
1 Definirea numărului de tratamente k
2 Obţinerea rangurilor pentru fiecare tratament
3 Sumarea rangurilor fiecărui tratament
4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)
5 Dacă Fr gt Frcritic rarr respingem H0
Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost
măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi
n = 9 k = 3 T12 = 225 T2
2 = 38025 T32 = 38025
Frcritic = 599
Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de
prostată
35
De reţinut
Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei
Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-
of-Fit
Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z
Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t
Compararea mediilor a 3 sau mai multe eşantioane ANOVA
Compararea mediilor a două populaţii (σ) testul Z
Compararea mediilor a două eşantioane (s) testul t
Compararea mediilor a două eşantioane perechi (s) testul t
ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi
cu cel pentru compararea a două eşantioane perechi
Ranguri
Distribuţia datelor nu are importanţă
Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)
Trei sau mai multe eşantioane Kruskal-Wallis
Trei sau mai multe eşantioane perechi Friedman
Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia
Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a
datelor)
Variabile nominale
Un singur eşantion sau eşantioane perechi
Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte
Eşantioane perechi testul Mc Nemar
Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2
Icircn analiza proporţiilor există teste diferite pentru
Compararea unei frecvenţe cu o frecvenţă cunoscută
Compararea a două frecvenţe
Semnificaţia statistică
Valoarea p (p value)
Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor
două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E
posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării
aleatorii
36
Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală
urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii
Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este
probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un
experiment de dimensiunea acestuia
Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că
diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii
diferite
Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca
fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă
ar fi fost adevărată
Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă
1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe
baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De
fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001
2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie
3 Se aplică testul statistic aferent pentru a calcula valoarea p
4 Se compară valoarea p cu valoarea ndash prag
5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe
semnificativă dpdv statisticrdquo
6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e
semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să
conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă
Teste de semnificaţie
Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului
populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)
Testarea ipotezelor implică posibile erori
Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile
sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui
grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul
icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005
ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există
37
nici o diferenţă
Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ
statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de
ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost
ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau
dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă
cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă
semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe
ipotetice variate icircn cazul icircn care ele există
Măsuri ale frecvenţei
Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)
Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate
Generic formula pe care se bazează toate cele trei este
unde x şi y sunt cantităţile de comparat
Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea
unei frecvenţe pe grupe de sex vacircrstă etc
Proporţia implică icircn mod necesar ca x să fie inclus icircn y
Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară
frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp
Pentru calcularea unei rate trebuie ţinut cont de trei aspecte
bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin
bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp
bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo
Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un
tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei
populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei
aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)
38
Indicatori
Rata de incidenţă
Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă
icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii
Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o
perioadă de timp
Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de
timp x
Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei
susceptibili de a dezvolta icircmbolnăvirea studiată
Numitorul poate fi
bull Numărul mediu al populaţiei icircn perioada de timp studiată
bull Mărimea populaţiei icircn mijlocul perioadei de studiu
bull Mărimea populaţiei la icircnceputul studiului
Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă
Este obligatorie menţionarea perioadei de timp
Prevalenţa
Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la
un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă
schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa
momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)
39
Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include
numai cazuri noi respectiv include cazuri noi şi vechi
Rata de atac
Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este
folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp
raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori
Rata persoană-timp
Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din
momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte
migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost
observate
Riscul relativ (RR)
Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment
legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele
prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două
grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la
bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la
bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai
mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo
Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2
Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn
cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă
(Tabelul 1)
Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR
Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la
neexpuşi
40
Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de
culegere a datelor
Odds ratio (OR)
Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin
raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general
studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)
Tabelul 2 Tabelul 2 x 2 pentru calcularea OR
Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală
Rate de mortalitate
Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp
specificată Există mai multe tipuri de rate de mortalitate
o Mortalitate specifică pe sex
o Mortalitate specifică pe rasă
o Mortalitate specifică pe boală
o Mortalitate neonatală
o Mortalitate postneonatală
o Mortalitate infantilă
o Mortalitate maternă
Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP
41
Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de
viaţă şi vacircrsta la care survine decesul dacă este prematur
Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu
Ani de viaţă pierduţi datorat dizabilităţii
Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt
utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru
cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite
grupuri
Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de
risc şi o boală se folosesc riscul relativ şi odds ratio
35 Analiza şi interpretarea datelor
După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date
trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul
Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor
colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului
studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu
plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde
prezenţa biostatisticianului este necesară
Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu
elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat
iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului
iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate
depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori
testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere
clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza
Interpretarea rezultatelor statistice
Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne
motive (număr mic de date) acceptarea ei să fie falsă
Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine
gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia
ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument
de decizie Intervalul de confidenţă
42
Interpretarea statistica ne interpretarea clinică
Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă
Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice
obţinute pe eşantionul studiat
Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare
Ce interpretăm Rezultatele
personale obţinute icircn urma studiului
care au fost prezentate icircn secţiunea bdquoRezultaterdquo
Explicăm rezultatele obţinute
Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale
Interpretarea trebuie să se realizeze icircn
lumina limitelor studiului
contextul cultural social şi educaţional al locului unde s-a realizat cercetarea
contextul a ceea ce se cunoaşte din literatura de specialitate
Interpretăm doar rezultatele personale obţinute icircn urma studiului
Interpretarea statistică nu este tot una cu interpretarea clinică
Interpretarea statistică este importantă
Interpretarea clinică este foarte importantă
Intervalul de confidenţă
Media calculată pe baza unui eşantion nu va echivala media populaţiei
Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului
Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a
populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a
populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)
pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru
orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare
dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de
confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de
date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de
5
Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel
Dacă valoarea p este mică
Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare
aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o
medie diferită Diferenţa este semnificativă dpdv statistic
43
Icircn continuare
Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa
reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică
pentru a fi interesante din punct de vedere ştiinţific
Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC
oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care
este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a
obţine o concluzie clară
Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o
diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că
datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din
punct de vedere ştiinţific
Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul
detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat
Erorile studiilor medicale
Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura
anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară
caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea
asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri
legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias
Erorile potenţiale icircn studiile epidemiologice
1 Erori icircntacircmplătoare
2 Erori sistematice
3 Confuzia
4 Validitatea
1 Erori icircntacircmplătoare
Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a
parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel
de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot
fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii
(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor
de măsură (eroarea de măsurare)
44
2 Erori sistematice
Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate
care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu
acurateţe mare Acurateţea nu este afectată de mărimea eşantionului
Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de
experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea
dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus
şi greu de cuantificat (consum de alcool personalitate etc)
Principalele tipuri de erori din această categorie sunt
bull Biasul de selecţie
bull Biasul de informaţie
Biasul de selecţie
Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul
trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion
inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale
persoanelor incluse
Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se
ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia
Biasul de informaţie
Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de
instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze
expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere
nesemnificativă sau chiar să nu şi-o amintească de loc
3 Confuzia
Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune
prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este
cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă
de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte
important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor
protector
4 Validitatea
Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă
Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte
estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional
Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă
45
conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se
demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)
Validitatea externă se poate realiza numai dacă studiul este valid intern
Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii
studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de
studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt
laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi
validă din punct de vedere intern)
3 6 Prezentarea rezultatelor
După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite
Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor
icircntr-o formă bdquodigerabilărdquo este necesară
Scopul prezentării datelor
1 Transmiterea concluziilor studiului
a Datele corecte şi importante merită comunicate
b Datele trebuie să confirme sau să infirme ipoteza studiului
c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală
2 Acordarea posibilităţii altor cercetători să aprecieze studiul
a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti
b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor
prezentate
Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru
fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie
statistică
Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de
valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras
(Tabel 3)
Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)
46
Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct
numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor
precum şi prezentarea acestora sub formă inteligibilă
Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care
convin cercetătorului
Prezentarea datelor se poate face
1 Figuri şi tabele icircn articole scrise
2 Figuri şi tabele icircn prezentări orale
3 Figuri şi tabele icircn postere
4 Text scris sau incluse icircn text
5 Site-uri de WEB
Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor
Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie
Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele
exprimacircnd exact ceea ce acestea exprimă
Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate
anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel
să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se
acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca
mai sus sugestive sunt formatele simple şi puţin icircncărcate
Dacă nu există reguli impuse se respectă
1 Mesaj simplu fără falsificarea datelor
2 De obicei este necesar atacirct tabelul cacirct şi graficul
3 Să fie simplu şi clar
Tabele
Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile
coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică
elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de
1 Se folosesc doar linii orizontale
2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn
evidenţi prin linie de separare (Tabelul 4)
Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland
Noua Zeelandă)
(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)
47
3 Numerele sunt aliniate icircn funcţie de virgulă
4 Indicii statistici sunt explicaţi sub tabel
5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană
6 Abrevierile pot fi folosite
7 Numărul de zecimale trebuie limitat la maxim două
8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel
9 Plasarea legendei este obligatorie sub tabel
10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)
Icircn cazul prezentărilor orale sau a posterelor este indicat ca
1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării
2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte
3 Folosirea de simboluri este permisă
Clasificarea tabelelor
Tabelele se clasifică după
i) conţinut
bull cu distribuţii de frecvenţe
bull de clase de frecvenţe
bull de contingenţă
ii) structura
bull cu doua coloane
bull cu subclasificări
bull ldquomasterrdquo
Tabele ce conţin distribuţii de frecvenţe
O modalitate comodă de a prezenta o mulţime de date brute este
1 Se ordonează datele in ordine crescătoare
2 Se determine frecvenţa fiecărei valori
3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane
(Tabelul 5)
Tabelul 5 Distribuţii de frecvenţă absolută
48
Tabelul claselor de frecvenţe
1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă
2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)
Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)
Tabele de contingenţă
1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a
tabelelor de contingenţă
2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a
combinaţiilor de perechi ordonate de valori
3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre
a factor de risc si
b starea sănătăţii
4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)
5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)
Tabelul 7 Tabel de contingenţă 2 x 2
49
Grafice
Există două categorii de moduri grafice sub care se pot prezenta datele
1 Ilustraţii şi fotografii
2 Grafice
1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă
pentru lucrare
2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit
Putem vorbi despre mai multe tipuri de grafice
bull Grafice pentru reprezentarea datelor cantitative
1048707 Grafic cartezian (X Y)
1048707 Histograma
1048707 Poligonul de frecvenţe
1048707 Diagrama bdquoscatterrdquo
bull Grafice pentru reprezentarea datelor calitative
1048707 Grafic cu bare
1048707 Diagrama tip bdquoboxplotrdquo
1048707 Diagrama bdquopierdquo
1048707 Cartograma
Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi
dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)
Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)
Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie
Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)
Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)
50
Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir
de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele
două variabile studiate (Figura 6)
Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2
(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2
rămacircne aproximativ constantă)
Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea
comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea
comparativă a mai multor variabile
Figura 7 Grafic calitativ cu bare
51
Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo
Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două
posibilităţi reprezentate grafic este mai frecventă (Figura 8)
Figura 8 Reprezentare tip bdquopierdquo
Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli
sau a oricărui element comparativ Se foloseşte de epidemiologi
Rezultate
Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare
Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o
manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu
explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția
bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la
ilustraţii tabele grafice
Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi
nici rezultatele care invalidează eventual ipoteza
Discuţii
Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd
cultura ştiinţifică şi inteligenţa autorilor
Acest capitol răspunde la trei obiective
Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia
calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de
selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează
rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv
52
este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn
care a fost abordată problema fără a face o revistă a literaturii
Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea
rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul
Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor
afirmaţii nesusţinute de conţinutul lucrării
Concluzii
Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate
să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie
Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de
concluzii va scădea valoarea lucrării
Bibliografia (lista referinţelor citarea icircn text)
Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn
lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente
Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli
- să conţină cele mai importante şi recente lucrări
- să includă numai lucrări publicate
- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate
Bibliografie
Elisabeta Jaba ndash Statistică Ed Economică 1998
Mihai Ţarcă ndash Statistică volI Ed UAIC 1979
Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale
Ed University Press 2009
Sorana Daniela Bolboacă ndash Metodologia cercetării curs
53
Ipoteza este o afirmaţie (nu o icircntrebare) despre o posibilă relaţie icircntre factorii studiaţi şi criteriile de
raţionament Ipoteza poate fi ipoteză ldquonulărdquo - nu există această relaţie şi ldquoalternativărdquo - există relaţia Ipoteza
va trebui apoi dovedită sau respinsă testul statistic calculează probabilitatea conform căreia asociaţia observată
este reală sau ea survine din icircntacircmplare
bull Motivarea organizării studiului Trebuie făcută o motivare corectă legată de inexistenţa unor studii
referitoare la problema pe care o va dezbate studiul
Formularea temei de studiu
Pentru formularea temei de studiu trebuiesc menţionate obiectivul sau obiectivele şi tipul de studiu ales pentru
cercetarea respectivă Există icircn general patru tipuri de obiective
bull obiective care se referă la evoluţia şi prognosticul unei icircmbolnăviri obiective prin care se icircncearcă
icircnţelegerea şi cunoaşterea unor evenimente ce pot să apară la un pacient pe parcursul bolii
bull obiective care se referă la etiologia bolii (cauze de natură bacteriană virală parazitară) sau la cauzalitate
(relaţia factor de risc-boală)
bull obiective legate de performanţa unor teste de diagnostic sau de screening de evaluare a strategiei de
diagnostic sau de interpretare a unui test
bull obiective care se referă la impactul unei intervenţii evaluarea unei intervenţii terapeutice de depistare a unor
boli de prevenţie de educare pentru sănătate
Obiectivele unui studiu se icircmpart icircn obiectivul major unul din cele patru enumerate şi obiective
secundare care pot aborda şi alte fenomene biologice decacirct cel major cu condiţia să nu altereze realizarea
acestuia Alegerea tipului de studiu este stracircns legată de obiectivul ales Dacă obiectivul este descrierea
distribuţiei caracteristicilor unei populaţii aprecierea frecvenţei unui fenomen de sănătate analiza acelui
fenomen icircn funcţie de timp loc persoană se va alege un studiu epidemiologic descriptiv studiu care nu are o
ipoteză fixată anterior O ipoteză se poate formula ca rezultat al studiului descriptiv dar nu se va face
verificarea ei icircn cadrul studiului Dacă intenţia studiului este de a emite o judecată asupra unei posibile relaţii
icircntre factorii studiaţi atunci problema de cercetat este fundamentată de o ipoteză care trebuie verificată
dovedită iar studiul care realizează acest lucru respectiv limitele studiilor utilizate
Aspectele manageriale
Aspectele manageriale includ
bull justificarea bugetului estimarea sumei necesară realizării studiului și apreciarea durate studiului
bull defalcarea bugetului pe necesități legate de achziționare de aparatură reactanți truse etc pentru personal
(munca depusă pregătire deplasări icircn teren participări la congrese sau conferințe documentare) materiale
consumabile etc
7
32 Elaborarea proiectului
Protocolul de cercetare este un document care emite obiectivul și ipoteza studiului definește condițiile de
desfășurare și realizare a viitorului studiu clinic Elaborarea protocolului este importantă pentru cercetătorii
participanţi la studiu comisiile de etică şi finanţatori
Protocolul include mai multe formulare care trebuie să cuprindă
a) Titlul proiectului
b) Sumarul proiectului
c) Descrierea proiectului
d) Normele deontologice de cercetare
e) Modalitățile de diseminarea și valorificarea rezultatelor
f) Perspective de continuare a cercetării
g) Anexe
Prezentarea proiectului va include următoarele fișiere
bull resursele umane (membrii echipei afilierea acestora)
bull relevanța temei pentru dezvoltarea cunoașterii icircn domeniu
bull stadiul actual al cunoașterii și bibliografia aferentă
bull justificarea studiului
bull enunțarea obiectivelor și ipoteza de lucru
bull metodologia propriu-zisă
Referitor la metodologia utilizată vor trebui menționate
bull factorulfactorii studiați care reprezintă variabila independentă respectiv dacă este cazul modalitățile de
măsurare
bull criteriile de raționament- variabila dependentă (situația sau evenimentul ce se presupune a fi rezultatul
factorului studiat cum ar fi boala handicapul complicații decesul)
bull tipul de studiu care se va aplica icircmpreună cu design-ul acestuia
bull eșantioanele de lucru și modalitățile de eșantionaj
bull metodele de culegere și de prelucrare a datelor
bull planificarea activităților
bull structura bugetului fiind eligibile următoarele categorii de cheltuieli de capital (echipamente software
upgrading) pentru personal (full sau part-time instruire asigurări de sănătate) de informare (documentare
abonamente) mobilități (vizite la alte unități de cercetare participări la
congrese) materiale consumabile (truse reactanți papetărie) valorificare a rezultatelor (lucrări științifice de
etapă sau lucrarea finală) cheltuieli indirecte (de regie)
bull modalităţile de valorificare a rezultatelor
bull legături de alte proiecte
8
Protocolul mai conține anexe curriculum vitae al investigatorului principal și al coinvestigatorilor
calendarul activităților avizul Comisiei de etică documente speciale și
consimțămacircntul informat icircn cazul studiilor pe subiecți umani
Icircnainte de implementare protocolul va fi verificat de experți pentru eligibilitate (dacă sunt icircndeplinite
condițiile de acceptare finanțare) calitate și pertinență icircn sensul că protocolul trebuie să fie clar exprimat
corect icircntocmit bine așezat și cu repercursiuni favorabile pentru viitor
33 Culegerea informaţiei
Pentru a realiza o cercetare medicală culegerea datelor este prima etapă şi realizează icircn funcţie de
obiectivele propuse tipul studiului timpul disponibil şi resurse umane şi financiare
Există două mari posibilităţi de culegere
bull Icircn funcţie de elementele studiate
o Culegerea exaustivă Toţi subiecţii populaţiei pe care dorim să o studiem Greu de realizat din cauza
costurilor foarte mari sau a alterării populaţiei de studiu
o Prin eşantionare Este metoda folosită icircn studii medicale
bull Icircn funcţie de durata culegerii
o Transversală Se studiază un grup la un moment dat
o Longitudinală Extinsă in timp
- Retrospectivă ndash icircnregistrări medicale
- Prospectivă ndash date culese la intervale prestabilite de timp
Populaţia ţintă
Este orice colectivitate icircntreagă de oameni animale plante sau obiecte de la care putem colecta date Populaţia
ţintă este icircntregul grup care ne interesează pe care dorim să-l descriem sau să tragem concluzii despre el
Pentru a putea realiza generalizări spre populaţia ţintă deseori suntem obligaţi să folosim un eşantion (selecţie)
care icircnsă trebuie să fie reprezentativ pentru populaţia pe care vrem să o studiem Pentru fiecare populaţie de
studiu sunt posibile mai multe eşantioane Pe baza acestor eşantioane se calculează un estimator Pe baza
acestui estimator calculat care poate fi medie aritmetică procent etc se pot trage concluzii despre icircntreaga
populaţie Este foarte important ca investigatorul să definească foarte atent şi complet populaţia icircnainte de a
realiza eşantionul inclusiv descrierea criteriilor de includere şi excludere icircn populaţia de studiu
Eşantionul
Un eşantion este practic un grup de elemente selectate dintr-un grup mai extins (populaţia ţintă) Studiind
eşantionul selectat se pot trage concluzii despre grupul de unde a fost ales (populaţia ţintă)
Este icircn general ales pentru studiu pentru că
bull Populaţia ţintă este prea mare şi nu poate fi studiată ca icircntreg
bull Nu avem acces din diverse motive decacirct la parte din populaţia de studiu
9
bull Un studiu pe icircntreaga populaţie poate distruge populaţia
bull Eşantioanele pot fi studiate mai rapid
bull Costul şi resursele necesare studiului sunt mai reduse
Numărul elementelor dintr-un eşantion se numeşte talia sau volumul selecţiei
Acesta fiind icircn general mai mic decacirct icircntreaga populaţie poate fi observat icircn detaliu iar dacă este reprezentativ
se pot afla prin intermediul său proprietăţile populaţiei ţintă
Eşantionul trebuie să fie reprezentativ pentru populaţia generală De aceea dintre metodele de eşantionare se
folosesc tehnicile de randomizare Trebuie să satisfacă două condiţii principale
bull condiţie de ordin cantitativ talia să fie suficient de mare
bull condiţie de ordin calitativ trebuie extras aleator din populaţia ţintă
Metode de eşantionare
Putem vorbi icircn linii mari de două posibilităţi de eşantionare prin metode probabilistice şi prin metode
nonprobabilistice
Eşantionarea probabilistică este metoda cea mai folosită icircn studiile medicale fiind şi cea indicată pentru a
realiza reprezentativitatea calitativă
Icircn medicină se folosesc patru tipuri de eşantionări
1 Simplu randomizat
2 Sistematic
3 Stratificat
4 Cluster (icircn cuiburi)
1 Eşantionul simplu randomizat Fiecare element din populaţia ţintă are o şansă egală non zero de a fi
inclus icircn eşantion Se ia la icircntacircmplare un număr de elemente egal cu talia eşantionului Dezavantajul acestui tip
de eşantionare este că presupune cunoaşterea icircntregii populaţii ţintă
2 Eşantionul sistematic După aflarea taliei eşantionului şi a populaţiei ţintă se calculează factorul de
eşantionare k icircmpărţind talia populaţiei ţintă la volumul eşantionului Apoi fiecare al k-lea element este
selectat spre includere
Acelaşi mare dezavantaj apare şi icircn acest caz fiind obligatorie cunoaşterea icircntregii populaţii de studiu
3 Eşantionul stratificat Există icircn cele mai multe cazuri probleme medicale care studiindu-se pe eşantion
prezintă variabilităţi icircn funcţie de caracteristicile populaţiei (sex vacircrstă nivel de pregătire etc) Icircn acest caz
este obligatorie realizarea similitudinii demografice a eşantionului cu populaţia de studiu Din date provenite
de la Centrul de Statistică putem dezvolta ca procente o structură a populaţiei Această structură trebuie să se
regăsească (procentual) şi icircntre membrii eşantionului O importantă şansă ca reprezentativitatea calitativă să fie
corectă este conferită de respectarea
acestei similitudini demografice
10
4 Eşantionul bdquoclusterrdquo sau icircn cuiburi Icircn cazul unui studiu amplu cu scop de a investiga populaţia unei
icircntregi ţări sau regiuni putem ajunge icircn imposibilitatea de a alege şi mai ales investiga indivizi răspacircndiţi prin
icircntreaga zonă Din acest motiv se desemnează la icircntacircmplare un număr calculabil de
grupuri populaţionale extinse icircn toată zona de studiu Aceste grupuri poartă numele de bdquocuiburirdquo La nivelul
fiecărui bdquocuibrdquo se aplică o tehnică precedentă de selecţie a cazurilor Se poate sau de cele mai multe ori se face
la nivel de bdquocuibrdquo stratificarea iar apoi selecţia propriu-zisă se realizează sistematic sau simplu randomizat
Este metoda de eşantionare cel mai frecvent utilizată icircn cercetarea medicală de amploare Pentru ca eventualele
erori să nu se poată strecura s-a definit şi un indice DEF (design effect) cu care trebuie multiplicată talia
selecţiei care pentru eşantionarea icircn bdquocuiburirdquo este egal cu 2 astfel putem obţine şi o reprezentativitate
calitativă dar şi una cantitativă
Eşantionarea nonprobabilistică este o metodă neindicată icircn studiile medicale datorită lipsei de forţă icircn ceea ce
priveşte posibilitatea de aplicare a concluziilor asupra populaţiei de studiu
Se definesc şi icircn acest caz patru metode
1 Eşantion de convenienţă Membrii unui astfel de eşantion sunt aleşi numai pentru că sunt la icircndemacircnă
disponibili de a răspunde le un eventual chestionar
2 Eşantion pe cote Similar cu tipul de eşantion stratificat se referă la faptul că selecţia se face formacircnd
eşantionul din primele 30 de persoane care respectă un criteriu impus
3 Eşantion cu un scop Elementele incluse icircn eşantion sunt alese după un criteriu care exclude din start marea
majoritate a populaţiei
4 Eşantion raţional Selecţia se face prin prisma unui raţionament al celui care conduce studiul
Parametru şi estimator
Parametrul este o valoare de obicei necunoscută (şi care trebuie să fie estimată prin studiu) folosită pentru a
reprezenta o anumită caracteristică a populaţiei de studiu De exemplu media populaţiei (icircnălţime) este un
parametru populaţional Raportat la o populaţie parametrul este o valoare fixă şi exactă care nu variază
Fiecare eşantion extras din populaţie va indica o valoare a mediei care nu poate decacirct să estimeze parametrul
Icircn general parametrii sunt notaţi cu litere greceşti (ex Media = μ)
Estimatorul este o valoare calculată dintr-un eşantion studiat Este folosit pentru a putea aprecia parametrul
populaţional pe care icircn căutăm Este de asemenea posibil ca dintr-o populaţie să formăm mai multe eşantioane
mediile lor de cele mai multe ori nefiind identice icircntre ele şi nici identice cu media populaţiei Estimatorii
sunt notaţi cu litere latine (ex Media = μ)
Dacă valoarea mediei calculată pe eşantion este de exemplu 168 cm atunci putem estima ca valoarea mediei
icircn populaţie este 168 cm
11
Tipuri de culegere a datelor
1 Culegere de tip eşantion reprezentativ Grupul de indivizi incluşi icircn studiu sunt reprezentativi (calitativ şi
cantitativ) pentru populaţia generală Poate fi utilizat pentru studii descriptive (cel mai frecvent) dar uneori şi
pentru studii analitice
Este necesar pentru acest tip de culegere a datelor ca iniţial să fie cunoscută talia eşantionului (calculabilă icircn
funcţie de prevalenţă şi precizie) Pentru evaluarea datelor culese se utilizează tabelul de contingenţă 2 x 2
astfel (Figura 1)
Figura 1 - Tabelul de contingenţă 2 x 2
Unde
a ndash persoane expuse unui factor de risc care au boala studiată
b ndash persoane expuse unui factor de risc care nu au boala studiată
c - persoane neexpuse unui factor de risc care au boala studiată
d - persoane neexpuse unui factor de risc care nu au boala studiată
După aranjarea datelor icircn tabelul de contingenţă (2 x 2) se poate icircncepe analiza statistică a datelor atacirct ca
procente calculabile cacirct şi din punct de vedere a aplicării de teste statistice pentru elucidarea semnificaţiei
statistice
Este posibilă din acest tip de culegere de date calcularea
1 Prevalenţei unei boli
2 Frecvenţei expunerii
3 Gradul de asociere icircntre factorul eventual de risc şi boala
2 Culegerea de tip expus ndash neexpus Icircmparte subiecţii icircn două categorii expuşi sau neexpuşi factorului de risc
studiat Ca evoluţie următoare a studiului după o astfel de culegere a datelor se poate evalua icircn timp apariţia
icircmbolnăvirii despre care se efectuează studiul Icircn timp longitudinal prospectiv se poate calcula dacă factorul
studiat reprezintă un risc de icircmbolnăvire este indiferent sau chiar este cu efect protectiv Numărul subiecţilor
din cele două grupuri poate fi egal sau poate fi diferit Numărul acestora poate fi calculat icircn vederea obţinerii
unei bune reprezentativităţi cu ajutorul formulelor de selecţie Avacircnd icircn vedere calitatea longitudinală a
12
studiului este important ca numărul ales să fie mai mare pentru a putea suplinii eventualele pierderi din
urmărire Practic rezultatele sunt introduse icircn tabelul 2 x 2 de unde se pot calcula indicatorii doriţi (Figura 2)
Avacircnd icircn vedere modul de culegere a datelor este permisă calcularea de indicatori numai pe orizontală
orice comparare icircntre coloana dreaptă şi stacircngă fiind incorectă Avantajul acestui tip de culegere a datelor ar fi
eventualul număr mai redus de subiecţi dar dezavantajul major este cel al costurilor de urmărire icircn timp dar
trebuie luată icircn calcul şi pierderea de subiecţi din evidenţe Factorul controlat este deci prezenţa expunerii iar
factorul aleator este prezenţa bolii
Figura 2 Tabelul de contingenţă pentru tipul de culegere expus ndash neexpus
4 Culegerea de tip caz ndash martor Icircn acest caz ceea ce ghidează colectarea datelor este prezenţa sau absenţa
bolii icircn momentul prezent Se vor culege date de la două loturi constituite după criteriul de bolnav B+ şi de fără
boală B+ Datele culese sunt icircn trecut deci caracterul datelor va fi retrospectiv Icircn acest caz factorul controlat
este boala factorul aleator fiind expunerea (Figura 3)
Calculul de indicatori icircn acest caz se va putea efectua numai icircntre coloane orice calcul icircntre valorile de pe linii
fiind greşit Rezultate semnificative se pot obţine icircn acest caz utilizacircnd loturi mai mici de studiu prin
comparaţie cu tipul eşantion reprezentativ permiţacircnd icircn acelaşi timp studiul bolilor rare (cu prevalenţă mică)
Figura 3 Tabelul de contingenţă pentru tipul de culegere caz ndash martor
Metode de culegere a datelor
Metoda aleasă pentru culegerea datelor trebuie să fie aleasă după un atent studiu bibliografic icircn vederea
stabilirii celui mai eficient mod de a răspunde temei de studiu
Metodele de culegere trebuie să fie bine aplicabile şi consistente ca aport informaţional necesar
13
1 Fiziologice Sunt colectate date despre anumite caracteristici fiziologice ale pacienţilor (TA glicemie
colesterol etc) Această metodă aduce rezultate obiective cacirct timp instrumentul de evaluare este bine calibrat
şi prezintă variaţii mici
2 Metode observaţionale Instrumentul de culegere a datelor trebuie să fie sincronizat cu protocolul conceput
de cercetător Datele culese trebuie să fie de asemenea consistente adică să fie colectate de aceeaşi manieră
conducătorul studiului trebuind să instruiască investigatorii (colectorii de date) Icircnregistrarea datelor trebuie să
fie de asemenea sistematică şi bine standardizată Observaţii de control trebuie icircn mod obligatoriu făcute
pentru a putea aprecia icircn mod corect orice deviere datorată unor factorii externi Este obligatorie luarea icircn
consideraţie a aspectelor etice
3 Interviul Poate fi structurat cu un set specific de icircntrebări sau nestructurat cu o temă generală cu care se
icircncepe interviul Interviurile pot fi icircnregistrate sau intervievatorul poate nota pur şi simplu răspunsurile Există
două tipuri generice de interviu interviul de profunzime care se referă la o discuţie icircn general structurată cu
un număr de icircntrebări prestabilite icircn icircncăperea de studiu fiind doară intervievatorul şi persoana chestionată şi
interviul de grup unde prin conversaţii pornind de la temă generală expusă şi condusă de intervievator se
obţin date despre subiecţii participanţi la studiu Ambele metode de interviu au indicaţiile lor precise Un
interviu pe teme intime nu va putea fi corect icircn ceea ce priveşte datele colectate dacă se aplică un interviu de
grup
4 Chestionarul Document scris adresat unor persoane pentru a răspunde la una sau mai multe icircntrebări
Trebuie să aducă răspunsurile la icircntrebările care motivează studiul constituind ansamblul icircntrebărilor destinate
culegerii de informaţii (date) Redactarea chestionarului trebuie să ţină cont de structura acestuia introducere
conţinut exprimarea icircntrebărilor grafica chestionarului
5 Icircnregistrări preexistente
Icircn cercetarea medicală sunt cel mai frecvent utilizate Informaţiile dorite sunt deja existente ceea ce icirci revine
cercetătorului este ca să structureze datele icircn funcţie de scopul studiului pe care icircn conduce Aceste surse sunt
bull Foi de observaţie
bull Registre de consultaţie
bull Buletine de analize
bull Registre de operaţii
Icircn cazul icircn care nici o metodă de culegere a datelor nu este pe placul celui ce conduce studiul există
posibilitatea de a construi un instrument nou de culegere a datelor
Acest proces trebuie să urmărească nişte paşi obligatorii fiind mare consumator de timp
bull Definirea structurii cu care se va face măsurarea
bull Formularea itemilor de măsură
bull Analiza validităţii instrumentului de măsură ndash măsoară acesta fenomenul corect
bull Elaborarea de instrucţiuni de utilizare pentru investigatori
14
bull Pretestarea instrumentului
bull Aprecierea validităţii interne şi externe a datelor culese
Instrumente de cercetare
Formularea clară a temei de cercetare necesită o foarte bună definire a factorilor studiaţi şi a criteriilor de
judecată Acestea din urmă sunt ultimele care vor trebui definite icircn cadrul protocolului de studiu
Alegerea unui instrument de măsură
Nu există un instrument de măsură perfect sau universal corect Alegerea sa dintre cele existente şi cele deja
utilizate depind de trei factori
bull Obiectivul studiului
bull Boala studiată
bull Populaţia icircn studiu
De aceste trei elemente trebuie ţinut cont icircn fiecare etapă a dezvoltării instrumentului
Definirea obiectivului
Studiu transversal Dacă se doreşte studierea unui simptom sau a unei caracteristici ale populaţiei se poate
icircmpărţi populaţia de studiu icircn mai multe grupuri Este practic vorba de a determina diferenţele dintre subiecţi
icircn cea ce priveşte o variabilă necesară studiată printr-un studiu transversal (utilizarea dozării de Ac HBS
pentru a evalua progresele bolnavilor de hepatită tip B)
Studiu longitudinal Icircn acest caz nu se poate icircmpărţii populaţia de studiu icircn mai multe grupuri datele obţinute
fiind de la acelaşi subiect colectate după un interval de timp
Icircn funcţie de boală şi populaţie se aleg şi instrumentele de măsură cele mai adecvate
Instrumentele cercetării reprezintă un mecanism specific sau o strategie pe care cercetătorul o utilizează pentru
colectarea prelucrarea şi inferenţa datelor Aceste instrumente sunt
1 Studiul icircn bibliotecă
2 Computerul
3 Determinările experimentale
4 Statistica
5 Mintea umană
6 Facilităţi de limbaj şi comunicare
Determinările experimentale
Măsurarea constă icircn aprecierea şi cuantificarea fenomenelor calitativ sau cantitativ Interpretarea
datelor se referă la transformarea lor icircn unităţi de descoperire a unor fenomene mai puţin cercetate
Standardele acceptate se referă la norme medii distribuţii etc Tot icircn cadrul interpretării datelor datele
obţinute sunt caracterizate pe scale de valori nominal ordinal de interval sau de raport
Validarea şi reproductibilitatea măsurătorilor sunt aspecte importante şi foarte necesare pentru o
cercetare corect fundamentată care doreşte obţinerea unor concluzii pertinente
15
Statistica Este implicată icircn condensarea şi procesarea unui volum mai mare de date astfel icircncacirct să se poată
interpreta corect valorile obţinute şi să se permită comparările Utilizarea unor teste statistice specifice permite
determinarea semnificaţiei (diferenţei) statistice astfel icircncacirct estimatorii să poată fi aplicaţi la populaţia
generală Furnizează informaţii şi privind corelarea sau relaţionarea icircntre date
Mintea umană este cea care reuşeşte să integreze şi să icircnţeleagă rezultatele obţinute Semnificaţia ştiinţifică
este stabilită icircn funcţie de rezultatele statisticii de mintea umană conform afirmaţiei bdquosemnificaţia ştiinţifică
nu este egală cu semnificaţia statisticărdquo Metodele aplicate pentru a putea ajunge la o concluzie pertinentă sunt
logica deductivă raţionamentul inductiv şi gacircndirea critică
Limbaj şi comunicare Exprimarea orală sau icircn scris permite nuanţarea unor aspecte seci cifrice ale unor
studii Icircn acest mod devine mai evidentă semnificaţia ştiinţifică a unor rezultate statistice
34 Prelucrarea datelor
Instrumentele de prelucrare
Statistica este o ştiinţă ramură a matematicii care studiază evoluţia fenomenelor şi proceselor
colective pe baza observării lor ştiinţifice a culegerii şi prelucrării detaliate a informaţiilor statistice cu scopul
de a formula şi explica legile legităţile şi regularităţile ce le guvernează
Statistica permite deci aprecierea unor parametrii populaţionali prin studiul unui număr redus de
elemente ale populaţiei icircn studiu (ţintă) O populaţie poate fi definită printr-un şir de valori care pot fi grupate
icircn funcţie de parametrul studiat (glicemie colesterol TAD TAS etc) Pentru fiecare astfel de şir se defineşte
o variabilă (care va purta nume propriu glicemie colesterol etc) Practic variabila este considerată o funcţie
ia valori posibil diferite de la un element la altul icircn funcţie de caracteristicile proprii acestora Sunt clasificate
icircn două grupe variabile cantitative (caracteristică măsurabilă) şi calitative (caracteristică ce nu poate fi
măsurată)
La racircndul lor variabilele calitative pot fi
bull Nominale ndash grupuri de elemente ce nu pot fi ordonate (culoarea părului)
bull Nominale ordonate ndash concluziile pot fi grupate (eficienţa unui tratament slabă bună foarte bună)
bull Binare ndash apar numai două posibilităţi (bolnav sănătos)
Variabilele cantitative pot fi
bull Continue ndash o variabilă măsurabilă care poate lua o infinitate de valori
bull Discrete ndash variabile care nu pot lua decacirct valori icircntregi
Statistica descriptivă
Există două ramuri ale statisticii statistica descriptivă şi statistica inferenţială
Statistica descriptivă (după cum rezultă din denumire) se ocupă cu descrierea unor valori obţinute ale unei
variabile studiate
16
Valorile pe care variabila le ia se constituie icircntr-o serie statistică Indicatorii care definesc o variabilă (serie)
sunt
1 Ale tendinţei centrale
Media aritmetică - notată de regulă cu
Mediana - este acea valoare din şirul de date care icircmparte icircn două părţi egale şirul ordonat de valori (atenţie
şirul este ordonat crescător) situacircndu-se la mijlocul seriei statistice
Dacă numărul de valori n este un număr impar atunci mediana este valoarea unde
Dacă n este par deci avem un număr par de valori mediana este definitatilde ca fiind
unde k = n2
Modul - constituie valoarea care apare cel mai des deci valoarea cu numărul cel mai mare de apariţii
2 De dispersie
Amplitudinea - este diferenţa dintre valoarea maximă şi cea minimă
A = Amax - Amin
Amplitudinea relativă - notată A este raportul dintre amplitudinea absolută şi media aritmetică a seriei de
date
Varianţa notată este un indicator de icircmprăştiere a datelor Formula de calcul este
Abaterea standard (S) sau deviaţia standard reprezintă rădăcina pătrată din varianţă (dispersie)
Coeficientul de variaţie se calculează ca un raport procentual icircntre abaterea standard şi valoarea medie a şirului
de valori
Eroarea standard intervine icircn estimarea intervalelor de confidenţă Se calculează astfel
17
3 De asimetrie (skewness) indică distribuţia datelor dacă sunt sau nu distribuite normal
4 De boltire (kurtosis) estimează boltirea sau aplatizarea curbei de distribuţie
Prezentarea descriptivă a datelor se face prin icircnregistrarea datelor culese icircn tabele care să reprezinte icircn mod
sintetic valorile măsurate
Icircn concluzie statistica descriptivă permite
bull Stabilirea comparabilităţii icircntre grupurile de studiu şi aprecierea prezenţei erorilor sau confuziei
bull Reprezentarea datelor icircn tabele permite evaluarea fiecărui pacient şi dacă a existat pierderi din studiu
Statistica inferenţială
Statistica inferenţială (inductivă) este partea de analiză a datelor care permite extrapolarea unei
concluzii trase pe baza unui eşantion spre populaţia ţintă pentru care a fost efectuat studiul
Scopul analizei statistice este de a evidenţia efectul unui tratament sau al unui factor de risc prin date obţinute
din eşantionul studiat spre populaţia ţintă Aceasta implică testarea ipotezelor statistice sau altfel spus testarea
semnificaţiei statistice Este una dintre cele mai importante momente ale studiului Cum rezultatele sunt
obţinute prin studiul unui eşantion există posibilitatea ca acestea să fie datorate icircntacircmplării Testele
statistice ne ajută să apreciem icircn ce măsură rezultatele sunt icircntacircmplătoare şi mai ales icircn ce măsură şi dacă se
pot aplica populaţiei generale Icircn acest scop se impune o valoare limită alfa 005 care reprezintă limita
superioară a probabilităţii ca rezultatul obţinut să fie greşit (datorat icircntacircmplării) Astfel icircn funcţie de tipul
variabilelor şi indicatorii descriptivi aplicaţi şi evaluaţi se aplică teste de semnificaţie statistică (Tabelul 1)
Tabelul 1 Alegerea testelor de semnificaţie statistică
Tipul datelor
18
Diferenţierea variabilelor din punctul de vedere a distribuţiei se face folosind testul de normalitate
Kolmogorov ndash Smirnov
Testul statistic reprezintă metoda de comparaţie a două sau mai multe populaţii prin intermediul unor
variabile observate ale lor
Scopul unui test statistic este de a defini realitatea
Definirea icircntrebării de cercetare (ipoteza clinică)
Tratamentul cu Nebivolol este la fel de eficient ca şi cel cu Valsartan icircn tratamentul
hipertensiunii arteriale
Transpunerea icircntrebării de cercetare icircn termeni statistici (ipoteza statistică)
Media tensiunii arteriale a pacienţilor trataţi cu Valsartan nu diferă semnificativ de media
tensiunii arteriale a pacienţilor trataţi cu Nebivolol
Etapele unui test statistic
1 Formularea problemei icircn termenii ipotezelor statistice
2 Alegerea şi calcularea parametrului statistic al testului
3 Regiunea critică
4 Concluzia testului
1 Formularea problemei icircn termenii ipotezelor statistice
Ipoteza nulă ipoteza care trebuie testată testul efectuacircndu-se sub prezumţia că ipoteza nulă ar
fi adevărată
Ipoteza alternativă acea ipoteză care icircntr-un sens sau altul contrazice ipoteza nulă Această
ipoteză se mai numeşte şi ipoteza de lucru
Ipoteza nulă tipuri
O coadă (ldquoone-tailedrdquo sau ldquoone-siderdquo)
Media este mai mare
Media este mai mică
Două cozi (ldquoone-tailedrdquo sau ldquoone-siderdquo)
Media este egală
2 Alegerea şi calcularea parametrului statistic al testului
Parametrul statistic al testului exprimă icircntr-o anumită formă diferenţa dintre elementele comparate
Ţinacircnd seama de faptul că eşantionul sau eşantioanele utilizate sunt aleator extrase din populaţiile care
fac obiectul testului parametrul statistic este o variabilă aleatoare de selecţie care urmează o anumită
lege de probabilitate
Un parametru statistic al testului bun trebuie să icircndeplinească două condiţii
19
Trebuie să se comporte diferit atunci cacircnd ipoteza nulă H0 este adevărată faţă de situaţia icircn
care ipoteza alternativă H1 este adevărată
Distribuţia de probabilitate a parametrului statistic al testului sub prezumţia că H0 este
adevărată este cunoscută
3 Regiunea critică
- Trebuie să fim capabili să decidem icircn funcţie de valoarea parametrului statistic calculat care dintre
ipoteze cea nulă sau cea alternativă este adevărată
- Dacă valoarea parametrului statistic aparţine regiunii critice ipoteza nulă H0 va fi respinsă şi va fi
acceptată ipoteza alternativă H1
- Dacă valoarea parametrului statistic nu aparţine regiunii critice ipoteza nulă H0 va fi acceptată
- Decidem mărimea regiunii critice
Pentru aceasta trebuie să specificăm mărimea riscului de eroare pe care icircl acceptăm
Pe scurt definim nivelul de semnificaţie notat cu a sau mărimea riscului pe care
suntem dispuşi să ni-l asumăm icircn respingerea ipotezei nule H0 icircn cazul icircn care aceasta
este adevărată De obicei se alege un nivel de semnificaţie icircntre 1 şi 5
Probabilitatea unei erori de tipul I
probabilitatea de respingere a ipotezei nule H0 icircn favoarea ipotezei alternative H1 icircn
condiţiile icircn care H0 este adevărată
probabilitatea unei erori de tipul I se notează cu a şi se mai numeşte nivel de
semnificaţie al testului
Probabilitatea unei erori de tipul II
probabilitatea acceptării ipotezei nule icircn condiţiile icircn care ipoteza alternativă H1 este
adevărată
această probabilitate se notează cu b
- Unilaterală la dreapta ndash valoarea parametrului statistic al testului este mai mare sau egală cu
valoarea din dreapta a intervalului critic
- Unilaterală la stacircnga ndash valoarea parametrului statistic al testului este mai mică sau egală cu
valoarea din stacircnga a intervalului critic
- Bilaterală ndash valoarea parametrului statistic al testului este mai mică sau egală cu valoarea extremă
din stacircnga regiunii critice sau mai mare sau egală cu valoarea extremă din dreapta regiunii critice
valorile extreme ale regiunii critice avacircnd nivele egale de semnificaţie
4 Concluzia testului
- Ipoteza nulă H0 este respinsă dacă valoarea parametrului statistic aparţine regiunii critice
20
- Regiunea critică trebuie astfel aleasă icircncacirct dacă ipoteza alternativă H1 este adevărată
probabilitatea de respingere a ipotezei nule H0 este mai mare decacirct icircn cazul icircn care ipoteza nulă H0
ar fi adevărată
- Acceptarea ipotezei nule H0 atunci cacircnd ipoteza alternativă H1 este adevărată este cunoscută ca şi
eroarea de tipul II
a probabilitatea ei se notează cu b
b măsoară bdquonivelul de eroarerdquo
- Icircn testarea oricărei ipoteze statistice există patru situaţii care determină dacă decizia noastră este
corectă sau nu
Cazuri
H0 este adevărată H0 este falsă
Concluzie H0 se acceptă decizie corectă eroare de tipul
II
H0 se
respinge
eroare de tipul I decizie corectă
Luarea deciziei pe baza valorii probabilităţii p de semnificaţie a testului
Icircn momentul icircn care prelucrăm statistic o serie de date dorim să ştim dacă rezultatele obţinute sunt sau
nu semnificative statistic
Răspunsul la această icircntrebare este dat de valoarea lui p calculată de orice program statistic la
prelucrarea unor date
Icircn cazul testelor statistice ipoteza nulă este respinsă dacă nivelul de semnificaţie este mai mic decacirct
005 iar programele de prelucrare statistică a datelor vor afişa o steluţă () icircn tabelul rezultatelor
21
Dacă p le 005 respingem ipoteza nulă şi acceptăm ipoteza alternativă (am obţinut semnificaţia
statistică)
Dacă p gt 005 acceptăm ipoteza nulă (nu am obţinut semnificaţia statistică)
p = 013
NU respingem ipoteza nulă
Risc de eroare de tip II
α = 005
p = 002
Respingem ipoteza nulă
Risc de eroare de tip I
Semnificaţia lui p
Criteriu de luare a deciziei cu privire la o ipoteză statistică nulă
Cuantifică şansa ca o decizie de respingere a ipotezei nule să fie greşită
Măsură a semnificaţiei statistice şi NU CLINICĂ
22
Semnificaţia lui p (reguli empirice)
001 le p lt 005 rezultatul e semnificativ statistic
0001 le p lt 001 rezultatul e icircnalt semnificativ statistic
p lt 0001 rezultatul e foarte icircnalt semnificativ statistic
p ge 005 rezultatul e considerat nesemnificativ statistic
Limite ale valorii p
Valoarea p NU ne dă informaţii despre
Şansa de beneficiu a unui pacient individual
Procentul de pacienţi care vor avea un beneficiu icircn urma instituirii procedurii medicale
Gradul de beneficiu expectat pentru un anumit pacient
Puterea unui test statistic
Este capacitatea de a detecta o diferenţă acolo unde există
Creşterea volumului eşantionului determină creşterea puterii testului statistic aplicat
Valoarea este icircn relaţie directă cu eroarea de tip II
Puterea = 1 ndash β
Cea mai utilizată modalitate de creştere a puterii unui test statistic este de a creşte volumul
eşantionului
Tipul scalei de măsură ndash testul statistic
Denumire test Interval Nominal Observaţii
Corelaţie Pearson 2 0 Există o relaţie liniară
χ2 0 2
Student 1 1 Doar 2 grupuri
ANOVA 1 1 2 sau mai multe grupuri
Student perechi 1 1 Eşantioane perechi
Măsurători repetate (ANOVA) 1 1 Mai mult de 2 grupuri date
perechi
Inferenţa statistică pe date calitativ e
Tabela de contingenţă 2times2
Riscuri şi raţii
Testul χ2 (testarea asocierii icircn tabela de contingenţă)
Testul Fisher
23
Testul z pentru proporţii
Testul McNemar
Tabela de contingenţă 2times2
Scale de tip nominal (dicotomiale tabela de contingenţă de 2times2) sau ordinal (tabela de contingenţă de
rtimesc)
Frecvenţa absolută (numărul de evenimente per categorie)
Tabela de contingenţă de 2times2 4 categorii
AP = adevărat pozitiv
FP = fals pozitiv
FN = fals negativ
AN = adevărat negativ
Ulcer deschis Ulcer vindecat Total
Recurenţă + AP = 1 FP = 5 = 1+5 = 6
Recurenţă - FN = 7 AN = 16 = 7+16 = 23
Total =1+7=8 =5+16=21 29
Riscuri şi raţii Mărimi ale asocierii
Denumire Formula Definiţie
Rata falşilor pozitivi =FP(FP+AN) Probabilitatea unui test fals + (α)
Rata falşilor negativi =FN(FN+AP) Probabilitatea unui test fals ndash (β)
Sensibilitate =AP(AP+FN) Probabilitatea unui test real + (1- β)
Specificitate =AN(AN+FP) Probabilitatea unui test real ndash (1- α)
Acurateţe =(AP+AN)n Probabilitatea generală a unei decizii corecte
Valoarea predictivă pozitivă =AP(AP+FP) Probabilitatea ca un test pozitiv să fie corect
Valoarea predictivă negativă =AN(AN+FN) Probabilitatea ca un test negativ să fie corect
Riscul relativ =AP(FP+AN)FN(AP+FP)
Rata şansei =(AP∙AN)(FN∙FP)
Riscul atribuabil =AP(AP+FP)-FN(FN+AN)
24
Denumire Formula
Rata falşilor pozitivi = 5(5+1) = 08334
Rata falşilor negativi = 7(7+16) = 03043
Sensibilitate = 1(1+7) = 01250
Specificitate = 16(16+5) = 07619
Acurateţe = (1+16)29 = 05862
Valoarea predictivă pozitivă = 1(1+5) = 01667
Valoarea predictivă negativă = 16(16+7) = 06957
Riscul relativ = 1(5+16)7(1+5) = 2142 = 050
Rata şansei = (1∙16)(7∙5) = 04571
Riscul atribuabil = 1(1+5)-7(7+16) = 01667-03043=-01376
Testarea asocierii icircn tabela de contingenţă
Testul χ2
Nu trebuie utilizat pentru eşantioane de volum mic
Testul este valid doar dacă valoarea expectată (aşteptată) pentru fiecare celulă este cel puţin
egală cu 1 şi frecvenţa absolută observată este de minim 5
Dacă aceste condiţii nu sunt icircndeplinite se aplică testul exact al lui Fisher (Fisherrsquos Exact Test)
Indică dacă cele două variabile sunt sau nu independente DAR NU cuantifică puterea asocierii
dintre ele
Problema S-a investigat icircntr-un studiu asocierea dintre obezitatea (ca factor de risc) şi bolile
cardio-vasculare la persoanele icircn etate (gt 60 ani) Din totalul de 620 persoane investigate s-au
identificat 150 persoane cu obezitate şi boală cardio-vasculară 230 persoane fără obezitate şi
fără boală cardio-vasculară şi 60 persoane fără obezitate dar cu boală cardio-vasculară Există
o asociere icircntre obezitate şi boala cardio-vasculară (df=1 α=005 χ2critic = 384)
Testul χ2 exemplu
H025
Nu există asociere icircntre obezitate şi bolile cardio-vasculare
Obezitatea şi bolile cardio-vasculare sunt independente
H1
Există asociere icircntre obezitate şi bolile cardio-vasculare
Obezitatea şi bolile cardio-vasculare sunt asociate
a = 005 pragul de semnificaţie al testului
urmează o lege cu (r-1)(c-1) grade de libertate
χ2 = parametrul testului χ2
fio = frecvenţa observată
fit = frecvenţa teoretică
Regiunea critică este [χα2 yen)
Pentru α = 005 χα2 = 384
OBSERVAT BCV+ BCV- Total
Obezitate + AP = 150 FP = 180 330
Obezitate - FN = 60 AN = 230 290
Total 210 410 620
TEORETIC BCV+ BCV- Total
Obezitate + = 330times210620 = 330times410620 330
Obezitate - = 290times210620 = 290times410620 290
Total 210 410 620
TEORETIC BCV+ BCV- Total
Obezitate + = 330times210620 = 330times410620 330
26
Obezitate - = 290times210620 = 290times410620 290
Total 210 410 620
TEORETIC BCV+ BCV-
Obezitate + = 112 = 218
Obezitate - = 98 = 192
Deoarece 4177Icirc[384 yen) se respinge H0 cu un risc de eroare de 5
Există asociere icircntre obezitate şi bolile cardio-vasculare
Testul Fisher
Corecţie a testului χ2
Valoarea p asociată parametrului ne dă probabilitatea ca valoarea observată de independenţă să fie
atribuită doar şansei
O valoare p mică indică că există alte cauze decacirct şansa influenţează rezultatul şi astfel cele două
variabile investigate nu sunt independente
Testul Fisher = dispersia corectată a factorului x dispersia corectată a factorilor reziduali
Icircn acest context regula adunării dispersiilor se poate scrie unde
este variaţia lui y pe seama variaţiei variabilei x
este variaţia lui y pe seama influenţei factorilor reziduali (neicircnregistraţi)
este variaţia totală a caracteristicii y
Testul Fisher empiric se calculează după formula
27
se compară cu Ftab pentru nx şi nz grade de libertate la un anumit prag de semnificaţie stabilit
Dacă Fc gt Ftab rezultă că variaţia factorului de grupare x este semnificativă pentru variaţia caracteristicii y
Testul z pentru proporţii
1 Compararea unei frecvenţe observate cu o frecvenţă teoretică
2 Testarea egalităţii a două frecvenţe
Testul z Compararea unei frecvenţe observate cu o frecvenţă teoretică
Scop Investigarea semnificaţiei diferenţei icircntre o frecvenţă teoretică p (icircntr-o populaţie) şi o frecvenţă
observată f pe un eşantion reprezentativ (variabilă calitativă (binare))
Condiţii de aplicare Testul este corect aplicat dacă numărul n al observaţiilor eşantionului este
suficient de mare (n∙p n∙(1-p)gt10
Parametrul
n = volumul eşantionului
Suntem interesaţi de investigarea prevalenţei hepatitei B la personalul care lucrează icircn laboratoarele
clinicilor de boli infecţioase din Transilvania Se ştie din studii anterioare că prevalenţa hepatitei B icircn
populaţia generală din Transilvania este de 9 S-a luat icircn studiu un eşantion de 100 persoane şi s-a
obţinut o prevalenţă a hepatitei B de 6 Există diferenţă semnificativă icircntre frecvenţa hepatitei B la
personalul care lucrează icircn laboratoarele spitalelor de boli infecţioase din Transilvania faţă de
populaţia generală
f = 006 p = 009 n = 100
Ipoteza nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat
faţă de frecvenţa hepatitei B icircn populaţia generală
Ipoteza alternativă test bilateral Există diferenţă semnificativă icircntre frecvenţa hepatitei B la
nivelul eşantionului şi prevalenţa hepatitei B icircn populaţia generală
f = 006 p = 009 n = 100
Pragul de semnificaţie a = 005
Regiunea critică test bilateral (-yen -196 ]Egrave[196 yen)
28
Concluzia testului
Deoarece parametrul statistic calculat al testului nu aparţine regiunii critice se acceptă ipoteza
nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat faţă de
frecvenţa hepatitei B icircn populaţia generală
Testul McNemar
Evaluarea dependenţei variabilelor calitative perechi (dorim să determinăm dacă o anumită
caracteristică este sau nu asociată cu o anumită patologie)
Identificăm n pacienţi care prezintă patologia de interes (eg Cancer bronho-pulmonar) şi n
pacienţi cu aceleaşi caracteristici ca şi primul grup dar care nu o prezintă
Martor = da Martor = nu
Caz = da a b
Caz = nu c d
Testul McNemar - exemplu fumat vs cancer
Martor = da Martor = nu
Cancer = da a = 2 b = 5
Cancer = nu c = 0 d = 3
29
χ2critic(α=005) = 384
32 lt 384 rarr acceptăm ipoteza nulă
Fumatul nu este icircn relaţie cu apariţia cancerului bronho-pulmonar
Inferenţa statistică pe date cantitative
Variabile cantitative continue
Testul z şi Student (t) (o medie sau medii perechi)
Testul z şi Student (t) (testarea a două medii)
ANOVA (ge 3 medii)
Ranguri (variabile cantitative discrete sau cantitative care nu icircndeplinesc condiţia de
normalitate)
Testul sumei rangurilor Wilcoxon
Kruskal-Wallis (ge 3 eşantioane independente)
Friedman (ge 3 eşantioane dependente)
Teste de normalitate variabile cantitative continue
Shapiro-Wilk
Kolmogorov-Smirnov
Shapiro-Wilk
Chi-Square Goodness-of-Fit
Dacă datele urmează o distribuţie normală aplicăm un test parametric
Dacă datele nu urmează o distribuţie normală aplicăm un test de comparare al rangurilor
30
Testul Z de comparare a mediei unui eşantion cu media unei populaţii
Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ
extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie
s2 care se cunoaşte
Condiţii de aplicare
1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru
compararea mediei unui eşantion cu media unei populaţii)
2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal
distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă
3 Talia eşantionului este mare ( ge 30)
Ipoteze
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media
eşantionului şi media populaţiei
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
(-yen -196 ] Egrave [196 yen)
Parametrul testului
n = volumul eşantionului
= media eşantionului
s = deviaţia standard a populaţiei
Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)
Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard
cunoscută
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi
media standard
Condiţii de aplicare
Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se
realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această
condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea
31
Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai
puternic
Numărul de grade de libertate (df) df = n-1
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
Parametrul testului
n = volumul eşantionului
micro0 = media standard
= media eşantionului
s = deviaţia standard a eşantionului
Testul ANOVA compararea mediilor a mai multe eşantioane
H0 = toate mediile sunt egale
H1 = nu toate mediile sunt egale
Condiţii de aplicare
1 Datele sunt independente unele faţă de celelalte
2 Datele fiecărui grup sunt normal distribuite
3 Deviaţia standard este aceeaşi pentru toate grupurile
Id Medicament
A B C D E F
1 5 6 7 10 5 9
2 6 8 8 11 8 8
3 7 7 9 13 6 7
4 8 9 11 12 4 5
32
5 9 10 10 9 7 6
Suma 35 40 45 55 30 35
Media 7 8 9 11 6 7
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =
= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)
Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2
F = (suma pătratelor(icircntre))(suma pătratelor(icircn))
Suma pătratelor (icircntre) = 16times5 = 80
Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60
Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn
interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare
SP df Media pătratelor F = MPicircntreMPicircn
Icircntre 80 5 = 805 = 16 = 1625 = 64
Icircn 60 24 = 6024 = 25
Total 140 29 -
Testul sumei rangurilor Wilcoxon
Aplicat pentru
Un set de observaţii provenite dintr-o valoare ipotetică comună
Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)
Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero
Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace
Suma rangurilor pentru diferenţele negative = 2+3+1 = 6
Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30
33
Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului
egal cu 8 = 0109
Icircnainte După Diferenţa Rang
64 66 -2 2
66 58 8 5
67 68 -1 3
71 65 6 4
72 75 -3 1
76 67 9 6
78 59 19 8
89 74 15 7
Testul Kruskal-Wallis (ge 3 eşantioane independente)
Test de ranguri aplicate pe mai mult de 3 eşantioane
H = parametrul testului
n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)
Tk = suma rangurilor
Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie
pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni
34
df = k-1 (k = numărul de eşantioane)
df = 3-1 = 2
Hcritic(α=005) = 599
H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie
pozitivă şi respectiv biopsie negativă
Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie
a tipului de studiu pe eşantioane perechi)
1 Definirea numărului de tratamente k
2 Obţinerea rangurilor pentru fiecare tratament
3 Sumarea rangurilor fiecărui tratament
4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)
5 Dacă Fr gt Frcritic rarr respingem H0
Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost
măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi
n = 9 k = 3 T12 = 225 T2
2 = 38025 T32 = 38025
Frcritic = 599
Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de
prostată
35
De reţinut
Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei
Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-
of-Fit
Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z
Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t
Compararea mediilor a 3 sau mai multe eşantioane ANOVA
Compararea mediilor a două populaţii (σ) testul Z
Compararea mediilor a două eşantioane (s) testul t
Compararea mediilor a două eşantioane perechi (s) testul t
ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi
cu cel pentru compararea a două eşantioane perechi
Ranguri
Distribuţia datelor nu are importanţă
Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)
Trei sau mai multe eşantioane Kruskal-Wallis
Trei sau mai multe eşantioane perechi Friedman
Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia
Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a
datelor)
Variabile nominale
Un singur eşantion sau eşantioane perechi
Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte
Eşantioane perechi testul Mc Nemar
Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2
Icircn analiza proporţiilor există teste diferite pentru
Compararea unei frecvenţe cu o frecvenţă cunoscută
Compararea a două frecvenţe
Semnificaţia statistică
Valoarea p (p value)
Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor
două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E
posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării
aleatorii
36
Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală
urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii
Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este
probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un
experiment de dimensiunea acestuia
Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că
diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii
diferite
Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca
fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă
ar fi fost adevărată
Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă
1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe
baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De
fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001
2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie
3 Se aplică testul statistic aferent pentru a calcula valoarea p
4 Se compară valoarea p cu valoarea ndash prag
5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe
semnificativă dpdv statisticrdquo
6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e
semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să
conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă
Teste de semnificaţie
Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului
populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)
Testarea ipotezelor implică posibile erori
Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile
sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui
grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul
icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005
ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există
37
nici o diferenţă
Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ
statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de
ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost
ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau
dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă
cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă
semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe
ipotetice variate icircn cazul icircn care ele există
Măsuri ale frecvenţei
Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)
Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate
Generic formula pe care se bazează toate cele trei este
unde x şi y sunt cantităţile de comparat
Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea
unei frecvenţe pe grupe de sex vacircrstă etc
Proporţia implică icircn mod necesar ca x să fie inclus icircn y
Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară
frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp
Pentru calcularea unei rate trebuie ţinut cont de trei aspecte
bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin
bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp
bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo
Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un
tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei
populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei
aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)
38
Indicatori
Rata de incidenţă
Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă
icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii
Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o
perioadă de timp
Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de
timp x
Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei
susceptibili de a dezvolta icircmbolnăvirea studiată
Numitorul poate fi
bull Numărul mediu al populaţiei icircn perioada de timp studiată
bull Mărimea populaţiei icircn mijlocul perioadei de studiu
bull Mărimea populaţiei la icircnceputul studiului
Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă
Este obligatorie menţionarea perioadei de timp
Prevalenţa
Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la
un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă
schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa
momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)
39
Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include
numai cazuri noi respectiv include cazuri noi şi vechi
Rata de atac
Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este
folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp
raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori
Rata persoană-timp
Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din
momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte
migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost
observate
Riscul relativ (RR)
Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment
legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele
prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două
grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la
bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la
bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai
mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo
Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2
Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn
cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă
(Tabelul 1)
Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR
Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la
neexpuşi
40
Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de
culegere a datelor
Odds ratio (OR)
Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin
raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general
studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)
Tabelul 2 Tabelul 2 x 2 pentru calcularea OR
Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală
Rate de mortalitate
Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp
specificată Există mai multe tipuri de rate de mortalitate
o Mortalitate specifică pe sex
o Mortalitate specifică pe rasă
o Mortalitate specifică pe boală
o Mortalitate neonatală
o Mortalitate postneonatală
o Mortalitate infantilă
o Mortalitate maternă
Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP
41
Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de
viaţă şi vacircrsta la care survine decesul dacă este prematur
Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu
Ani de viaţă pierduţi datorat dizabilităţii
Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt
utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru
cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite
grupuri
Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de
risc şi o boală se folosesc riscul relativ şi odds ratio
35 Analiza şi interpretarea datelor
După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date
trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul
Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor
colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului
studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu
plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde
prezenţa biostatisticianului este necesară
Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu
elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat
iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului
iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate
depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori
testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere
clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza
Interpretarea rezultatelor statistice
Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne
motive (număr mic de date) acceptarea ei să fie falsă
Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine
gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia
ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument
de decizie Intervalul de confidenţă
42
Interpretarea statistica ne interpretarea clinică
Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă
Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice
obţinute pe eşantionul studiat
Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare
Ce interpretăm Rezultatele
personale obţinute icircn urma studiului
care au fost prezentate icircn secţiunea bdquoRezultaterdquo
Explicăm rezultatele obţinute
Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale
Interpretarea trebuie să se realizeze icircn
lumina limitelor studiului
contextul cultural social şi educaţional al locului unde s-a realizat cercetarea
contextul a ceea ce se cunoaşte din literatura de specialitate
Interpretăm doar rezultatele personale obţinute icircn urma studiului
Interpretarea statistică nu este tot una cu interpretarea clinică
Interpretarea statistică este importantă
Interpretarea clinică este foarte importantă
Intervalul de confidenţă
Media calculată pe baza unui eşantion nu va echivala media populaţiei
Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului
Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a
populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a
populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)
pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru
orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare
dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de
confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de
date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de
5
Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel
Dacă valoarea p este mică
Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare
aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o
medie diferită Diferenţa este semnificativă dpdv statistic
43
Icircn continuare
Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa
reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică
pentru a fi interesante din punct de vedere ştiinţific
Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC
oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care
este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a
obţine o concluzie clară
Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o
diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că
datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din
punct de vedere ştiinţific
Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul
detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat
Erorile studiilor medicale
Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura
anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară
caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea
asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri
legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias
Erorile potenţiale icircn studiile epidemiologice
1 Erori icircntacircmplătoare
2 Erori sistematice
3 Confuzia
4 Validitatea
1 Erori icircntacircmplătoare
Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a
parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel
de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot
fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii
(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor
de măsură (eroarea de măsurare)
44
2 Erori sistematice
Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate
care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu
acurateţe mare Acurateţea nu este afectată de mărimea eşantionului
Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de
experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea
dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus
şi greu de cuantificat (consum de alcool personalitate etc)
Principalele tipuri de erori din această categorie sunt
bull Biasul de selecţie
bull Biasul de informaţie
Biasul de selecţie
Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul
trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion
inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale
persoanelor incluse
Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se
ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia
Biasul de informaţie
Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de
instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze
expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere
nesemnificativă sau chiar să nu şi-o amintească de loc
3 Confuzia
Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune
prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este
cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă
de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte
important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor
protector
4 Validitatea
Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă
Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte
estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional
Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă
45
conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se
demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)
Validitatea externă se poate realiza numai dacă studiul este valid intern
Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii
studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de
studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt
laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi
validă din punct de vedere intern)
3 6 Prezentarea rezultatelor
După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite
Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor
icircntr-o formă bdquodigerabilărdquo este necesară
Scopul prezentării datelor
1 Transmiterea concluziilor studiului
a Datele corecte şi importante merită comunicate
b Datele trebuie să confirme sau să infirme ipoteza studiului
c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală
2 Acordarea posibilităţii altor cercetători să aprecieze studiul
a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti
b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor
prezentate
Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru
fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie
statistică
Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de
valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras
(Tabel 3)
Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)
46
Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct
numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor
precum şi prezentarea acestora sub formă inteligibilă
Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care
convin cercetătorului
Prezentarea datelor se poate face
1 Figuri şi tabele icircn articole scrise
2 Figuri şi tabele icircn prezentări orale
3 Figuri şi tabele icircn postere
4 Text scris sau incluse icircn text
5 Site-uri de WEB
Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor
Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie
Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele
exprimacircnd exact ceea ce acestea exprimă
Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate
anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel
să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se
acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca
mai sus sugestive sunt formatele simple şi puţin icircncărcate
Dacă nu există reguli impuse se respectă
1 Mesaj simplu fără falsificarea datelor
2 De obicei este necesar atacirct tabelul cacirct şi graficul
3 Să fie simplu şi clar
Tabele
Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile
coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică
elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de
1 Se folosesc doar linii orizontale
2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn
evidenţi prin linie de separare (Tabelul 4)
Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland
Noua Zeelandă)
(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)
47
3 Numerele sunt aliniate icircn funcţie de virgulă
4 Indicii statistici sunt explicaţi sub tabel
5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană
6 Abrevierile pot fi folosite
7 Numărul de zecimale trebuie limitat la maxim două
8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel
9 Plasarea legendei este obligatorie sub tabel
10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)
Icircn cazul prezentărilor orale sau a posterelor este indicat ca
1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării
2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte
3 Folosirea de simboluri este permisă
Clasificarea tabelelor
Tabelele se clasifică după
i) conţinut
bull cu distribuţii de frecvenţe
bull de clase de frecvenţe
bull de contingenţă
ii) structura
bull cu doua coloane
bull cu subclasificări
bull ldquomasterrdquo
Tabele ce conţin distribuţii de frecvenţe
O modalitate comodă de a prezenta o mulţime de date brute este
1 Se ordonează datele in ordine crescătoare
2 Se determine frecvenţa fiecărei valori
3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane
(Tabelul 5)
Tabelul 5 Distribuţii de frecvenţă absolută
48
Tabelul claselor de frecvenţe
1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă
2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)
Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)
Tabele de contingenţă
1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a
tabelelor de contingenţă
2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a
combinaţiilor de perechi ordonate de valori
3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre
a factor de risc si
b starea sănătăţii
4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)
5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)
Tabelul 7 Tabel de contingenţă 2 x 2
49
Grafice
Există două categorii de moduri grafice sub care se pot prezenta datele
1 Ilustraţii şi fotografii
2 Grafice
1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă
pentru lucrare
2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit
Putem vorbi despre mai multe tipuri de grafice
bull Grafice pentru reprezentarea datelor cantitative
1048707 Grafic cartezian (X Y)
1048707 Histograma
1048707 Poligonul de frecvenţe
1048707 Diagrama bdquoscatterrdquo
bull Grafice pentru reprezentarea datelor calitative
1048707 Grafic cu bare
1048707 Diagrama tip bdquoboxplotrdquo
1048707 Diagrama bdquopierdquo
1048707 Cartograma
Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi
dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)
Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)
Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie
Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)
Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)
50
Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir
de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele
două variabile studiate (Figura 6)
Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2
(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2
rămacircne aproximativ constantă)
Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea
comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea
comparativă a mai multor variabile
Figura 7 Grafic calitativ cu bare
51
Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo
Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două
posibilităţi reprezentate grafic este mai frecventă (Figura 8)
Figura 8 Reprezentare tip bdquopierdquo
Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli
sau a oricărui element comparativ Se foloseşte de epidemiologi
Rezultate
Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare
Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o
manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu
explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția
bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la
ilustraţii tabele grafice
Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi
nici rezultatele care invalidează eventual ipoteza
Discuţii
Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd
cultura ştiinţifică şi inteligenţa autorilor
Acest capitol răspunde la trei obiective
Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia
calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de
selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează
rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv
52
este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn
care a fost abordată problema fără a face o revistă a literaturii
Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea
rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul
Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor
afirmaţii nesusţinute de conţinutul lucrării
Concluzii
Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate
să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie
Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de
concluzii va scădea valoarea lucrării
Bibliografia (lista referinţelor citarea icircn text)
Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn
lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente
Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli
- să conţină cele mai importante şi recente lucrări
- să includă numai lucrări publicate
- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate
Bibliografie
Elisabeta Jaba ndash Statistică Ed Economică 1998
Mihai Ţarcă ndash Statistică volI Ed UAIC 1979
Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale
Ed University Press 2009
Sorana Daniela Bolboacă ndash Metodologia cercetării curs
53
32 Elaborarea proiectului
Protocolul de cercetare este un document care emite obiectivul și ipoteza studiului definește condițiile de
desfășurare și realizare a viitorului studiu clinic Elaborarea protocolului este importantă pentru cercetătorii
participanţi la studiu comisiile de etică şi finanţatori
Protocolul include mai multe formulare care trebuie să cuprindă
a) Titlul proiectului
b) Sumarul proiectului
c) Descrierea proiectului
d) Normele deontologice de cercetare
e) Modalitățile de diseminarea și valorificarea rezultatelor
f) Perspective de continuare a cercetării
g) Anexe
Prezentarea proiectului va include următoarele fișiere
bull resursele umane (membrii echipei afilierea acestora)
bull relevanța temei pentru dezvoltarea cunoașterii icircn domeniu
bull stadiul actual al cunoașterii și bibliografia aferentă
bull justificarea studiului
bull enunțarea obiectivelor și ipoteza de lucru
bull metodologia propriu-zisă
Referitor la metodologia utilizată vor trebui menționate
bull factorulfactorii studiați care reprezintă variabila independentă respectiv dacă este cazul modalitățile de
măsurare
bull criteriile de raționament- variabila dependentă (situația sau evenimentul ce se presupune a fi rezultatul
factorului studiat cum ar fi boala handicapul complicații decesul)
bull tipul de studiu care se va aplica icircmpreună cu design-ul acestuia
bull eșantioanele de lucru și modalitățile de eșantionaj
bull metodele de culegere și de prelucrare a datelor
bull planificarea activităților
bull structura bugetului fiind eligibile următoarele categorii de cheltuieli de capital (echipamente software
upgrading) pentru personal (full sau part-time instruire asigurări de sănătate) de informare (documentare
abonamente) mobilități (vizite la alte unități de cercetare participări la
congrese) materiale consumabile (truse reactanți papetărie) valorificare a rezultatelor (lucrări științifice de
etapă sau lucrarea finală) cheltuieli indirecte (de regie)
bull modalităţile de valorificare a rezultatelor
bull legături de alte proiecte
8
Protocolul mai conține anexe curriculum vitae al investigatorului principal și al coinvestigatorilor
calendarul activităților avizul Comisiei de etică documente speciale și
consimțămacircntul informat icircn cazul studiilor pe subiecți umani
Icircnainte de implementare protocolul va fi verificat de experți pentru eligibilitate (dacă sunt icircndeplinite
condițiile de acceptare finanțare) calitate și pertinență icircn sensul că protocolul trebuie să fie clar exprimat
corect icircntocmit bine așezat și cu repercursiuni favorabile pentru viitor
33 Culegerea informaţiei
Pentru a realiza o cercetare medicală culegerea datelor este prima etapă şi realizează icircn funcţie de
obiectivele propuse tipul studiului timpul disponibil şi resurse umane şi financiare
Există două mari posibilităţi de culegere
bull Icircn funcţie de elementele studiate
o Culegerea exaustivă Toţi subiecţii populaţiei pe care dorim să o studiem Greu de realizat din cauza
costurilor foarte mari sau a alterării populaţiei de studiu
o Prin eşantionare Este metoda folosită icircn studii medicale
bull Icircn funcţie de durata culegerii
o Transversală Se studiază un grup la un moment dat
o Longitudinală Extinsă in timp
- Retrospectivă ndash icircnregistrări medicale
- Prospectivă ndash date culese la intervale prestabilite de timp
Populaţia ţintă
Este orice colectivitate icircntreagă de oameni animale plante sau obiecte de la care putem colecta date Populaţia
ţintă este icircntregul grup care ne interesează pe care dorim să-l descriem sau să tragem concluzii despre el
Pentru a putea realiza generalizări spre populaţia ţintă deseori suntem obligaţi să folosim un eşantion (selecţie)
care icircnsă trebuie să fie reprezentativ pentru populaţia pe care vrem să o studiem Pentru fiecare populaţie de
studiu sunt posibile mai multe eşantioane Pe baza acestor eşantioane se calculează un estimator Pe baza
acestui estimator calculat care poate fi medie aritmetică procent etc se pot trage concluzii despre icircntreaga
populaţie Este foarte important ca investigatorul să definească foarte atent şi complet populaţia icircnainte de a
realiza eşantionul inclusiv descrierea criteriilor de includere şi excludere icircn populaţia de studiu
Eşantionul
Un eşantion este practic un grup de elemente selectate dintr-un grup mai extins (populaţia ţintă) Studiind
eşantionul selectat se pot trage concluzii despre grupul de unde a fost ales (populaţia ţintă)
Este icircn general ales pentru studiu pentru că
bull Populaţia ţintă este prea mare şi nu poate fi studiată ca icircntreg
bull Nu avem acces din diverse motive decacirct la parte din populaţia de studiu
9
bull Un studiu pe icircntreaga populaţie poate distruge populaţia
bull Eşantioanele pot fi studiate mai rapid
bull Costul şi resursele necesare studiului sunt mai reduse
Numărul elementelor dintr-un eşantion se numeşte talia sau volumul selecţiei
Acesta fiind icircn general mai mic decacirct icircntreaga populaţie poate fi observat icircn detaliu iar dacă este reprezentativ
se pot afla prin intermediul său proprietăţile populaţiei ţintă
Eşantionul trebuie să fie reprezentativ pentru populaţia generală De aceea dintre metodele de eşantionare se
folosesc tehnicile de randomizare Trebuie să satisfacă două condiţii principale
bull condiţie de ordin cantitativ talia să fie suficient de mare
bull condiţie de ordin calitativ trebuie extras aleator din populaţia ţintă
Metode de eşantionare
Putem vorbi icircn linii mari de două posibilităţi de eşantionare prin metode probabilistice şi prin metode
nonprobabilistice
Eşantionarea probabilistică este metoda cea mai folosită icircn studiile medicale fiind şi cea indicată pentru a
realiza reprezentativitatea calitativă
Icircn medicină se folosesc patru tipuri de eşantionări
1 Simplu randomizat
2 Sistematic
3 Stratificat
4 Cluster (icircn cuiburi)
1 Eşantionul simplu randomizat Fiecare element din populaţia ţintă are o şansă egală non zero de a fi
inclus icircn eşantion Se ia la icircntacircmplare un număr de elemente egal cu talia eşantionului Dezavantajul acestui tip
de eşantionare este că presupune cunoaşterea icircntregii populaţii ţintă
2 Eşantionul sistematic După aflarea taliei eşantionului şi a populaţiei ţintă se calculează factorul de
eşantionare k icircmpărţind talia populaţiei ţintă la volumul eşantionului Apoi fiecare al k-lea element este
selectat spre includere
Acelaşi mare dezavantaj apare şi icircn acest caz fiind obligatorie cunoaşterea icircntregii populaţii de studiu
3 Eşantionul stratificat Există icircn cele mai multe cazuri probleme medicale care studiindu-se pe eşantion
prezintă variabilităţi icircn funcţie de caracteristicile populaţiei (sex vacircrstă nivel de pregătire etc) Icircn acest caz
este obligatorie realizarea similitudinii demografice a eşantionului cu populaţia de studiu Din date provenite
de la Centrul de Statistică putem dezvolta ca procente o structură a populaţiei Această structură trebuie să se
regăsească (procentual) şi icircntre membrii eşantionului O importantă şansă ca reprezentativitatea calitativă să fie
corectă este conferită de respectarea
acestei similitudini demografice
10
4 Eşantionul bdquoclusterrdquo sau icircn cuiburi Icircn cazul unui studiu amplu cu scop de a investiga populaţia unei
icircntregi ţări sau regiuni putem ajunge icircn imposibilitatea de a alege şi mai ales investiga indivizi răspacircndiţi prin
icircntreaga zonă Din acest motiv se desemnează la icircntacircmplare un număr calculabil de
grupuri populaţionale extinse icircn toată zona de studiu Aceste grupuri poartă numele de bdquocuiburirdquo La nivelul
fiecărui bdquocuibrdquo se aplică o tehnică precedentă de selecţie a cazurilor Se poate sau de cele mai multe ori se face
la nivel de bdquocuibrdquo stratificarea iar apoi selecţia propriu-zisă se realizează sistematic sau simplu randomizat
Este metoda de eşantionare cel mai frecvent utilizată icircn cercetarea medicală de amploare Pentru ca eventualele
erori să nu se poată strecura s-a definit şi un indice DEF (design effect) cu care trebuie multiplicată talia
selecţiei care pentru eşantionarea icircn bdquocuiburirdquo este egal cu 2 astfel putem obţine şi o reprezentativitate
calitativă dar şi una cantitativă
Eşantionarea nonprobabilistică este o metodă neindicată icircn studiile medicale datorită lipsei de forţă icircn ceea ce
priveşte posibilitatea de aplicare a concluziilor asupra populaţiei de studiu
Se definesc şi icircn acest caz patru metode
1 Eşantion de convenienţă Membrii unui astfel de eşantion sunt aleşi numai pentru că sunt la icircndemacircnă
disponibili de a răspunde le un eventual chestionar
2 Eşantion pe cote Similar cu tipul de eşantion stratificat se referă la faptul că selecţia se face formacircnd
eşantionul din primele 30 de persoane care respectă un criteriu impus
3 Eşantion cu un scop Elementele incluse icircn eşantion sunt alese după un criteriu care exclude din start marea
majoritate a populaţiei
4 Eşantion raţional Selecţia se face prin prisma unui raţionament al celui care conduce studiul
Parametru şi estimator
Parametrul este o valoare de obicei necunoscută (şi care trebuie să fie estimată prin studiu) folosită pentru a
reprezenta o anumită caracteristică a populaţiei de studiu De exemplu media populaţiei (icircnălţime) este un
parametru populaţional Raportat la o populaţie parametrul este o valoare fixă şi exactă care nu variază
Fiecare eşantion extras din populaţie va indica o valoare a mediei care nu poate decacirct să estimeze parametrul
Icircn general parametrii sunt notaţi cu litere greceşti (ex Media = μ)
Estimatorul este o valoare calculată dintr-un eşantion studiat Este folosit pentru a putea aprecia parametrul
populaţional pe care icircn căutăm Este de asemenea posibil ca dintr-o populaţie să formăm mai multe eşantioane
mediile lor de cele mai multe ori nefiind identice icircntre ele şi nici identice cu media populaţiei Estimatorii
sunt notaţi cu litere latine (ex Media = μ)
Dacă valoarea mediei calculată pe eşantion este de exemplu 168 cm atunci putem estima ca valoarea mediei
icircn populaţie este 168 cm
11
Tipuri de culegere a datelor
1 Culegere de tip eşantion reprezentativ Grupul de indivizi incluşi icircn studiu sunt reprezentativi (calitativ şi
cantitativ) pentru populaţia generală Poate fi utilizat pentru studii descriptive (cel mai frecvent) dar uneori şi
pentru studii analitice
Este necesar pentru acest tip de culegere a datelor ca iniţial să fie cunoscută talia eşantionului (calculabilă icircn
funcţie de prevalenţă şi precizie) Pentru evaluarea datelor culese se utilizează tabelul de contingenţă 2 x 2
astfel (Figura 1)
Figura 1 - Tabelul de contingenţă 2 x 2
Unde
a ndash persoane expuse unui factor de risc care au boala studiată
b ndash persoane expuse unui factor de risc care nu au boala studiată
c - persoane neexpuse unui factor de risc care au boala studiată
d - persoane neexpuse unui factor de risc care nu au boala studiată
După aranjarea datelor icircn tabelul de contingenţă (2 x 2) se poate icircncepe analiza statistică a datelor atacirct ca
procente calculabile cacirct şi din punct de vedere a aplicării de teste statistice pentru elucidarea semnificaţiei
statistice
Este posibilă din acest tip de culegere de date calcularea
1 Prevalenţei unei boli
2 Frecvenţei expunerii
3 Gradul de asociere icircntre factorul eventual de risc şi boala
2 Culegerea de tip expus ndash neexpus Icircmparte subiecţii icircn două categorii expuşi sau neexpuşi factorului de risc
studiat Ca evoluţie următoare a studiului după o astfel de culegere a datelor se poate evalua icircn timp apariţia
icircmbolnăvirii despre care se efectuează studiul Icircn timp longitudinal prospectiv se poate calcula dacă factorul
studiat reprezintă un risc de icircmbolnăvire este indiferent sau chiar este cu efect protectiv Numărul subiecţilor
din cele două grupuri poate fi egal sau poate fi diferit Numărul acestora poate fi calculat icircn vederea obţinerii
unei bune reprezentativităţi cu ajutorul formulelor de selecţie Avacircnd icircn vedere calitatea longitudinală a
12
studiului este important ca numărul ales să fie mai mare pentru a putea suplinii eventualele pierderi din
urmărire Practic rezultatele sunt introduse icircn tabelul 2 x 2 de unde se pot calcula indicatorii doriţi (Figura 2)
Avacircnd icircn vedere modul de culegere a datelor este permisă calcularea de indicatori numai pe orizontală
orice comparare icircntre coloana dreaptă şi stacircngă fiind incorectă Avantajul acestui tip de culegere a datelor ar fi
eventualul număr mai redus de subiecţi dar dezavantajul major este cel al costurilor de urmărire icircn timp dar
trebuie luată icircn calcul şi pierderea de subiecţi din evidenţe Factorul controlat este deci prezenţa expunerii iar
factorul aleator este prezenţa bolii
Figura 2 Tabelul de contingenţă pentru tipul de culegere expus ndash neexpus
4 Culegerea de tip caz ndash martor Icircn acest caz ceea ce ghidează colectarea datelor este prezenţa sau absenţa
bolii icircn momentul prezent Se vor culege date de la două loturi constituite după criteriul de bolnav B+ şi de fără
boală B+ Datele culese sunt icircn trecut deci caracterul datelor va fi retrospectiv Icircn acest caz factorul controlat
este boala factorul aleator fiind expunerea (Figura 3)
Calculul de indicatori icircn acest caz se va putea efectua numai icircntre coloane orice calcul icircntre valorile de pe linii
fiind greşit Rezultate semnificative se pot obţine icircn acest caz utilizacircnd loturi mai mici de studiu prin
comparaţie cu tipul eşantion reprezentativ permiţacircnd icircn acelaşi timp studiul bolilor rare (cu prevalenţă mică)
Figura 3 Tabelul de contingenţă pentru tipul de culegere caz ndash martor
Metode de culegere a datelor
Metoda aleasă pentru culegerea datelor trebuie să fie aleasă după un atent studiu bibliografic icircn vederea
stabilirii celui mai eficient mod de a răspunde temei de studiu
Metodele de culegere trebuie să fie bine aplicabile şi consistente ca aport informaţional necesar
13
1 Fiziologice Sunt colectate date despre anumite caracteristici fiziologice ale pacienţilor (TA glicemie
colesterol etc) Această metodă aduce rezultate obiective cacirct timp instrumentul de evaluare este bine calibrat
şi prezintă variaţii mici
2 Metode observaţionale Instrumentul de culegere a datelor trebuie să fie sincronizat cu protocolul conceput
de cercetător Datele culese trebuie să fie de asemenea consistente adică să fie colectate de aceeaşi manieră
conducătorul studiului trebuind să instruiască investigatorii (colectorii de date) Icircnregistrarea datelor trebuie să
fie de asemenea sistematică şi bine standardizată Observaţii de control trebuie icircn mod obligatoriu făcute
pentru a putea aprecia icircn mod corect orice deviere datorată unor factorii externi Este obligatorie luarea icircn
consideraţie a aspectelor etice
3 Interviul Poate fi structurat cu un set specific de icircntrebări sau nestructurat cu o temă generală cu care se
icircncepe interviul Interviurile pot fi icircnregistrate sau intervievatorul poate nota pur şi simplu răspunsurile Există
două tipuri generice de interviu interviul de profunzime care se referă la o discuţie icircn general structurată cu
un număr de icircntrebări prestabilite icircn icircncăperea de studiu fiind doară intervievatorul şi persoana chestionată şi
interviul de grup unde prin conversaţii pornind de la temă generală expusă şi condusă de intervievator se
obţin date despre subiecţii participanţi la studiu Ambele metode de interviu au indicaţiile lor precise Un
interviu pe teme intime nu va putea fi corect icircn ceea ce priveşte datele colectate dacă se aplică un interviu de
grup
4 Chestionarul Document scris adresat unor persoane pentru a răspunde la una sau mai multe icircntrebări
Trebuie să aducă răspunsurile la icircntrebările care motivează studiul constituind ansamblul icircntrebărilor destinate
culegerii de informaţii (date) Redactarea chestionarului trebuie să ţină cont de structura acestuia introducere
conţinut exprimarea icircntrebărilor grafica chestionarului
5 Icircnregistrări preexistente
Icircn cercetarea medicală sunt cel mai frecvent utilizate Informaţiile dorite sunt deja existente ceea ce icirci revine
cercetătorului este ca să structureze datele icircn funcţie de scopul studiului pe care icircn conduce Aceste surse sunt
bull Foi de observaţie
bull Registre de consultaţie
bull Buletine de analize
bull Registre de operaţii
Icircn cazul icircn care nici o metodă de culegere a datelor nu este pe placul celui ce conduce studiul există
posibilitatea de a construi un instrument nou de culegere a datelor
Acest proces trebuie să urmărească nişte paşi obligatorii fiind mare consumator de timp
bull Definirea structurii cu care se va face măsurarea
bull Formularea itemilor de măsură
bull Analiza validităţii instrumentului de măsură ndash măsoară acesta fenomenul corect
bull Elaborarea de instrucţiuni de utilizare pentru investigatori
14
bull Pretestarea instrumentului
bull Aprecierea validităţii interne şi externe a datelor culese
Instrumente de cercetare
Formularea clară a temei de cercetare necesită o foarte bună definire a factorilor studiaţi şi a criteriilor de
judecată Acestea din urmă sunt ultimele care vor trebui definite icircn cadrul protocolului de studiu
Alegerea unui instrument de măsură
Nu există un instrument de măsură perfect sau universal corect Alegerea sa dintre cele existente şi cele deja
utilizate depind de trei factori
bull Obiectivul studiului
bull Boala studiată
bull Populaţia icircn studiu
De aceste trei elemente trebuie ţinut cont icircn fiecare etapă a dezvoltării instrumentului
Definirea obiectivului
Studiu transversal Dacă se doreşte studierea unui simptom sau a unei caracteristici ale populaţiei se poate
icircmpărţi populaţia de studiu icircn mai multe grupuri Este practic vorba de a determina diferenţele dintre subiecţi
icircn cea ce priveşte o variabilă necesară studiată printr-un studiu transversal (utilizarea dozării de Ac HBS
pentru a evalua progresele bolnavilor de hepatită tip B)
Studiu longitudinal Icircn acest caz nu se poate icircmpărţii populaţia de studiu icircn mai multe grupuri datele obţinute
fiind de la acelaşi subiect colectate după un interval de timp
Icircn funcţie de boală şi populaţie se aleg şi instrumentele de măsură cele mai adecvate
Instrumentele cercetării reprezintă un mecanism specific sau o strategie pe care cercetătorul o utilizează pentru
colectarea prelucrarea şi inferenţa datelor Aceste instrumente sunt
1 Studiul icircn bibliotecă
2 Computerul
3 Determinările experimentale
4 Statistica
5 Mintea umană
6 Facilităţi de limbaj şi comunicare
Determinările experimentale
Măsurarea constă icircn aprecierea şi cuantificarea fenomenelor calitativ sau cantitativ Interpretarea
datelor se referă la transformarea lor icircn unităţi de descoperire a unor fenomene mai puţin cercetate
Standardele acceptate se referă la norme medii distribuţii etc Tot icircn cadrul interpretării datelor datele
obţinute sunt caracterizate pe scale de valori nominal ordinal de interval sau de raport
Validarea şi reproductibilitatea măsurătorilor sunt aspecte importante şi foarte necesare pentru o
cercetare corect fundamentată care doreşte obţinerea unor concluzii pertinente
15
Statistica Este implicată icircn condensarea şi procesarea unui volum mai mare de date astfel icircncacirct să se poată
interpreta corect valorile obţinute şi să se permită comparările Utilizarea unor teste statistice specifice permite
determinarea semnificaţiei (diferenţei) statistice astfel icircncacirct estimatorii să poată fi aplicaţi la populaţia
generală Furnizează informaţii şi privind corelarea sau relaţionarea icircntre date
Mintea umană este cea care reuşeşte să integreze şi să icircnţeleagă rezultatele obţinute Semnificaţia ştiinţifică
este stabilită icircn funcţie de rezultatele statisticii de mintea umană conform afirmaţiei bdquosemnificaţia ştiinţifică
nu este egală cu semnificaţia statisticărdquo Metodele aplicate pentru a putea ajunge la o concluzie pertinentă sunt
logica deductivă raţionamentul inductiv şi gacircndirea critică
Limbaj şi comunicare Exprimarea orală sau icircn scris permite nuanţarea unor aspecte seci cifrice ale unor
studii Icircn acest mod devine mai evidentă semnificaţia ştiinţifică a unor rezultate statistice
34 Prelucrarea datelor
Instrumentele de prelucrare
Statistica este o ştiinţă ramură a matematicii care studiază evoluţia fenomenelor şi proceselor
colective pe baza observării lor ştiinţifice a culegerii şi prelucrării detaliate a informaţiilor statistice cu scopul
de a formula şi explica legile legităţile şi regularităţile ce le guvernează
Statistica permite deci aprecierea unor parametrii populaţionali prin studiul unui număr redus de
elemente ale populaţiei icircn studiu (ţintă) O populaţie poate fi definită printr-un şir de valori care pot fi grupate
icircn funcţie de parametrul studiat (glicemie colesterol TAD TAS etc) Pentru fiecare astfel de şir se defineşte
o variabilă (care va purta nume propriu glicemie colesterol etc) Practic variabila este considerată o funcţie
ia valori posibil diferite de la un element la altul icircn funcţie de caracteristicile proprii acestora Sunt clasificate
icircn două grupe variabile cantitative (caracteristică măsurabilă) şi calitative (caracteristică ce nu poate fi
măsurată)
La racircndul lor variabilele calitative pot fi
bull Nominale ndash grupuri de elemente ce nu pot fi ordonate (culoarea părului)
bull Nominale ordonate ndash concluziile pot fi grupate (eficienţa unui tratament slabă bună foarte bună)
bull Binare ndash apar numai două posibilităţi (bolnav sănătos)
Variabilele cantitative pot fi
bull Continue ndash o variabilă măsurabilă care poate lua o infinitate de valori
bull Discrete ndash variabile care nu pot lua decacirct valori icircntregi
Statistica descriptivă
Există două ramuri ale statisticii statistica descriptivă şi statistica inferenţială
Statistica descriptivă (după cum rezultă din denumire) se ocupă cu descrierea unor valori obţinute ale unei
variabile studiate
16
Valorile pe care variabila le ia se constituie icircntr-o serie statistică Indicatorii care definesc o variabilă (serie)
sunt
1 Ale tendinţei centrale
Media aritmetică - notată de regulă cu
Mediana - este acea valoare din şirul de date care icircmparte icircn două părţi egale şirul ordonat de valori (atenţie
şirul este ordonat crescător) situacircndu-se la mijlocul seriei statistice
Dacă numărul de valori n este un număr impar atunci mediana este valoarea unde
Dacă n este par deci avem un număr par de valori mediana este definitatilde ca fiind
unde k = n2
Modul - constituie valoarea care apare cel mai des deci valoarea cu numărul cel mai mare de apariţii
2 De dispersie
Amplitudinea - este diferenţa dintre valoarea maximă şi cea minimă
A = Amax - Amin
Amplitudinea relativă - notată A este raportul dintre amplitudinea absolută şi media aritmetică a seriei de
date
Varianţa notată este un indicator de icircmprăştiere a datelor Formula de calcul este
Abaterea standard (S) sau deviaţia standard reprezintă rădăcina pătrată din varianţă (dispersie)
Coeficientul de variaţie se calculează ca un raport procentual icircntre abaterea standard şi valoarea medie a şirului
de valori
Eroarea standard intervine icircn estimarea intervalelor de confidenţă Se calculează astfel
17
3 De asimetrie (skewness) indică distribuţia datelor dacă sunt sau nu distribuite normal
4 De boltire (kurtosis) estimează boltirea sau aplatizarea curbei de distribuţie
Prezentarea descriptivă a datelor se face prin icircnregistrarea datelor culese icircn tabele care să reprezinte icircn mod
sintetic valorile măsurate
Icircn concluzie statistica descriptivă permite
bull Stabilirea comparabilităţii icircntre grupurile de studiu şi aprecierea prezenţei erorilor sau confuziei
bull Reprezentarea datelor icircn tabele permite evaluarea fiecărui pacient şi dacă a existat pierderi din studiu
Statistica inferenţială
Statistica inferenţială (inductivă) este partea de analiză a datelor care permite extrapolarea unei
concluzii trase pe baza unui eşantion spre populaţia ţintă pentru care a fost efectuat studiul
Scopul analizei statistice este de a evidenţia efectul unui tratament sau al unui factor de risc prin date obţinute
din eşantionul studiat spre populaţia ţintă Aceasta implică testarea ipotezelor statistice sau altfel spus testarea
semnificaţiei statistice Este una dintre cele mai importante momente ale studiului Cum rezultatele sunt
obţinute prin studiul unui eşantion există posibilitatea ca acestea să fie datorate icircntacircmplării Testele
statistice ne ajută să apreciem icircn ce măsură rezultatele sunt icircntacircmplătoare şi mai ales icircn ce măsură şi dacă se
pot aplica populaţiei generale Icircn acest scop se impune o valoare limită alfa 005 care reprezintă limita
superioară a probabilităţii ca rezultatul obţinut să fie greşit (datorat icircntacircmplării) Astfel icircn funcţie de tipul
variabilelor şi indicatorii descriptivi aplicaţi şi evaluaţi se aplică teste de semnificaţie statistică (Tabelul 1)
Tabelul 1 Alegerea testelor de semnificaţie statistică
Tipul datelor
18
Diferenţierea variabilelor din punctul de vedere a distribuţiei se face folosind testul de normalitate
Kolmogorov ndash Smirnov
Testul statistic reprezintă metoda de comparaţie a două sau mai multe populaţii prin intermediul unor
variabile observate ale lor
Scopul unui test statistic este de a defini realitatea
Definirea icircntrebării de cercetare (ipoteza clinică)
Tratamentul cu Nebivolol este la fel de eficient ca şi cel cu Valsartan icircn tratamentul
hipertensiunii arteriale
Transpunerea icircntrebării de cercetare icircn termeni statistici (ipoteza statistică)
Media tensiunii arteriale a pacienţilor trataţi cu Valsartan nu diferă semnificativ de media
tensiunii arteriale a pacienţilor trataţi cu Nebivolol
Etapele unui test statistic
1 Formularea problemei icircn termenii ipotezelor statistice
2 Alegerea şi calcularea parametrului statistic al testului
3 Regiunea critică
4 Concluzia testului
1 Formularea problemei icircn termenii ipotezelor statistice
Ipoteza nulă ipoteza care trebuie testată testul efectuacircndu-se sub prezumţia că ipoteza nulă ar
fi adevărată
Ipoteza alternativă acea ipoteză care icircntr-un sens sau altul contrazice ipoteza nulă Această
ipoteză se mai numeşte şi ipoteza de lucru
Ipoteza nulă tipuri
O coadă (ldquoone-tailedrdquo sau ldquoone-siderdquo)
Media este mai mare
Media este mai mică
Două cozi (ldquoone-tailedrdquo sau ldquoone-siderdquo)
Media este egală
2 Alegerea şi calcularea parametrului statistic al testului
Parametrul statistic al testului exprimă icircntr-o anumită formă diferenţa dintre elementele comparate
Ţinacircnd seama de faptul că eşantionul sau eşantioanele utilizate sunt aleator extrase din populaţiile care
fac obiectul testului parametrul statistic este o variabilă aleatoare de selecţie care urmează o anumită
lege de probabilitate
Un parametru statistic al testului bun trebuie să icircndeplinească două condiţii
19
Trebuie să se comporte diferit atunci cacircnd ipoteza nulă H0 este adevărată faţă de situaţia icircn
care ipoteza alternativă H1 este adevărată
Distribuţia de probabilitate a parametrului statistic al testului sub prezumţia că H0 este
adevărată este cunoscută
3 Regiunea critică
- Trebuie să fim capabili să decidem icircn funcţie de valoarea parametrului statistic calculat care dintre
ipoteze cea nulă sau cea alternativă este adevărată
- Dacă valoarea parametrului statistic aparţine regiunii critice ipoteza nulă H0 va fi respinsă şi va fi
acceptată ipoteza alternativă H1
- Dacă valoarea parametrului statistic nu aparţine regiunii critice ipoteza nulă H0 va fi acceptată
- Decidem mărimea regiunii critice
Pentru aceasta trebuie să specificăm mărimea riscului de eroare pe care icircl acceptăm
Pe scurt definim nivelul de semnificaţie notat cu a sau mărimea riscului pe care
suntem dispuşi să ni-l asumăm icircn respingerea ipotezei nule H0 icircn cazul icircn care aceasta
este adevărată De obicei se alege un nivel de semnificaţie icircntre 1 şi 5
Probabilitatea unei erori de tipul I
probabilitatea de respingere a ipotezei nule H0 icircn favoarea ipotezei alternative H1 icircn
condiţiile icircn care H0 este adevărată
probabilitatea unei erori de tipul I se notează cu a şi se mai numeşte nivel de
semnificaţie al testului
Probabilitatea unei erori de tipul II
probabilitatea acceptării ipotezei nule icircn condiţiile icircn care ipoteza alternativă H1 este
adevărată
această probabilitate se notează cu b
- Unilaterală la dreapta ndash valoarea parametrului statistic al testului este mai mare sau egală cu
valoarea din dreapta a intervalului critic
- Unilaterală la stacircnga ndash valoarea parametrului statistic al testului este mai mică sau egală cu
valoarea din stacircnga a intervalului critic
- Bilaterală ndash valoarea parametrului statistic al testului este mai mică sau egală cu valoarea extremă
din stacircnga regiunii critice sau mai mare sau egală cu valoarea extremă din dreapta regiunii critice
valorile extreme ale regiunii critice avacircnd nivele egale de semnificaţie
4 Concluzia testului
- Ipoteza nulă H0 este respinsă dacă valoarea parametrului statistic aparţine regiunii critice
20
- Regiunea critică trebuie astfel aleasă icircncacirct dacă ipoteza alternativă H1 este adevărată
probabilitatea de respingere a ipotezei nule H0 este mai mare decacirct icircn cazul icircn care ipoteza nulă H0
ar fi adevărată
- Acceptarea ipotezei nule H0 atunci cacircnd ipoteza alternativă H1 este adevărată este cunoscută ca şi
eroarea de tipul II
a probabilitatea ei se notează cu b
b măsoară bdquonivelul de eroarerdquo
- Icircn testarea oricărei ipoteze statistice există patru situaţii care determină dacă decizia noastră este
corectă sau nu
Cazuri
H0 este adevărată H0 este falsă
Concluzie H0 se acceptă decizie corectă eroare de tipul
II
H0 se
respinge
eroare de tipul I decizie corectă
Luarea deciziei pe baza valorii probabilităţii p de semnificaţie a testului
Icircn momentul icircn care prelucrăm statistic o serie de date dorim să ştim dacă rezultatele obţinute sunt sau
nu semnificative statistic
Răspunsul la această icircntrebare este dat de valoarea lui p calculată de orice program statistic la
prelucrarea unor date
Icircn cazul testelor statistice ipoteza nulă este respinsă dacă nivelul de semnificaţie este mai mic decacirct
005 iar programele de prelucrare statistică a datelor vor afişa o steluţă () icircn tabelul rezultatelor
21
Dacă p le 005 respingem ipoteza nulă şi acceptăm ipoteza alternativă (am obţinut semnificaţia
statistică)
Dacă p gt 005 acceptăm ipoteza nulă (nu am obţinut semnificaţia statistică)
p = 013
NU respingem ipoteza nulă
Risc de eroare de tip II
α = 005
p = 002
Respingem ipoteza nulă
Risc de eroare de tip I
Semnificaţia lui p
Criteriu de luare a deciziei cu privire la o ipoteză statistică nulă
Cuantifică şansa ca o decizie de respingere a ipotezei nule să fie greşită
Măsură a semnificaţiei statistice şi NU CLINICĂ
22
Semnificaţia lui p (reguli empirice)
001 le p lt 005 rezultatul e semnificativ statistic
0001 le p lt 001 rezultatul e icircnalt semnificativ statistic
p lt 0001 rezultatul e foarte icircnalt semnificativ statistic
p ge 005 rezultatul e considerat nesemnificativ statistic
Limite ale valorii p
Valoarea p NU ne dă informaţii despre
Şansa de beneficiu a unui pacient individual
Procentul de pacienţi care vor avea un beneficiu icircn urma instituirii procedurii medicale
Gradul de beneficiu expectat pentru un anumit pacient
Puterea unui test statistic
Este capacitatea de a detecta o diferenţă acolo unde există
Creşterea volumului eşantionului determină creşterea puterii testului statistic aplicat
Valoarea este icircn relaţie directă cu eroarea de tip II
Puterea = 1 ndash β
Cea mai utilizată modalitate de creştere a puterii unui test statistic este de a creşte volumul
eşantionului
Tipul scalei de măsură ndash testul statistic
Denumire test Interval Nominal Observaţii
Corelaţie Pearson 2 0 Există o relaţie liniară
χ2 0 2
Student 1 1 Doar 2 grupuri
ANOVA 1 1 2 sau mai multe grupuri
Student perechi 1 1 Eşantioane perechi
Măsurători repetate (ANOVA) 1 1 Mai mult de 2 grupuri date
perechi
Inferenţa statistică pe date calitativ e
Tabela de contingenţă 2times2
Riscuri şi raţii
Testul χ2 (testarea asocierii icircn tabela de contingenţă)
Testul Fisher
23
Testul z pentru proporţii
Testul McNemar
Tabela de contingenţă 2times2
Scale de tip nominal (dicotomiale tabela de contingenţă de 2times2) sau ordinal (tabela de contingenţă de
rtimesc)
Frecvenţa absolută (numărul de evenimente per categorie)
Tabela de contingenţă de 2times2 4 categorii
AP = adevărat pozitiv
FP = fals pozitiv
FN = fals negativ
AN = adevărat negativ
Ulcer deschis Ulcer vindecat Total
Recurenţă + AP = 1 FP = 5 = 1+5 = 6
Recurenţă - FN = 7 AN = 16 = 7+16 = 23
Total =1+7=8 =5+16=21 29
Riscuri şi raţii Mărimi ale asocierii
Denumire Formula Definiţie
Rata falşilor pozitivi =FP(FP+AN) Probabilitatea unui test fals + (α)
Rata falşilor negativi =FN(FN+AP) Probabilitatea unui test fals ndash (β)
Sensibilitate =AP(AP+FN) Probabilitatea unui test real + (1- β)
Specificitate =AN(AN+FP) Probabilitatea unui test real ndash (1- α)
Acurateţe =(AP+AN)n Probabilitatea generală a unei decizii corecte
Valoarea predictivă pozitivă =AP(AP+FP) Probabilitatea ca un test pozitiv să fie corect
Valoarea predictivă negativă =AN(AN+FN) Probabilitatea ca un test negativ să fie corect
Riscul relativ =AP(FP+AN)FN(AP+FP)
Rata şansei =(AP∙AN)(FN∙FP)
Riscul atribuabil =AP(AP+FP)-FN(FN+AN)
24
Denumire Formula
Rata falşilor pozitivi = 5(5+1) = 08334
Rata falşilor negativi = 7(7+16) = 03043
Sensibilitate = 1(1+7) = 01250
Specificitate = 16(16+5) = 07619
Acurateţe = (1+16)29 = 05862
Valoarea predictivă pozitivă = 1(1+5) = 01667
Valoarea predictivă negativă = 16(16+7) = 06957
Riscul relativ = 1(5+16)7(1+5) = 2142 = 050
Rata şansei = (1∙16)(7∙5) = 04571
Riscul atribuabil = 1(1+5)-7(7+16) = 01667-03043=-01376
Testarea asocierii icircn tabela de contingenţă
Testul χ2
Nu trebuie utilizat pentru eşantioane de volum mic
Testul este valid doar dacă valoarea expectată (aşteptată) pentru fiecare celulă este cel puţin
egală cu 1 şi frecvenţa absolută observată este de minim 5
Dacă aceste condiţii nu sunt icircndeplinite se aplică testul exact al lui Fisher (Fisherrsquos Exact Test)
Indică dacă cele două variabile sunt sau nu independente DAR NU cuantifică puterea asocierii
dintre ele
Problema S-a investigat icircntr-un studiu asocierea dintre obezitatea (ca factor de risc) şi bolile
cardio-vasculare la persoanele icircn etate (gt 60 ani) Din totalul de 620 persoane investigate s-au
identificat 150 persoane cu obezitate şi boală cardio-vasculară 230 persoane fără obezitate şi
fără boală cardio-vasculară şi 60 persoane fără obezitate dar cu boală cardio-vasculară Există
o asociere icircntre obezitate şi boala cardio-vasculară (df=1 α=005 χ2critic = 384)
Testul χ2 exemplu
H025
Nu există asociere icircntre obezitate şi bolile cardio-vasculare
Obezitatea şi bolile cardio-vasculare sunt independente
H1
Există asociere icircntre obezitate şi bolile cardio-vasculare
Obezitatea şi bolile cardio-vasculare sunt asociate
a = 005 pragul de semnificaţie al testului
urmează o lege cu (r-1)(c-1) grade de libertate
χ2 = parametrul testului χ2
fio = frecvenţa observată
fit = frecvenţa teoretică
Regiunea critică este [χα2 yen)
Pentru α = 005 χα2 = 384
OBSERVAT BCV+ BCV- Total
Obezitate + AP = 150 FP = 180 330
Obezitate - FN = 60 AN = 230 290
Total 210 410 620
TEORETIC BCV+ BCV- Total
Obezitate + = 330times210620 = 330times410620 330
Obezitate - = 290times210620 = 290times410620 290
Total 210 410 620
TEORETIC BCV+ BCV- Total
Obezitate + = 330times210620 = 330times410620 330
26
Obezitate - = 290times210620 = 290times410620 290
Total 210 410 620
TEORETIC BCV+ BCV-
Obezitate + = 112 = 218
Obezitate - = 98 = 192
Deoarece 4177Icirc[384 yen) se respinge H0 cu un risc de eroare de 5
Există asociere icircntre obezitate şi bolile cardio-vasculare
Testul Fisher
Corecţie a testului χ2
Valoarea p asociată parametrului ne dă probabilitatea ca valoarea observată de independenţă să fie
atribuită doar şansei
O valoare p mică indică că există alte cauze decacirct şansa influenţează rezultatul şi astfel cele două
variabile investigate nu sunt independente
Testul Fisher = dispersia corectată a factorului x dispersia corectată a factorilor reziduali
Icircn acest context regula adunării dispersiilor se poate scrie unde
este variaţia lui y pe seama variaţiei variabilei x
este variaţia lui y pe seama influenţei factorilor reziduali (neicircnregistraţi)
este variaţia totală a caracteristicii y
Testul Fisher empiric se calculează după formula
27
se compară cu Ftab pentru nx şi nz grade de libertate la un anumit prag de semnificaţie stabilit
Dacă Fc gt Ftab rezultă că variaţia factorului de grupare x este semnificativă pentru variaţia caracteristicii y
Testul z pentru proporţii
1 Compararea unei frecvenţe observate cu o frecvenţă teoretică
2 Testarea egalităţii a două frecvenţe
Testul z Compararea unei frecvenţe observate cu o frecvenţă teoretică
Scop Investigarea semnificaţiei diferenţei icircntre o frecvenţă teoretică p (icircntr-o populaţie) şi o frecvenţă
observată f pe un eşantion reprezentativ (variabilă calitativă (binare))
Condiţii de aplicare Testul este corect aplicat dacă numărul n al observaţiilor eşantionului este
suficient de mare (n∙p n∙(1-p)gt10
Parametrul
n = volumul eşantionului
Suntem interesaţi de investigarea prevalenţei hepatitei B la personalul care lucrează icircn laboratoarele
clinicilor de boli infecţioase din Transilvania Se ştie din studii anterioare că prevalenţa hepatitei B icircn
populaţia generală din Transilvania este de 9 S-a luat icircn studiu un eşantion de 100 persoane şi s-a
obţinut o prevalenţă a hepatitei B de 6 Există diferenţă semnificativă icircntre frecvenţa hepatitei B la
personalul care lucrează icircn laboratoarele spitalelor de boli infecţioase din Transilvania faţă de
populaţia generală
f = 006 p = 009 n = 100
Ipoteza nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat
faţă de frecvenţa hepatitei B icircn populaţia generală
Ipoteza alternativă test bilateral Există diferenţă semnificativă icircntre frecvenţa hepatitei B la
nivelul eşantionului şi prevalenţa hepatitei B icircn populaţia generală
f = 006 p = 009 n = 100
Pragul de semnificaţie a = 005
Regiunea critică test bilateral (-yen -196 ]Egrave[196 yen)
28
Concluzia testului
Deoarece parametrul statistic calculat al testului nu aparţine regiunii critice se acceptă ipoteza
nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat faţă de
frecvenţa hepatitei B icircn populaţia generală
Testul McNemar
Evaluarea dependenţei variabilelor calitative perechi (dorim să determinăm dacă o anumită
caracteristică este sau nu asociată cu o anumită patologie)
Identificăm n pacienţi care prezintă patologia de interes (eg Cancer bronho-pulmonar) şi n
pacienţi cu aceleaşi caracteristici ca şi primul grup dar care nu o prezintă
Martor = da Martor = nu
Caz = da a b
Caz = nu c d
Testul McNemar - exemplu fumat vs cancer
Martor = da Martor = nu
Cancer = da a = 2 b = 5
Cancer = nu c = 0 d = 3
29
χ2critic(α=005) = 384
32 lt 384 rarr acceptăm ipoteza nulă
Fumatul nu este icircn relaţie cu apariţia cancerului bronho-pulmonar
Inferenţa statistică pe date cantitative
Variabile cantitative continue
Testul z şi Student (t) (o medie sau medii perechi)
Testul z şi Student (t) (testarea a două medii)
ANOVA (ge 3 medii)
Ranguri (variabile cantitative discrete sau cantitative care nu icircndeplinesc condiţia de
normalitate)
Testul sumei rangurilor Wilcoxon
Kruskal-Wallis (ge 3 eşantioane independente)
Friedman (ge 3 eşantioane dependente)
Teste de normalitate variabile cantitative continue
Shapiro-Wilk
Kolmogorov-Smirnov
Shapiro-Wilk
Chi-Square Goodness-of-Fit
Dacă datele urmează o distribuţie normală aplicăm un test parametric
Dacă datele nu urmează o distribuţie normală aplicăm un test de comparare al rangurilor
30
Testul Z de comparare a mediei unui eşantion cu media unei populaţii
Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ
extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie
s2 care se cunoaşte
Condiţii de aplicare
1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru
compararea mediei unui eşantion cu media unei populaţii)
2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal
distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă
3 Talia eşantionului este mare ( ge 30)
Ipoteze
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media
eşantionului şi media populaţiei
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
(-yen -196 ] Egrave [196 yen)
Parametrul testului
n = volumul eşantionului
= media eşantionului
s = deviaţia standard a populaţiei
Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)
Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard
cunoscută
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi
media standard
Condiţii de aplicare
Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se
realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această
condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea
31
Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai
puternic
Numărul de grade de libertate (df) df = n-1
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
Parametrul testului
n = volumul eşantionului
micro0 = media standard
= media eşantionului
s = deviaţia standard a eşantionului
Testul ANOVA compararea mediilor a mai multe eşantioane
H0 = toate mediile sunt egale
H1 = nu toate mediile sunt egale
Condiţii de aplicare
1 Datele sunt independente unele faţă de celelalte
2 Datele fiecărui grup sunt normal distribuite
3 Deviaţia standard este aceeaşi pentru toate grupurile
Id Medicament
A B C D E F
1 5 6 7 10 5 9
2 6 8 8 11 8 8
3 7 7 9 13 6 7
4 8 9 11 12 4 5
32
5 9 10 10 9 7 6
Suma 35 40 45 55 30 35
Media 7 8 9 11 6 7
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =
= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)
Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2
F = (suma pătratelor(icircntre))(suma pătratelor(icircn))
Suma pătratelor (icircntre) = 16times5 = 80
Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60
Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn
interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare
SP df Media pătratelor F = MPicircntreMPicircn
Icircntre 80 5 = 805 = 16 = 1625 = 64
Icircn 60 24 = 6024 = 25
Total 140 29 -
Testul sumei rangurilor Wilcoxon
Aplicat pentru
Un set de observaţii provenite dintr-o valoare ipotetică comună
Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)
Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero
Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace
Suma rangurilor pentru diferenţele negative = 2+3+1 = 6
Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30
33
Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului
egal cu 8 = 0109
Icircnainte După Diferenţa Rang
64 66 -2 2
66 58 8 5
67 68 -1 3
71 65 6 4
72 75 -3 1
76 67 9 6
78 59 19 8
89 74 15 7
Testul Kruskal-Wallis (ge 3 eşantioane independente)
Test de ranguri aplicate pe mai mult de 3 eşantioane
H = parametrul testului
n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)
Tk = suma rangurilor
Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie
pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni
34
df = k-1 (k = numărul de eşantioane)
df = 3-1 = 2
Hcritic(α=005) = 599
H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie
pozitivă şi respectiv biopsie negativă
Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie
a tipului de studiu pe eşantioane perechi)
1 Definirea numărului de tratamente k
2 Obţinerea rangurilor pentru fiecare tratament
3 Sumarea rangurilor fiecărui tratament
4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)
5 Dacă Fr gt Frcritic rarr respingem H0
Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost
măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi
n = 9 k = 3 T12 = 225 T2
2 = 38025 T32 = 38025
Frcritic = 599
Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de
prostată
35
De reţinut
Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei
Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-
of-Fit
Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z
Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t
Compararea mediilor a 3 sau mai multe eşantioane ANOVA
Compararea mediilor a două populaţii (σ) testul Z
Compararea mediilor a două eşantioane (s) testul t
Compararea mediilor a două eşantioane perechi (s) testul t
ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi
cu cel pentru compararea a două eşantioane perechi
Ranguri
Distribuţia datelor nu are importanţă
Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)
Trei sau mai multe eşantioane Kruskal-Wallis
Trei sau mai multe eşantioane perechi Friedman
Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia
Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a
datelor)
Variabile nominale
Un singur eşantion sau eşantioane perechi
Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte
Eşantioane perechi testul Mc Nemar
Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2
Icircn analiza proporţiilor există teste diferite pentru
Compararea unei frecvenţe cu o frecvenţă cunoscută
Compararea a două frecvenţe
Semnificaţia statistică
Valoarea p (p value)
Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor
două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E
posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării
aleatorii
36
Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală
urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii
Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este
probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un
experiment de dimensiunea acestuia
Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că
diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii
diferite
Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca
fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă
ar fi fost adevărată
Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă
1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe
baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De
fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001
2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie
3 Se aplică testul statistic aferent pentru a calcula valoarea p
4 Se compară valoarea p cu valoarea ndash prag
5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe
semnificativă dpdv statisticrdquo
6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e
semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să
conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă
Teste de semnificaţie
Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului
populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)
Testarea ipotezelor implică posibile erori
Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile
sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui
grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul
icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005
ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există
37
nici o diferenţă
Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ
statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de
ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost
ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau
dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă
cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă
semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe
ipotetice variate icircn cazul icircn care ele există
Măsuri ale frecvenţei
Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)
Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate
Generic formula pe care se bazează toate cele trei este
unde x şi y sunt cantităţile de comparat
Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea
unei frecvenţe pe grupe de sex vacircrstă etc
Proporţia implică icircn mod necesar ca x să fie inclus icircn y
Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară
frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp
Pentru calcularea unei rate trebuie ţinut cont de trei aspecte
bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin
bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp
bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo
Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un
tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei
populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei
aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)
38
Indicatori
Rata de incidenţă
Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă
icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii
Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o
perioadă de timp
Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de
timp x
Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei
susceptibili de a dezvolta icircmbolnăvirea studiată
Numitorul poate fi
bull Numărul mediu al populaţiei icircn perioada de timp studiată
bull Mărimea populaţiei icircn mijlocul perioadei de studiu
bull Mărimea populaţiei la icircnceputul studiului
Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă
Este obligatorie menţionarea perioadei de timp
Prevalenţa
Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la
un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă
schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa
momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)
39
Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include
numai cazuri noi respectiv include cazuri noi şi vechi
Rata de atac
Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este
folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp
raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori
Rata persoană-timp
Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din
momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte
migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost
observate
Riscul relativ (RR)
Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment
legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele
prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două
grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la
bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la
bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai
mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo
Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2
Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn
cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă
(Tabelul 1)
Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR
Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la
neexpuşi
40
Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de
culegere a datelor
Odds ratio (OR)
Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin
raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general
studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)
Tabelul 2 Tabelul 2 x 2 pentru calcularea OR
Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală
Rate de mortalitate
Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp
specificată Există mai multe tipuri de rate de mortalitate
o Mortalitate specifică pe sex
o Mortalitate specifică pe rasă
o Mortalitate specifică pe boală
o Mortalitate neonatală
o Mortalitate postneonatală
o Mortalitate infantilă
o Mortalitate maternă
Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP
41
Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de
viaţă şi vacircrsta la care survine decesul dacă este prematur
Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu
Ani de viaţă pierduţi datorat dizabilităţii
Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt
utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru
cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite
grupuri
Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de
risc şi o boală se folosesc riscul relativ şi odds ratio
35 Analiza şi interpretarea datelor
După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date
trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul
Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor
colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului
studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu
plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde
prezenţa biostatisticianului este necesară
Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu
elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat
iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului
iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate
depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori
testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere
clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza
Interpretarea rezultatelor statistice
Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne
motive (număr mic de date) acceptarea ei să fie falsă
Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine
gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia
ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument
de decizie Intervalul de confidenţă
42
Interpretarea statistica ne interpretarea clinică
Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă
Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice
obţinute pe eşantionul studiat
Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare
Ce interpretăm Rezultatele
personale obţinute icircn urma studiului
care au fost prezentate icircn secţiunea bdquoRezultaterdquo
Explicăm rezultatele obţinute
Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale
Interpretarea trebuie să se realizeze icircn
lumina limitelor studiului
contextul cultural social şi educaţional al locului unde s-a realizat cercetarea
contextul a ceea ce se cunoaşte din literatura de specialitate
Interpretăm doar rezultatele personale obţinute icircn urma studiului
Interpretarea statistică nu este tot una cu interpretarea clinică
Interpretarea statistică este importantă
Interpretarea clinică este foarte importantă
Intervalul de confidenţă
Media calculată pe baza unui eşantion nu va echivala media populaţiei
Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului
Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a
populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a
populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)
pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru
orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare
dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de
confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de
date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de
5
Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel
Dacă valoarea p este mică
Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare
aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o
medie diferită Diferenţa este semnificativă dpdv statistic
43
Icircn continuare
Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa
reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică
pentru a fi interesante din punct de vedere ştiinţific
Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC
oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care
este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a
obţine o concluzie clară
Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o
diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că
datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din
punct de vedere ştiinţific
Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul
detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat
Erorile studiilor medicale
Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura
anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară
caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea
asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri
legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias
Erorile potenţiale icircn studiile epidemiologice
1 Erori icircntacircmplătoare
2 Erori sistematice
3 Confuzia
4 Validitatea
1 Erori icircntacircmplătoare
Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a
parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel
de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot
fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii
(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor
de măsură (eroarea de măsurare)
44
2 Erori sistematice
Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate
care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu
acurateţe mare Acurateţea nu este afectată de mărimea eşantionului
Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de
experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea
dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus
şi greu de cuantificat (consum de alcool personalitate etc)
Principalele tipuri de erori din această categorie sunt
bull Biasul de selecţie
bull Biasul de informaţie
Biasul de selecţie
Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul
trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion
inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale
persoanelor incluse
Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se
ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia
Biasul de informaţie
Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de
instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze
expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere
nesemnificativă sau chiar să nu şi-o amintească de loc
3 Confuzia
Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune
prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este
cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă
de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte
important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor
protector
4 Validitatea
Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă
Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte
estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional
Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă
45
conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se
demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)
Validitatea externă se poate realiza numai dacă studiul este valid intern
Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii
studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de
studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt
laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi
validă din punct de vedere intern)
3 6 Prezentarea rezultatelor
După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite
Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor
icircntr-o formă bdquodigerabilărdquo este necesară
Scopul prezentării datelor
1 Transmiterea concluziilor studiului
a Datele corecte şi importante merită comunicate
b Datele trebuie să confirme sau să infirme ipoteza studiului
c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală
2 Acordarea posibilităţii altor cercetători să aprecieze studiul
a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti
b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor
prezentate
Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru
fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie
statistică
Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de
valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras
(Tabel 3)
Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)
46
Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct
numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor
precum şi prezentarea acestora sub formă inteligibilă
Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care
convin cercetătorului
Prezentarea datelor se poate face
1 Figuri şi tabele icircn articole scrise
2 Figuri şi tabele icircn prezentări orale
3 Figuri şi tabele icircn postere
4 Text scris sau incluse icircn text
5 Site-uri de WEB
Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor
Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie
Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele
exprimacircnd exact ceea ce acestea exprimă
Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate
anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel
să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se
acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca
mai sus sugestive sunt formatele simple şi puţin icircncărcate
Dacă nu există reguli impuse se respectă
1 Mesaj simplu fără falsificarea datelor
2 De obicei este necesar atacirct tabelul cacirct şi graficul
3 Să fie simplu şi clar
Tabele
Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile
coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică
elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de
1 Se folosesc doar linii orizontale
2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn
evidenţi prin linie de separare (Tabelul 4)
Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland
Noua Zeelandă)
(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)
47
3 Numerele sunt aliniate icircn funcţie de virgulă
4 Indicii statistici sunt explicaţi sub tabel
5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană
6 Abrevierile pot fi folosite
7 Numărul de zecimale trebuie limitat la maxim două
8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel
9 Plasarea legendei este obligatorie sub tabel
10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)
Icircn cazul prezentărilor orale sau a posterelor este indicat ca
1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării
2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte
3 Folosirea de simboluri este permisă
Clasificarea tabelelor
Tabelele se clasifică după
i) conţinut
bull cu distribuţii de frecvenţe
bull de clase de frecvenţe
bull de contingenţă
ii) structura
bull cu doua coloane
bull cu subclasificări
bull ldquomasterrdquo
Tabele ce conţin distribuţii de frecvenţe
O modalitate comodă de a prezenta o mulţime de date brute este
1 Se ordonează datele in ordine crescătoare
2 Se determine frecvenţa fiecărei valori
3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane
(Tabelul 5)
Tabelul 5 Distribuţii de frecvenţă absolută
48
Tabelul claselor de frecvenţe
1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă
2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)
Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)
Tabele de contingenţă
1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a
tabelelor de contingenţă
2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a
combinaţiilor de perechi ordonate de valori
3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre
a factor de risc si
b starea sănătăţii
4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)
5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)
Tabelul 7 Tabel de contingenţă 2 x 2
49
Grafice
Există două categorii de moduri grafice sub care se pot prezenta datele
1 Ilustraţii şi fotografii
2 Grafice
1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă
pentru lucrare
2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit
Putem vorbi despre mai multe tipuri de grafice
bull Grafice pentru reprezentarea datelor cantitative
1048707 Grafic cartezian (X Y)
1048707 Histograma
1048707 Poligonul de frecvenţe
1048707 Diagrama bdquoscatterrdquo
bull Grafice pentru reprezentarea datelor calitative
1048707 Grafic cu bare
1048707 Diagrama tip bdquoboxplotrdquo
1048707 Diagrama bdquopierdquo
1048707 Cartograma
Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi
dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)
Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)
Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie
Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)
Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)
50
Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir
de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele
două variabile studiate (Figura 6)
Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2
(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2
rămacircne aproximativ constantă)
Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea
comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea
comparativă a mai multor variabile
Figura 7 Grafic calitativ cu bare
51
Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo
Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două
posibilităţi reprezentate grafic este mai frecventă (Figura 8)
Figura 8 Reprezentare tip bdquopierdquo
Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli
sau a oricărui element comparativ Se foloseşte de epidemiologi
Rezultate
Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare
Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o
manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu
explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția
bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la
ilustraţii tabele grafice
Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi
nici rezultatele care invalidează eventual ipoteza
Discuţii
Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd
cultura ştiinţifică şi inteligenţa autorilor
Acest capitol răspunde la trei obiective
Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia
calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de
selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează
rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv
52
este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn
care a fost abordată problema fără a face o revistă a literaturii
Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea
rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul
Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor
afirmaţii nesusţinute de conţinutul lucrării
Concluzii
Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate
să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie
Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de
concluzii va scădea valoarea lucrării
Bibliografia (lista referinţelor citarea icircn text)
Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn
lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente
Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli
- să conţină cele mai importante şi recente lucrări
- să includă numai lucrări publicate
- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate
Bibliografie
Elisabeta Jaba ndash Statistică Ed Economică 1998
Mihai Ţarcă ndash Statistică volI Ed UAIC 1979
Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale
Ed University Press 2009
Sorana Daniela Bolboacă ndash Metodologia cercetării curs
53
Protocolul mai conține anexe curriculum vitae al investigatorului principal și al coinvestigatorilor
calendarul activităților avizul Comisiei de etică documente speciale și
consimțămacircntul informat icircn cazul studiilor pe subiecți umani
Icircnainte de implementare protocolul va fi verificat de experți pentru eligibilitate (dacă sunt icircndeplinite
condițiile de acceptare finanțare) calitate și pertinență icircn sensul că protocolul trebuie să fie clar exprimat
corect icircntocmit bine așezat și cu repercursiuni favorabile pentru viitor
33 Culegerea informaţiei
Pentru a realiza o cercetare medicală culegerea datelor este prima etapă şi realizează icircn funcţie de
obiectivele propuse tipul studiului timpul disponibil şi resurse umane şi financiare
Există două mari posibilităţi de culegere
bull Icircn funcţie de elementele studiate
o Culegerea exaustivă Toţi subiecţii populaţiei pe care dorim să o studiem Greu de realizat din cauza
costurilor foarte mari sau a alterării populaţiei de studiu
o Prin eşantionare Este metoda folosită icircn studii medicale
bull Icircn funcţie de durata culegerii
o Transversală Se studiază un grup la un moment dat
o Longitudinală Extinsă in timp
- Retrospectivă ndash icircnregistrări medicale
- Prospectivă ndash date culese la intervale prestabilite de timp
Populaţia ţintă
Este orice colectivitate icircntreagă de oameni animale plante sau obiecte de la care putem colecta date Populaţia
ţintă este icircntregul grup care ne interesează pe care dorim să-l descriem sau să tragem concluzii despre el
Pentru a putea realiza generalizări spre populaţia ţintă deseori suntem obligaţi să folosim un eşantion (selecţie)
care icircnsă trebuie să fie reprezentativ pentru populaţia pe care vrem să o studiem Pentru fiecare populaţie de
studiu sunt posibile mai multe eşantioane Pe baza acestor eşantioane se calculează un estimator Pe baza
acestui estimator calculat care poate fi medie aritmetică procent etc se pot trage concluzii despre icircntreaga
populaţie Este foarte important ca investigatorul să definească foarte atent şi complet populaţia icircnainte de a
realiza eşantionul inclusiv descrierea criteriilor de includere şi excludere icircn populaţia de studiu
Eşantionul
Un eşantion este practic un grup de elemente selectate dintr-un grup mai extins (populaţia ţintă) Studiind
eşantionul selectat se pot trage concluzii despre grupul de unde a fost ales (populaţia ţintă)
Este icircn general ales pentru studiu pentru că
bull Populaţia ţintă este prea mare şi nu poate fi studiată ca icircntreg
bull Nu avem acces din diverse motive decacirct la parte din populaţia de studiu
9
bull Un studiu pe icircntreaga populaţie poate distruge populaţia
bull Eşantioanele pot fi studiate mai rapid
bull Costul şi resursele necesare studiului sunt mai reduse
Numărul elementelor dintr-un eşantion se numeşte talia sau volumul selecţiei
Acesta fiind icircn general mai mic decacirct icircntreaga populaţie poate fi observat icircn detaliu iar dacă este reprezentativ
se pot afla prin intermediul său proprietăţile populaţiei ţintă
Eşantionul trebuie să fie reprezentativ pentru populaţia generală De aceea dintre metodele de eşantionare se
folosesc tehnicile de randomizare Trebuie să satisfacă două condiţii principale
bull condiţie de ordin cantitativ talia să fie suficient de mare
bull condiţie de ordin calitativ trebuie extras aleator din populaţia ţintă
Metode de eşantionare
Putem vorbi icircn linii mari de două posibilităţi de eşantionare prin metode probabilistice şi prin metode
nonprobabilistice
Eşantionarea probabilistică este metoda cea mai folosită icircn studiile medicale fiind şi cea indicată pentru a
realiza reprezentativitatea calitativă
Icircn medicină se folosesc patru tipuri de eşantionări
1 Simplu randomizat
2 Sistematic
3 Stratificat
4 Cluster (icircn cuiburi)
1 Eşantionul simplu randomizat Fiecare element din populaţia ţintă are o şansă egală non zero de a fi
inclus icircn eşantion Se ia la icircntacircmplare un număr de elemente egal cu talia eşantionului Dezavantajul acestui tip
de eşantionare este că presupune cunoaşterea icircntregii populaţii ţintă
2 Eşantionul sistematic După aflarea taliei eşantionului şi a populaţiei ţintă se calculează factorul de
eşantionare k icircmpărţind talia populaţiei ţintă la volumul eşantionului Apoi fiecare al k-lea element este
selectat spre includere
Acelaşi mare dezavantaj apare şi icircn acest caz fiind obligatorie cunoaşterea icircntregii populaţii de studiu
3 Eşantionul stratificat Există icircn cele mai multe cazuri probleme medicale care studiindu-se pe eşantion
prezintă variabilităţi icircn funcţie de caracteristicile populaţiei (sex vacircrstă nivel de pregătire etc) Icircn acest caz
este obligatorie realizarea similitudinii demografice a eşantionului cu populaţia de studiu Din date provenite
de la Centrul de Statistică putem dezvolta ca procente o structură a populaţiei Această structură trebuie să se
regăsească (procentual) şi icircntre membrii eşantionului O importantă şansă ca reprezentativitatea calitativă să fie
corectă este conferită de respectarea
acestei similitudini demografice
10
4 Eşantionul bdquoclusterrdquo sau icircn cuiburi Icircn cazul unui studiu amplu cu scop de a investiga populaţia unei
icircntregi ţări sau regiuni putem ajunge icircn imposibilitatea de a alege şi mai ales investiga indivizi răspacircndiţi prin
icircntreaga zonă Din acest motiv se desemnează la icircntacircmplare un număr calculabil de
grupuri populaţionale extinse icircn toată zona de studiu Aceste grupuri poartă numele de bdquocuiburirdquo La nivelul
fiecărui bdquocuibrdquo se aplică o tehnică precedentă de selecţie a cazurilor Se poate sau de cele mai multe ori se face
la nivel de bdquocuibrdquo stratificarea iar apoi selecţia propriu-zisă se realizează sistematic sau simplu randomizat
Este metoda de eşantionare cel mai frecvent utilizată icircn cercetarea medicală de amploare Pentru ca eventualele
erori să nu se poată strecura s-a definit şi un indice DEF (design effect) cu care trebuie multiplicată talia
selecţiei care pentru eşantionarea icircn bdquocuiburirdquo este egal cu 2 astfel putem obţine şi o reprezentativitate
calitativă dar şi una cantitativă
Eşantionarea nonprobabilistică este o metodă neindicată icircn studiile medicale datorită lipsei de forţă icircn ceea ce
priveşte posibilitatea de aplicare a concluziilor asupra populaţiei de studiu
Se definesc şi icircn acest caz patru metode
1 Eşantion de convenienţă Membrii unui astfel de eşantion sunt aleşi numai pentru că sunt la icircndemacircnă
disponibili de a răspunde le un eventual chestionar
2 Eşantion pe cote Similar cu tipul de eşantion stratificat se referă la faptul că selecţia se face formacircnd
eşantionul din primele 30 de persoane care respectă un criteriu impus
3 Eşantion cu un scop Elementele incluse icircn eşantion sunt alese după un criteriu care exclude din start marea
majoritate a populaţiei
4 Eşantion raţional Selecţia se face prin prisma unui raţionament al celui care conduce studiul
Parametru şi estimator
Parametrul este o valoare de obicei necunoscută (şi care trebuie să fie estimată prin studiu) folosită pentru a
reprezenta o anumită caracteristică a populaţiei de studiu De exemplu media populaţiei (icircnălţime) este un
parametru populaţional Raportat la o populaţie parametrul este o valoare fixă şi exactă care nu variază
Fiecare eşantion extras din populaţie va indica o valoare a mediei care nu poate decacirct să estimeze parametrul
Icircn general parametrii sunt notaţi cu litere greceşti (ex Media = μ)
Estimatorul este o valoare calculată dintr-un eşantion studiat Este folosit pentru a putea aprecia parametrul
populaţional pe care icircn căutăm Este de asemenea posibil ca dintr-o populaţie să formăm mai multe eşantioane
mediile lor de cele mai multe ori nefiind identice icircntre ele şi nici identice cu media populaţiei Estimatorii
sunt notaţi cu litere latine (ex Media = μ)
Dacă valoarea mediei calculată pe eşantion este de exemplu 168 cm atunci putem estima ca valoarea mediei
icircn populaţie este 168 cm
11
Tipuri de culegere a datelor
1 Culegere de tip eşantion reprezentativ Grupul de indivizi incluşi icircn studiu sunt reprezentativi (calitativ şi
cantitativ) pentru populaţia generală Poate fi utilizat pentru studii descriptive (cel mai frecvent) dar uneori şi
pentru studii analitice
Este necesar pentru acest tip de culegere a datelor ca iniţial să fie cunoscută talia eşantionului (calculabilă icircn
funcţie de prevalenţă şi precizie) Pentru evaluarea datelor culese se utilizează tabelul de contingenţă 2 x 2
astfel (Figura 1)
Figura 1 - Tabelul de contingenţă 2 x 2
Unde
a ndash persoane expuse unui factor de risc care au boala studiată
b ndash persoane expuse unui factor de risc care nu au boala studiată
c - persoane neexpuse unui factor de risc care au boala studiată
d - persoane neexpuse unui factor de risc care nu au boala studiată
După aranjarea datelor icircn tabelul de contingenţă (2 x 2) se poate icircncepe analiza statistică a datelor atacirct ca
procente calculabile cacirct şi din punct de vedere a aplicării de teste statistice pentru elucidarea semnificaţiei
statistice
Este posibilă din acest tip de culegere de date calcularea
1 Prevalenţei unei boli
2 Frecvenţei expunerii
3 Gradul de asociere icircntre factorul eventual de risc şi boala
2 Culegerea de tip expus ndash neexpus Icircmparte subiecţii icircn două categorii expuşi sau neexpuşi factorului de risc
studiat Ca evoluţie următoare a studiului după o astfel de culegere a datelor se poate evalua icircn timp apariţia
icircmbolnăvirii despre care se efectuează studiul Icircn timp longitudinal prospectiv se poate calcula dacă factorul
studiat reprezintă un risc de icircmbolnăvire este indiferent sau chiar este cu efect protectiv Numărul subiecţilor
din cele două grupuri poate fi egal sau poate fi diferit Numărul acestora poate fi calculat icircn vederea obţinerii
unei bune reprezentativităţi cu ajutorul formulelor de selecţie Avacircnd icircn vedere calitatea longitudinală a
12
studiului este important ca numărul ales să fie mai mare pentru a putea suplinii eventualele pierderi din
urmărire Practic rezultatele sunt introduse icircn tabelul 2 x 2 de unde se pot calcula indicatorii doriţi (Figura 2)
Avacircnd icircn vedere modul de culegere a datelor este permisă calcularea de indicatori numai pe orizontală
orice comparare icircntre coloana dreaptă şi stacircngă fiind incorectă Avantajul acestui tip de culegere a datelor ar fi
eventualul număr mai redus de subiecţi dar dezavantajul major este cel al costurilor de urmărire icircn timp dar
trebuie luată icircn calcul şi pierderea de subiecţi din evidenţe Factorul controlat este deci prezenţa expunerii iar
factorul aleator este prezenţa bolii
Figura 2 Tabelul de contingenţă pentru tipul de culegere expus ndash neexpus
4 Culegerea de tip caz ndash martor Icircn acest caz ceea ce ghidează colectarea datelor este prezenţa sau absenţa
bolii icircn momentul prezent Se vor culege date de la două loturi constituite după criteriul de bolnav B+ şi de fără
boală B+ Datele culese sunt icircn trecut deci caracterul datelor va fi retrospectiv Icircn acest caz factorul controlat
este boala factorul aleator fiind expunerea (Figura 3)
Calculul de indicatori icircn acest caz se va putea efectua numai icircntre coloane orice calcul icircntre valorile de pe linii
fiind greşit Rezultate semnificative se pot obţine icircn acest caz utilizacircnd loturi mai mici de studiu prin
comparaţie cu tipul eşantion reprezentativ permiţacircnd icircn acelaşi timp studiul bolilor rare (cu prevalenţă mică)
Figura 3 Tabelul de contingenţă pentru tipul de culegere caz ndash martor
Metode de culegere a datelor
Metoda aleasă pentru culegerea datelor trebuie să fie aleasă după un atent studiu bibliografic icircn vederea
stabilirii celui mai eficient mod de a răspunde temei de studiu
Metodele de culegere trebuie să fie bine aplicabile şi consistente ca aport informaţional necesar
13
1 Fiziologice Sunt colectate date despre anumite caracteristici fiziologice ale pacienţilor (TA glicemie
colesterol etc) Această metodă aduce rezultate obiective cacirct timp instrumentul de evaluare este bine calibrat
şi prezintă variaţii mici
2 Metode observaţionale Instrumentul de culegere a datelor trebuie să fie sincronizat cu protocolul conceput
de cercetător Datele culese trebuie să fie de asemenea consistente adică să fie colectate de aceeaşi manieră
conducătorul studiului trebuind să instruiască investigatorii (colectorii de date) Icircnregistrarea datelor trebuie să
fie de asemenea sistematică şi bine standardizată Observaţii de control trebuie icircn mod obligatoriu făcute
pentru a putea aprecia icircn mod corect orice deviere datorată unor factorii externi Este obligatorie luarea icircn
consideraţie a aspectelor etice
3 Interviul Poate fi structurat cu un set specific de icircntrebări sau nestructurat cu o temă generală cu care se
icircncepe interviul Interviurile pot fi icircnregistrate sau intervievatorul poate nota pur şi simplu răspunsurile Există
două tipuri generice de interviu interviul de profunzime care se referă la o discuţie icircn general structurată cu
un număr de icircntrebări prestabilite icircn icircncăperea de studiu fiind doară intervievatorul şi persoana chestionată şi
interviul de grup unde prin conversaţii pornind de la temă generală expusă şi condusă de intervievator se
obţin date despre subiecţii participanţi la studiu Ambele metode de interviu au indicaţiile lor precise Un
interviu pe teme intime nu va putea fi corect icircn ceea ce priveşte datele colectate dacă se aplică un interviu de
grup
4 Chestionarul Document scris adresat unor persoane pentru a răspunde la una sau mai multe icircntrebări
Trebuie să aducă răspunsurile la icircntrebările care motivează studiul constituind ansamblul icircntrebărilor destinate
culegerii de informaţii (date) Redactarea chestionarului trebuie să ţină cont de structura acestuia introducere
conţinut exprimarea icircntrebărilor grafica chestionarului
5 Icircnregistrări preexistente
Icircn cercetarea medicală sunt cel mai frecvent utilizate Informaţiile dorite sunt deja existente ceea ce icirci revine
cercetătorului este ca să structureze datele icircn funcţie de scopul studiului pe care icircn conduce Aceste surse sunt
bull Foi de observaţie
bull Registre de consultaţie
bull Buletine de analize
bull Registre de operaţii
Icircn cazul icircn care nici o metodă de culegere a datelor nu este pe placul celui ce conduce studiul există
posibilitatea de a construi un instrument nou de culegere a datelor
Acest proces trebuie să urmărească nişte paşi obligatorii fiind mare consumator de timp
bull Definirea structurii cu care se va face măsurarea
bull Formularea itemilor de măsură
bull Analiza validităţii instrumentului de măsură ndash măsoară acesta fenomenul corect
bull Elaborarea de instrucţiuni de utilizare pentru investigatori
14
bull Pretestarea instrumentului
bull Aprecierea validităţii interne şi externe a datelor culese
Instrumente de cercetare
Formularea clară a temei de cercetare necesită o foarte bună definire a factorilor studiaţi şi a criteriilor de
judecată Acestea din urmă sunt ultimele care vor trebui definite icircn cadrul protocolului de studiu
Alegerea unui instrument de măsură
Nu există un instrument de măsură perfect sau universal corect Alegerea sa dintre cele existente şi cele deja
utilizate depind de trei factori
bull Obiectivul studiului
bull Boala studiată
bull Populaţia icircn studiu
De aceste trei elemente trebuie ţinut cont icircn fiecare etapă a dezvoltării instrumentului
Definirea obiectivului
Studiu transversal Dacă se doreşte studierea unui simptom sau a unei caracteristici ale populaţiei se poate
icircmpărţi populaţia de studiu icircn mai multe grupuri Este practic vorba de a determina diferenţele dintre subiecţi
icircn cea ce priveşte o variabilă necesară studiată printr-un studiu transversal (utilizarea dozării de Ac HBS
pentru a evalua progresele bolnavilor de hepatită tip B)
Studiu longitudinal Icircn acest caz nu se poate icircmpărţii populaţia de studiu icircn mai multe grupuri datele obţinute
fiind de la acelaşi subiect colectate după un interval de timp
Icircn funcţie de boală şi populaţie se aleg şi instrumentele de măsură cele mai adecvate
Instrumentele cercetării reprezintă un mecanism specific sau o strategie pe care cercetătorul o utilizează pentru
colectarea prelucrarea şi inferenţa datelor Aceste instrumente sunt
1 Studiul icircn bibliotecă
2 Computerul
3 Determinările experimentale
4 Statistica
5 Mintea umană
6 Facilităţi de limbaj şi comunicare
Determinările experimentale
Măsurarea constă icircn aprecierea şi cuantificarea fenomenelor calitativ sau cantitativ Interpretarea
datelor se referă la transformarea lor icircn unităţi de descoperire a unor fenomene mai puţin cercetate
Standardele acceptate se referă la norme medii distribuţii etc Tot icircn cadrul interpretării datelor datele
obţinute sunt caracterizate pe scale de valori nominal ordinal de interval sau de raport
Validarea şi reproductibilitatea măsurătorilor sunt aspecte importante şi foarte necesare pentru o
cercetare corect fundamentată care doreşte obţinerea unor concluzii pertinente
15
Statistica Este implicată icircn condensarea şi procesarea unui volum mai mare de date astfel icircncacirct să se poată
interpreta corect valorile obţinute şi să se permită comparările Utilizarea unor teste statistice specifice permite
determinarea semnificaţiei (diferenţei) statistice astfel icircncacirct estimatorii să poată fi aplicaţi la populaţia
generală Furnizează informaţii şi privind corelarea sau relaţionarea icircntre date
Mintea umană este cea care reuşeşte să integreze şi să icircnţeleagă rezultatele obţinute Semnificaţia ştiinţifică
este stabilită icircn funcţie de rezultatele statisticii de mintea umană conform afirmaţiei bdquosemnificaţia ştiinţifică
nu este egală cu semnificaţia statisticărdquo Metodele aplicate pentru a putea ajunge la o concluzie pertinentă sunt
logica deductivă raţionamentul inductiv şi gacircndirea critică
Limbaj şi comunicare Exprimarea orală sau icircn scris permite nuanţarea unor aspecte seci cifrice ale unor
studii Icircn acest mod devine mai evidentă semnificaţia ştiinţifică a unor rezultate statistice
34 Prelucrarea datelor
Instrumentele de prelucrare
Statistica este o ştiinţă ramură a matematicii care studiază evoluţia fenomenelor şi proceselor
colective pe baza observării lor ştiinţifice a culegerii şi prelucrării detaliate a informaţiilor statistice cu scopul
de a formula şi explica legile legităţile şi regularităţile ce le guvernează
Statistica permite deci aprecierea unor parametrii populaţionali prin studiul unui număr redus de
elemente ale populaţiei icircn studiu (ţintă) O populaţie poate fi definită printr-un şir de valori care pot fi grupate
icircn funcţie de parametrul studiat (glicemie colesterol TAD TAS etc) Pentru fiecare astfel de şir se defineşte
o variabilă (care va purta nume propriu glicemie colesterol etc) Practic variabila este considerată o funcţie
ia valori posibil diferite de la un element la altul icircn funcţie de caracteristicile proprii acestora Sunt clasificate
icircn două grupe variabile cantitative (caracteristică măsurabilă) şi calitative (caracteristică ce nu poate fi
măsurată)
La racircndul lor variabilele calitative pot fi
bull Nominale ndash grupuri de elemente ce nu pot fi ordonate (culoarea părului)
bull Nominale ordonate ndash concluziile pot fi grupate (eficienţa unui tratament slabă bună foarte bună)
bull Binare ndash apar numai două posibilităţi (bolnav sănătos)
Variabilele cantitative pot fi
bull Continue ndash o variabilă măsurabilă care poate lua o infinitate de valori
bull Discrete ndash variabile care nu pot lua decacirct valori icircntregi
Statistica descriptivă
Există două ramuri ale statisticii statistica descriptivă şi statistica inferenţială
Statistica descriptivă (după cum rezultă din denumire) se ocupă cu descrierea unor valori obţinute ale unei
variabile studiate
16
Valorile pe care variabila le ia se constituie icircntr-o serie statistică Indicatorii care definesc o variabilă (serie)
sunt
1 Ale tendinţei centrale
Media aritmetică - notată de regulă cu
Mediana - este acea valoare din şirul de date care icircmparte icircn două părţi egale şirul ordonat de valori (atenţie
şirul este ordonat crescător) situacircndu-se la mijlocul seriei statistice
Dacă numărul de valori n este un număr impar atunci mediana este valoarea unde
Dacă n este par deci avem un număr par de valori mediana este definitatilde ca fiind
unde k = n2
Modul - constituie valoarea care apare cel mai des deci valoarea cu numărul cel mai mare de apariţii
2 De dispersie
Amplitudinea - este diferenţa dintre valoarea maximă şi cea minimă
A = Amax - Amin
Amplitudinea relativă - notată A este raportul dintre amplitudinea absolută şi media aritmetică a seriei de
date
Varianţa notată este un indicator de icircmprăştiere a datelor Formula de calcul este
Abaterea standard (S) sau deviaţia standard reprezintă rădăcina pătrată din varianţă (dispersie)
Coeficientul de variaţie se calculează ca un raport procentual icircntre abaterea standard şi valoarea medie a şirului
de valori
Eroarea standard intervine icircn estimarea intervalelor de confidenţă Se calculează astfel
17
3 De asimetrie (skewness) indică distribuţia datelor dacă sunt sau nu distribuite normal
4 De boltire (kurtosis) estimează boltirea sau aplatizarea curbei de distribuţie
Prezentarea descriptivă a datelor se face prin icircnregistrarea datelor culese icircn tabele care să reprezinte icircn mod
sintetic valorile măsurate
Icircn concluzie statistica descriptivă permite
bull Stabilirea comparabilităţii icircntre grupurile de studiu şi aprecierea prezenţei erorilor sau confuziei
bull Reprezentarea datelor icircn tabele permite evaluarea fiecărui pacient şi dacă a existat pierderi din studiu
Statistica inferenţială
Statistica inferenţială (inductivă) este partea de analiză a datelor care permite extrapolarea unei
concluzii trase pe baza unui eşantion spre populaţia ţintă pentru care a fost efectuat studiul
Scopul analizei statistice este de a evidenţia efectul unui tratament sau al unui factor de risc prin date obţinute
din eşantionul studiat spre populaţia ţintă Aceasta implică testarea ipotezelor statistice sau altfel spus testarea
semnificaţiei statistice Este una dintre cele mai importante momente ale studiului Cum rezultatele sunt
obţinute prin studiul unui eşantion există posibilitatea ca acestea să fie datorate icircntacircmplării Testele
statistice ne ajută să apreciem icircn ce măsură rezultatele sunt icircntacircmplătoare şi mai ales icircn ce măsură şi dacă se
pot aplica populaţiei generale Icircn acest scop se impune o valoare limită alfa 005 care reprezintă limita
superioară a probabilităţii ca rezultatul obţinut să fie greşit (datorat icircntacircmplării) Astfel icircn funcţie de tipul
variabilelor şi indicatorii descriptivi aplicaţi şi evaluaţi se aplică teste de semnificaţie statistică (Tabelul 1)
Tabelul 1 Alegerea testelor de semnificaţie statistică
Tipul datelor
18
Diferenţierea variabilelor din punctul de vedere a distribuţiei se face folosind testul de normalitate
Kolmogorov ndash Smirnov
Testul statistic reprezintă metoda de comparaţie a două sau mai multe populaţii prin intermediul unor
variabile observate ale lor
Scopul unui test statistic este de a defini realitatea
Definirea icircntrebării de cercetare (ipoteza clinică)
Tratamentul cu Nebivolol este la fel de eficient ca şi cel cu Valsartan icircn tratamentul
hipertensiunii arteriale
Transpunerea icircntrebării de cercetare icircn termeni statistici (ipoteza statistică)
Media tensiunii arteriale a pacienţilor trataţi cu Valsartan nu diferă semnificativ de media
tensiunii arteriale a pacienţilor trataţi cu Nebivolol
Etapele unui test statistic
1 Formularea problemei icircn termenii ipotezelor statistice
2 Alegerea şi calcularea parametrului statistic al testului
3 Regiunea critică
4 Concluzia testului
1 Formularea problemei icircn termenii ipotezelor statistice
Ipoteza nulă ipoteza care trebuie testată testul efectuacircndu-se sub prezumţia că ipoteza nulă ar
fi adevărată
Ipoteza alternativă acea ipoteză care icircntr-un sens sau altul contrazice ipoteza nulă Această
ipoteză se mai numeşte şi ipoteza de lucru
Ipoteza nulă tipuri
O coadă (ldquoone-tailedrdquo sau ldquoone-siderdquo)
Media este mai mare
Media este mai mică
Două cozi (ldquoone-tailedrdquo sau ldquoone-siderdquo)
Media este egală
2 Alegerea şi calcularea parametrului statistic al testului
Parametrul statistic al testului exprimă icircntr-o anumită formă diferenţa dintre elementele comparate
Ţinacircnd seama de faptul că eşantionul sau eşantioanele utilizate sunt aleator extrase din populaţiile care
fac obiectul testului parametrul statistic este o variabilă aleatoare de selecţie care urmează o anumită
lege de probabilitate
Un parametru statistic al testului bun trebuie să icircndeplinească două condiţii
19
Trebuie să se comporte diferit atunci cacircnd ipoteza nulă H0 este adevărată faţă de situaţia icircn
care ipoteza alternativă H1 este adevărată
Distribuţia de probabilitate a parametrului statistic al testului sub prezumţia că H0 este
adevărată este cunoscută
3 Regiunea critică
- Trebuie să fim capabili să decidem icircn funcţie de valoarea parametrului statistic calculat care dintre
ipoteze cea nulă sau cea alternativă este adevărată
- Dacă valoarea parametrului statistic aparţine regiunii critice ipoteza nulă H0 va fi respinsă şi va fi
acceptată ipoteza alternativă H1
- Dacă valoarea parametrului statistic nu aparţine regiunii critice ipoteza nulă H0 va fi acceptată
- Decidem mărimea regiunii critice
Pentru aceasta trebuie să specificăm mărimea riscului de eroare pe care icircl acceptăm
Pe scurt definim nivelul de semnificaţie notat cu a sau mărimea riscului pe care
suntem dispuşi să ni-l asumăm icircn respingerea ipotezei nule H0 icircn cazul icircn care aceasta
este adevărată De obicei se alege un nivel de semnificaţie icircntre 1 şi 5
Probabilitatea unei erori de tipul I
probabilitatea de respingere a ipotezei nule H0 icircn favoarea ipotezei alternative H1 icircn
condiţiile icircn care H0 este adevărată
probabilitatea unei erori de tipul I se notează cu a şi se mai numeşte nivel de
semnificaţie al testului
Probabilitatea unei erori de tipul II
probabilitatea acceptării ipotezei nule icircn condiţiile icircn care ipoteza alternativă H1 este
adevărată
această probabilitate se notează cu b
- Unilaterală la dreapta ndash valoarea parametrului statistic al testului este mai mare sau egală cu
valoarea din dreapta a intervalului critic
- Unilaterală la stacircnga ndash valoarea parametrului statistic al testului este mai mică sau egală cu
valoarea din stacircnga a intervalului critic
- Bilaterală ndash valoarea parametrului statistic al testului este mai mică sau egală cu valoarea extremă
din stacircnga regiunii critice sau mai mare sau egală cu valoarea extremă din dreapta regiunii critice
valorile extreme ale regiunii critice avacircnd nivele egale de semnificaţie
4 Concluzia testului
- Ipoteza nulă H0 este respinsă dacă valoarea parametrului statistic aparţine regiunii critice
20
- Regiunea critică trebuie astfel aleasă icircncacirct dacă ipoteza alternativă H1 este adevărată
probabilitatea de respingere a ipotezei nule H0 este mai mare decacirct icircn cazul icircn care ipoteza nulă H0
ar fi adevărată
- Acceptarea ipotezei nule H0 atunci cacircnd ipoteza alternativă H1 este adevărată este cunoscută ca şi
eroarea de tipul II
a probabilitatea ei se notează cu b
b măsoară bdquonivelul de eroarerdquo
- Icircn testarea oricărei ipoteze statistice există patru situaţii care determină dacă decizia noastră este
corectă sau nu
Cazuri
H0 este adevărată H0 este falsă
Concluzie H0 se acceptă decizie corectă eroare de tipul
II
H0 se
respinge
eroare de tipul I decizie corectă
Luarea deciziei pe baza valorii probabilităţii p de semnificaţie a testului
Icircn momentul icircn care prelucrăm statistic o serie de date dorim să ştim dacă rezultatele obţinute sunt sau
nu semnificative statistic
Răspunsul la această icircntrebare este dat de valoarea lui p calculată de orice program statistic la
prelucrarea unor date
Icircn cazul testelor statistice ipoteza nulă este respinsă dacă nivelul de semnificaţie este mai mic decacirct
005 iar programele de prelucrare statistică a datelor vor afişa o steluţă () icircn tabelul rezultatelor
21
Dacă p le 005 respingem ipoteza nulă şi acceptăm ipoteza alternativă (am obţinut semnificaţia
statistică)
Dacă p gt 005 acceptăm ipoteza nulă (nu am obţinut semnificaţia statistică)
p = 013
NU respingem ipoteza nulă
Risc de eroare de tip II
α = 005
p = 002
Respingem ipoteza nulă
Risc de eroare de tip I
Semnificaţia lui p
Criteriu de luare a deciziei cu privire la o ipoteză statistică nulă
Cuantifică şansa ca o decizie de respingere a ipotezei nule să fie greşită
Măsură a semnificaţiei statistice şi NU CLINICĂ
22
Semnificaţia lui p (reguli empirice)
001 le p lt 005 rezultatul e semnificativ statistic
0001 le p lt 001 rezultatul e icircnalt semnificativ statistic
p lt 0001 rezultatul e foarte icircnalt semnificativ statistic
p ge 005 rezultatul e considerat nesemnificativ statistic
Limite ale valorii p
Valoarea p NU ne dă informaţii despre
Şansa de beneficiu a unui pacient individual
Procentul de pacienţi care vor avea un beneficiu icircn urma instituirii procedurii medicale
Gradul de beneficiu expectat pentru un anumit pacient
Puterea unui test statistic
Este capacitatea de a detecta o diferenţă acolo unde există
Creşterea volumului eşantionului determină creşterea puterii testului statistic aplicat
Valoarea este icircn relaţie directă cu eroarea de tip II
Puterea = 1 ndash β
Cea mai utilizată modalitate de creştere a puterii unui test statistic este de a creşte volumul
eşantionului
Tipul scalei de măsură ndash testul statistic
Denumire test Interval Nominal Observaţii
Corelaţie Pearson 2 0 Există o relaţie liniară
χ2 0 2
Student 1 1 Doar 2 grupuri
ANOVA 1 1 2 sau mai multe grupuri
Student perechi 1 1 Eşantioane perechi
Măsurători repetate (ANOVA) 1 1 Mai mult de 2 grupuri date
perechi
Inferenţa statistică pe date calitativ e
Tabela de contingenţă 2times2
Riscuri şi raţii
Testul χ2 (testarea asocierii icircn tabela de contingenţă)
Testul Fisher
23
Testul z pentru proporţii
Testul McNemar
Tabela de contingenţă 2times2
Scale de tip nominal (dicotomiale tabela de contingenţă de 2times2) sau ordinal (tabela de contingenţă de
rtimesc)
Frecvenţa absolută (numărul de evenimente per categorie)
Tabela de contingenţă de 2times2 4 categorii
AP = adevărat pozitiv
FP = fals pozitiv
FN = fals negativ
AN = adevărat negativ
Ulcer deschis Ulcer vindecat Total
Recurenţă + AP = 1 FP = 5 = 1+5 = 6
Recurenţă - FN = 7 AN = 16 = 7+16 = 23
Total =1+7=8 =5+16=21 29
Riscuri şi raţii Mărimi ale asocierii
Denumire Formula Definiţie
Rata falşilor pozitivi =FP(FP+AN) Probabilitatea unui test fals + (α)
Rata falşilor negativi =FN(FN+AP) Probabilitatea unui test fals ndash (β)
Sensibilitate =AP(AP+FN) Probabilitatea unui test real + (1- β)
Specificitate =AN(AN+FP) Probabilitatea unui test real ndash (1- α)
Acurateţe =(AP+AN)n Probabilitatea generală a unei decizii corecte
Valoarea predictivă pozitivă =AP(AP+FP) Probabilitatea ca un test pozitiv să fie corect
Valoarea predictivă negativă =AN(AN+FN) Probabilitatea ca un test negativ să fie corect
Riscul relativ =AP(FP+AN)FN(AP+FP)
Rata şansei =(AP∙AN)(FN∙FP)
Riscul atribuabil =AP(AP+FP)-FN(FN+AN)
24
Denumire Formula
Rata falşilor pozitivi = 5(5+1) = 08334
Rata falşilor negativi = 7(7+16) = 03043
Sensibilitate = 1(1+7) = 01250
Specificitate = 16(16+5) = 07619
Acurateţe = (1+16)29 = 05862
Valoarea predictivă pozitivă = 1(1+5) = 01667
Valoarea predictivă negativă = 16(16+7) = 06957
Riscul relativ = 1(5+16)7(1+5) = 2142 = 050
Rata şansei = (1∙16)(7∙5) = 04571
Riscul atribuabil = 1(1+5)-7(7+16) = 01667-03043=-01376
Testarea asocierii icircn tabela de contingenţă
Testul χ2
Nu trebuie utilizat pentru eşantioane de volum mic
Testul este valid doar dacă valoarea expectată (aşteptată) pentru fiecare celulă este cel puţin
egală cu 1 şi frecvenţa absolută observată este de minim 5
Dacă aceste condiţii nu sunt icircndeplinite se aplică testul exact al lui Fisher (Fisherrsquos Exact Test)
Indică dacă cele două variabile sunt sau nu independente DAR NU cuantifică puterea asocierii
dintre ele
Problema S-a investigat icircntr-un studiu asocierea dintre obezitatea (ca factor de risc) şi bolile
cardio-vasculare la persoanele icircn etate (gt 60 ani) Din totalul de 620 persoane investigate s-au
identificat 150 persoane cu obezitate şi boală cardio-vasculară 230 persoane fără obezitate şi
fără boală cardio-vasculară şi 60 persoane fără obezitate dar cu boală cardio-vasculară Există
o asociere icircntre obezitate şi boala cardio-vasculară (df=1 α=005 χ2critic = 384)
Testul χ2 exemplu
H025
Nu există asociere icircntre obezitate şi bolile cardio-vasculare
Obezitatea şi bolile cardio-vasculare sunt independente
H1
Există asociere icircntre obezitate şi bolile cardio-vasculare
Obezitatea şi bolile cardio-vasculare sunt asociate
a = 005 pragul de semnificaţie al testului
urmează o lege cu (r-1)(c-1) grade de libertate
χ2 = parametrul testului χ2
fio = frecvenţa observată
fit = frecvenţa teoretică
Regiunea critică este [χα2 yen)
Pentru α = 005 χα2 = 384
OBSERVAT BCV+ BCV- Total
Obezitate + AP = 150 FP = 180 330
Obezitate - FN = 60 AN = 230 290
Total 210 410 620
TEORETIC BCV+ BCV- Total
Obezitate + = 330times210620 = 330times410620 330
Obezitate - = 290times210620 = 290times410620 290
Total 210 410 620
TEORETIC BCV+ BCV- Total
Obezitate + = 330times210620 = 330times410620 330
26
Obezitate - = 290times210620 = 290times410620 290
Total 210 410 620
TEORETIC BCV+ BCV-
Obezitate + = 112 = 218
Obezitate - = 98 = 192
Deoarece 4177Icirc[384 yen) se respinge H0 cu un risc de eroare de 5
Există asociere icircntre obezitate şi bolile cardio-vasculare
Testul Fisher
Corecţie a testului χ2
Valoarea p asociată parametrului ne dă probabilitatea ca valoarea observată de independenţă să fie
atribuită doar şansei
O valoare p mică indică că există alte cauze decacirct şansa influenţează rezultatul şi astfel cele două
variabile investigate nu sunt independente
Testul Fisher = dispersia corectată a factorului x dispersia corectată a factorilor reziduali
Icircn acest context regula adunării dispersiilor se poate scrie unde
este variaţia lui y pe seama variaţiei variabilei x
este variaţia lui y pe seama influenţei factorilor reziduali (neicircnregistraţi)
este variaţia totală a caracteristicii y
Testul Fisher empiric se calculează după formula
27
se compară cu Ftab pentru nx şi nz grade de libertate la un anumit prag de semnificaţie stabilit
Dacă Fc gt Ftab rezultă că variaţia factorului de grupare x este semnificativă pentru variaţia caracteristicii y
Testul z pentru proporţii
1 Compararea unei frecvenţe observate cu o frecvenţă teoretică
2 Testarea egalităţii a două frecvenţe
Testul z Compararea unei frecvenţe observate cu o frecvenţă teoretică
Scop Investigarea semnificaţiei diferenţei icircntre o frecvenţă teoretică p (icircntr-o populaţie) şi o frecvenţă
observată f pe un eşantion reprezentativ (variabilă calitativă (binare))
Condiţii de aplicare Testul este corect aplicat dacă numărul n al observaţiilor eşantionului este
suficient de mare (n∙p n∙(1-p)gt10
Parametrul
n = volumul eşantionului
Suntem interesaţi de investigarea prevalenţei hepatitei B la personalul care lucrează icircn laboratoarele
clinicilor de boli infecţioase din Transilvania Se ştie din studii anterioare că prevalenţa hepatitei B icircn
populaţia generală din Transilvania este de 9 S-a luat icircn studiu un eşantion de 100 persoane şi s-a
obţinut o prevalenţă a hepatitei B de 6 Există diferenţă semnificativă icircntre frecvenţa hepatitei B la
personalul care lucrează icircn laboratoarele spitalelor de boli infecţioase din Transilvania faţă de
populaţia generală
f = 006 p = 009 n = 100
Ipoteza nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat
faţă de frecvenţa hepatitei B icircn populaţia generală
Ipoteza alternativă test bilateral Există diferenţă semnificativă icircntre frecvenţa hepatitei B la
nivelul eşantionului şi prevalenţa hepatitei B icircn populaţia generală
f = 006 p = 009 n = 100
Pragul de semnificaţie a = 005
Regiunea critică test bilateral (-yen -196 ]Egrave[196 yen)
28
Concluzia testului
Deoarece parametrul statistic calculat al testului nu aparţine regiunii critice se acceptă ipoteza
nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat faţă de
frecvenţa hepatitei B icircn populaţia generală
Testul McNemar
Evaluarea dependenţei variabilelor calitative perechi (dorim să determinăm dacă o anumită
caracteristică este sau nu asociată cu o anumită patologie)
Identificăm n pacienţi care prezintă patologia de interes (eg Cancer bronho-pulmonar) şi n
pacienţi cu aceleaşi caracteristici ca şi primul grup dar care nu o prezintă
Martor = da Martor = nu
Caz = da a b
Caz = nu c d
Testul McNemar - exemplu fumat vs cancer
Martor = da Martor = nu
Cancer = da a = 2 b = 5
Cancer = nu c = 0 d = 3
29
χ2critic(α=005) = 384
32 lt 384 rarr acceptăm ipoteza nulă
Fumatul nu este icircn relaţie cu apariţia cancerului bronho-pulmonar
Inferenţa statistică pe date cantitative
Variabile cantitative continue
Testul z şi Student (t) (o medie sau medii perechi)
Testul z şi Student (t) (testarea a două medii)
ANOVA (ge 3 medii)
Ranguri (variabile cantitative discrete sau cantitative care nu icircndeplinesc condiţia de
normalitate)
Testul sumei rangurilor Wilcoxon
Kruskal-Wallis (ge 3 eşantioane independente)
Friedman (ge 3 eşantioane dependente)
Teste de normalitate variabile cantitative continue
Shapiro-Wilk
Kolmogorov-Smirnov
Shapiro-Wilk
Chi-Square Goodness-of-Fit
Dacă datele urmează o distribuţie normală aplicăm un test parametric
Dacă datele nu urmează o distribuţie normală aplicăm un test de comparare al rangurilor
30
Testul Z de comparare a mediei unui eşantion cu media unei populaţii
Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ
extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie
s2 care se cunoaşte
Condiţii de aplicare
1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru
compararea mediei unui eşantion cu media unei populaţii)
2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal
distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă
3 Talia eşantionului este mare ( ge 30)
Ipoteze
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media
eşantionului şi media populaţiei
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
(-yen -196 ] Egrave [196 yen)
Parametrul testului
n = volumul eşantionului
= media eşantionului
s = deviaţia standard a populaţiei
Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)
Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard
cunoscută
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi
media standard
Condiţii de aplicare
Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se
realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această
condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea
31
Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai
puternic
Numărul de grade de libertate (df) df = n-1
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
Parametrul testului
n = volumul eşantionului
micro0 = media standard
= media eşantionului
s = deviaţia standard a eşantionului
Testul ANOVA compararea mediilor a mai multe eşantioane
H0 = toate mediile sunt egale
H1 = nu toate mediile sunt egale
Condiţii de aplicare
1 Datele sunt independente unele faţă de celelalte
2 Datele fiecărui grup sunt normal distribuite
3 Deviaţia standard este aceeaşi pentru toate grupurile
Id Medicament
A B C D E F
1 5 6 7 10 5 9
2 6 8 8 11 8 8
3 7 7 9 13 6 7
4 8 9 11 12 4 5
32
5 9 10 10 9 7 6
Suma 35 40 45 55 30 35
Media 7 8 9 11 6 7
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =
= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)
Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2
F = (suma pătratelor(icircntre))(suma pătratelor(icircn))
Suma pătratelor (icircntre) = 16times5 = 80
Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60
Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn
interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare
SP df Media pătratelor F = MPicircntreMPicircn
Icircntre 80 5 = 805 = 16 = 1625 = 64
Icircn 60 24 = 6024 = 25
Total 140 29 -
Testul sumei rangurilor Wilcoxon
Aplicat pentru
Un set de observaţii provenite dintr-o valoare ipotetică comună
Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)
Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero
Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace
Suma rangurilor pentru diferenţele negative = 2+3+1 = 6
Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30
33
Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului
egal cu 8 = 0109
Icircnainte După Diferenţa Rang
64 66 -2 2
66 58 8 5
67 68 -1 3
71 65 6 4
72 75 -3 1
76 67 9 6
78 59 19 8
89 74 15 7
Testul Kruskal-Wallis (ge 3 eşantioane independente)
Test de ranguri aplicate pe mai mult de 3 eşantioane
H = parametrul testului
n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)
Tk = suma rangurilor
Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie
pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni
34
df = k-1 (k = numărul de eşantioane)
df = 3-1 = 2
Hcritic(α=005) = 599
H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie
pozitivă şi respectiv biopsie negativă
Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie
a tipului de studiu pe eşantioane perechi)
1 Definirea numărului de tratamente k
2 Obţinerea rangurilor pentru fiecare tratament
3 Sumarea rangurilor fiecărui tratament
4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)
5 Dacă Fr gt Frcritic rarr respingem H0
Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost
măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi
n = 9 k = 3 T12 = 225 T2
2 = 38025 T32 = 38025
Frcritic = 599
Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de
prostată
35
De reţinut
Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei
Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-
of-Fit
Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z
Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t
Compararea mediilor a 3 sau mai multe eşantioane ANOVA
Compararea mediilor a două populaţii (σ) testul Z
Compararea mediilor a două eşantioane (s) testul t
Compararea mediilor a două eşantioane perechi (s) testul t
ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi
cu cel pentru compararea a două eşantioane perechi
Ranguri
Distribuţia datelor nu are importanţă
Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)
Trei sau mai multe eşantioane Kruskal-Wallis
Trei sau mai multe eşantioane perechi Friedman
Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia
Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a
datelor)
Variabile nominale
Un singur eşantion sau eşantioane perechi
Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte
Eşantioane perechi testul Mc Nemar
Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2
Icircn analiza proporţiilor există teste diferite pentru
Compararea unei frecvenţe cu o frecvenţă cunoscută
Compararea a două frecvenţe
Semnificaţia statistică
Valoarea p (p value)
Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor
două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E
posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării
aleatorii
36
Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală
urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii
Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este
probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un
experiment de dimensiunea acestuia
Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că
diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii
diferite
Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca
fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă
ar fi fost adevărată
Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă
1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe
baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De
fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001
2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie
3 Se aplică testul statistic aferent pentru a calcula valoarea p
4 Se compară valoarea p cu valoarea ndash prag
5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe
semnificativă dpdv statisticrdquo
6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e
semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să
conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă
Teste de semnificaţie
Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului
populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)
Testarea ipotezelor implică posibile erori
Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile
sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui
grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul
icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005
ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există
37
nici o diferenţă
Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ
statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de
ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost
ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau
dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă
cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă
semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe
ipotetice variate icircn cazul icircn care ele există
Măsuri ale frecvenţei
Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)
Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate
Generic formula pe care se bazează toate cele trei este
unde x şi y sunt cantităţile de comparat
Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea
unei frecvenţe pe grupe de sex vacircrstă etc
Proporţia implică icircn mod necesar ca x să fie inclus icircn y
Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară
frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp
Pentru calcularea unei rate trebuie ţinut cont de trei aspecte
bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin
bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp
bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo
Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un
tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei
populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei
aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)
38
Indicatori
Rata de incidenţă
Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă
icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii
Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o
perioadă de timp
Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de
timp x
Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei
susceptibili de a dezvolta icircmbolnăvirea studiată
Numitorul poate fi
bull Numărul mediu al populaţiei icircn perioada de timp studiată
bull Mărimea populaţiei icircn mijlocul perioadei de studiu
bull Mărimea populaţiei la icircnceputul studiului
Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă
Este obligatorie menţionarea perioadei de timp
Prevalenţa
Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la
un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă
schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa
momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)
39
Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include
numai cazuri noi respectiv include cazuri noi şi vechi
Rata de atac
Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este
folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp
raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori
Rata persoană-timp
Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din
momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte
migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost
observate
Riscul relativ (RR)
Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment
legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele
prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două
grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la
bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la
bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai
mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo
Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2
Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn
cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă
(Tabelul 1)
Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR
Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la
neexpuşi
40
Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de
culegere a datelor
Odds ratio (OR)
Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin
raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general
studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)
Tabelul 2 Tabelul 2 x 2 pentru calcularea OR
Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală
Rate de mortalitate
Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp
specificată Există mai multe tipuri de rate de mortalitate
o Mortalitate specifică pe sex
o Mortalitate specifică pe rasă
o Mortalitate specifică pe boală
o Mortalitate neonatală
o Mortalitate postneonatală
o Mortalitate infantilă
o Mortalitate maternă
Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP
41
Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de
viaţă şi vacircrsta la care survine decesul dacă este prematur
Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu
Ani de viaţă pierduţi datorat dizabilităţii
Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt
utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru
cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite
grupuri
Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de
risc şi o boală se folosesc riscul relativ şi odds ratio
35 Analiza şi interpretarea datelor
După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date
trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul
Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor
colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului
studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu
plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde
prezenţa biostatisticianului este necesară
Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu
elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat
iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului
iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate
depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori
testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere
clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza
Interpretarea rezultatelor statistice
Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne
motive (număr mic de date) acceptarea ei să fie falsă
Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine
gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia
ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument
de decizie Intervalul de confidenţă
42
Interpretarea statistica ne interpretarea clinică
Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă
Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice
obţinute pe eşantionul studiat
Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare
Ce interpretăm Rezultatele
personale obţinute icircn urma studiului
care au fost prezentate icircn secţiunea bdquoRezultaterdquo
Explicăm rezultatele obţinute
Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale
Interpretarea trebuie să se realizeze icircn
lumina limitelor studiului
contextul cultural social şi educaţional al locului unde s-a realizat cercetarea
contextul a ceea ce se cunoaşte din literatura de specialitate
Interpretăm doar rezultatele personale obţinute icircn urma studiului
Interpretarea statistică nu este tot una cu interpretarea clinică
Interpretarea statistică este importantă
Interpretarea clinică este foarte importantă
Intervalul de confidenţă
Media calculată pe baza unui eşantion nu va echivala media populaţiei
Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului
Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a
populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a
populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)
pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru
orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare
dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de
confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de
date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de
5
Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel
Dacă valoarea p este mică
Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare
aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o
medie diferită Diferenţa este semnificativă dpdv statistic
43
Icircn continuare
Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa
reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică
pentru a fi interesante din punct de vedere ştiinţific
Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC
oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care
este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a
obţine o concluzie clară
Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o
diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că
datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din
punct de vedere ştiinţific
Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul
detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat
Erorile studiilor medicale
Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura
anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară
caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea
asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri
legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias
Erorile potenţiale icircn studiile epidemiologice
1 Erori icircntacircmplătoare
2 Erori sistematice
3 Confuzia
4 Validitatea
1 Erori icircntacircmplătoare
Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a
parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel
de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot
fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii
(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor
de măsură (eroarea de măsurare)
44
2 Erori sistematice
Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate
care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu
acurateţe mare Acurateţea nu este afectată de mărimea eşantionului
Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de
experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea
dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus
şi greu de cuantificat (consum de alcool personalitate etc)
Principalele tipuri de erori din această categorie sunt
bull Biasul de selecţie
bull Biasul de informaţie
Biasul de selecţie
Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul
trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion
inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale
persoanelor incluse
Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se
ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia
Biasul de informaţie
Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de
instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze
expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere
nesemnificativă sau chiar să nu şi-o amintească de loc
3 Confuzia
Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune
prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este
cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă
de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte
important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor
protector
4 Validitatea
Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă
Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte
estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional
Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă
45
conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se
demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)
Validitatea externă se poate realiza numai dacă studiul este valid intern
Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii
studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de
studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt
laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi
validă din punct de vedere intern)
3 6 Prezentarea rezultatelor
După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite
Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor
icircntr-o formă bdquodigerabilărdquo este necesară
Scopul prezentării datelor
1 Transmiterea concluziilor studiului
a Datele corecte şi importante merită comunicate
b Datele trebuie să confirme sau să infirme ipoteza studiului
c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală
2 Acordarea posibilităţii altor cercetători să aprecieze studiul
a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti
b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor
prezentate
Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru
fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie
statistică
Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de
valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras
(Tabel 3)
Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)
46
Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct
numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor
precum şi prezentarea acestora sub formă inteligibilă
Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care
convin cercetătorului
Prezentarea datelor se poate face
1 Figuri şi tabele icircn articole scrise
2 Figuri şi tabele icircn prezentări orale
3 Figuri şi tabele icircn postere
4 Text scris sau incluse icircn text
5 Site-uri de WEB
Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor
Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie
Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele
exprimacircnd exact ceea ce acestea exprimă
Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate
anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel
să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se
acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca
mai sus sugestive sunt formatele simple şi puţin icircncărcate
Dacă nu există reguli impuse se respectă
1 Mesaj simplu fără falsificarea datelor
2 De obicei este necesar atacirct tabelul cacirct şi graficul
3 Să fie simplu şi clar
Tabele
Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile
coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică
elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de
1 Se folosesc doar linii orizontale
2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn
evidenţi prin linie de separare (Tabelul 4)
Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland
Noua Zeelandă)
(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)
47
3 Numerele sunt aliniate icircn funcţie de virgulă
4 Indicii statistici sunt explicaţi sub tabel
5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană
6 Abrevierile pot fi folosite
7 Numărul de zecimale trebuie limitat la maxim două
8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel
9 Plasarea legendei este obligatorie sub tabel
10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)
Icircn cazul prezentărilor orale sau a posterelor este indicat ca
1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării
2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte
3 Folosirea de simboluri este permisă
Clasificarea tabelelor
Tabelele se clasifică după
i) conţinut
bull cu distribuţii de frecvenţe
bull de clase de frecvenţe
bull de contingenţă
ii) structura
bull cu doua coloane
bull cu subclasificări
bull ldquomasterrdquo
Tabele ce conţin distribuţii de frecvenţe
O modalitate comodă de a prezenta o mulţime de date brute este
1 Se ordonează datele in ordine crescătoare
2 Se determine frecvenţa fiecărei valori
3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane
(Tabelul 5)
Tabelul 5 Distribuţii de frecvenţă absolută
48
Tabelul claselor de frecvenţe
1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă
2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)
Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)
Tabele de contingenţă
1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a
tabelelor de contingenţă
2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a
combinaţiilor de perechi ordonate de valori
3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre
a factor de risc si
b starea sănătăţii
4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)
5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)
Tabelul 7 Tabel de contingenţă 2 x 2
49
Grafice
Există două categorii de moduri grafice sub care se pot prezenta datele
1 Ilustraţii şi fotografii
2 Grafice
1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă
pentru lucrare
2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit
Putem vorbi despre mai multe tipuri de grafice
bull Grafice pentru reprezentarea datelor cantitative
1048707 Grafic cartezian (X Y)
1048707 Histograma
1048707 Poligonul de frecvenţe
1048707 Diagrama bdquoscatterrdquo
bull Grafice pentru reprezentarea datelor calitative
1048707 Grafic cu bare
1048707 Diagrama tip bdquoboxplotrdquo
1048707 Diagrama bdquopierdquo
1048707 Cartograma
Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi
dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)
Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)
Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie
Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)
Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)
50
Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir
de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele
două variabile studiate (Figura 6)
Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2
(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2
rămacircne aproximativ constantă)
Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea
comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea
comparativă a mai multor variabile
Figura 7 Grafic calitativ cu bare
51
Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo
Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două
posibilităţi reprezentate grafic este mai frecventă (Figura 8)
Figura 8 Reprezentare tip bdquopierdquo
Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli
sau a oricărui element comparativ Se foloseşte de epidemiologi
Rezultate
Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare
Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o
manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu
explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția
bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la
ilustraţii tabele grafice
Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi
nici rezultatele care invalidează eventual ipoteza
Discuţii
Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd
cultura ştiinţifică şi inteligenţa autorilor
Acest capitol răspunde la trei obiective
Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia
calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de
selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează
rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv
52
este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn
care a fost abordată problema fără a face o revistă a literaturii
Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea
rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul
Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor
afirmaţii nesusţinute de conţinutul lucrării
Concluzii
Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate
să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie
Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de
concluzii va scădea valoarea lucrării
Bibliografia (lista referinţelor citarea icircn text)
Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn
lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente
Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli
- să conţină cele mai importante şi recente lucrări
- să includă numai lucrări publicate
- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate
Bibliografie
Elisabeta Jaba ndash Statistică Ed Economică 1998
Mihai Ţarcă ndash Statistică volI Ed UAIC 1979
Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale
Ed University Press 2009
Sorana Daniela Bolboacă ndash Metodologia cercetării curs
53
bull Un studiu pe icircntreaga populaţie poate distruge populaţia
bull Eşantioanele pot fi studiate mai rapid
bull Costul şi resursele necesare studiului sunt mai reduse
Numărul elementelor dintr-un eşantion se numeşte talia sau volumul selecţiei
Acesta fiind icircn general mai mic decacirct icircntreaga populaţie poate fi observat icircn detaliu iar dacă este reprezentativ
se pot afla prin intermediul său proprietăţile populaţiei ţintă
Eşantionul trebuie să fie reprezentativ pentru populaţia generală De aceea dintre metodele de eşantionare se
folosesc tehnicile de randomizare Trebuie să satisfacă două condiţii principale
bull condiţie de ordin cantitativ talia să fie suficient de mare
bull condiţie de ordin calitativ trebuie extras aleator din populaţia ţintă
Metode de eşantionare
Putem vorbi icircn linii mari de două posibilităţi de eşantionare prin metode probabilistice şi prin metode
nonprobabilistice
Eşantionarea probabilistică este metoda cea mai folosită icircn studiile medicale fiind şi cea indicată pentru a
realiza reprezentativitatea calitativă
Icircn medicină se folosesc patru tipuri de eşantionări
1 Simplu randomizat
2 Sistematic
3 Stratificat
4 Cluster (icircn cuiburi)
1 Eşantionul simplu randomizat Fiecare element din populaţia ţintă are o şansă egală non zero de a fi
inclus icircn eşantion Se ia la icircntacircmplare un număr de elemente egal cu talia eşantionului Dezavantajul acestui tip
de eşantionare este că presupune cunoaşterea icircntregii populaţii ţintă
2 Eşantionul sistematic După aflarea taliei eşantionului şi a populaţiei ţintă se calculează factorul de
eşantionare k icircmpărţind talia populaţiei ţintă la volumul eşantionului Apoi fiecare al k-lea element este
selectat spre includere
Acelaşi mare dezavantaj apare şi icircn acest caz fiind obligatorie cunoaşterea icircntregii populaţii de studiu
3 Eşantionul stratificat Există icircn cele mai multe cazuri probleme medicale care studiindu-se pe eşantion
prezintă variabilităţi icircn funcţie de caracteristicile populaţiei (sex vacircrstă nivel de pregătire etc) Icircn acest caz
este obligatorie realizarea similitudinii demografice a eşantionului cu populaţia de studiu Din date provenite
de la Centrul de Statistică putem dezvolta ca procente o structură a populaţiei Această structură trebuie să se
regăsească (procentual) şi icircntre membrii eşantionului O importantă şansă ca reprezentativitatea calitativă să fie
corectă este conferită de respectarea
acestei similitudini demografice
10
4 Eşantionul bdquoclusterrdquo sau icircn cuiburi Icircn cazul unui studiu amplu cu scop de a investiga populaţia unei
icircntregi ţări sau regiuni putem ajunge icircn imposibilitatea de a alege şi mai ales investiga indivizi răspacircndiţi prin
icircntreaga zonă Din acest motiv se desemnează la icircntacircmplare un număr calculabil de
grupuri populaţionale extinse icircn toată zona de studiu Aceste grupuri poartă numele de bdquocuiburirdquo La nivelul
fiecărui bdquocuibrdquo se aplică o tehnică precedentă de selecţie a cazurilor Se poate sau de cele mai multe ori se face
la nivel de bdquocuibrdquo stratificarea iar apoi selecţia propriu-zisă se realizează sistematic sau simplu randomizat
Este metoda de eşantionare cel mai frecvent utilizată icircn cercetarea medicală de amploare Pentru ca eventualele
erori să nu se poată strecura s-a definit şi un indice DEF (design effect) cu care trebuie multiplicată talia
selecţiei care pentru eşantionarea icircn bdquocuiburirdquo este egal cu 2 astfel putem obţine şi o reprezentativitate
calitativă dar şi una cantitativă
Eşantionarea nonprobabilistică este o metodă neindicată icircn studiile medicale datorită lipsei de forţă icircn ceea ce
priveşte posibilitatea de aplicare a concluziilor asupra populaţiei de studiu
Se definesc şi icircn acest caz patru metode
1 Eşantion de convenienţă Membrii unui astfel de eşantion sunt aleşi numai pentru că sunt la icircndemacircnă
disponibili de a răspunde le un eventual chestionar
2 Eşantion pe cote Similar cu tipul de eşantion stratificat se referă la faptul că selecţia se face formacircnd
eşantionul din primele 30 de persoane care respectă un criteriu impus
3 Eşantion cu un scop Elementele incluse icircn eşantion sunt alese după un criteriu care exclude din start marea
majoritate a populaţiei
4 Eşantion raţional Selecţia se face prin prisma unui raţionament al celui care conduce studiul
Parametru şi estimator
Parametrul este o valoare de obicei necunoscută (şi care trebuie să fie estimată prin studiu) folosită pentru a
reprezenta o anumită caracteristică a populaţiei de studiu De exemplu media populaţiei (icircnălţime) este un
parametru populaţional Raportat la o populaţie parametrul este o valoare fixă şi exactă care nu variază
Fiecare eşantion extras din populaţie va indica o valoare a mediei care nu poate decacirct să estimeze parametrul
Icircn general parametrii sunt notaţi cu litere greceşti (ex Media = μ)
Estimatorul este o valoare calculată dintr-un eşantion studiat Este folosit pentru a putea aprecia parametrul
populaţional pe care icircn căutăm Este de asemenea posibil ca dintr-o populaţie să formăm mai multe eşantioane
mediile lor de cele mai multe ori nefiind identice icircntre ele şi nici identice cu media populaţiei Estimatorii
sunt notaţi cu litere latine (ex Media = μ)
Dacă valoarea mediei calculată pe eşantion este de exemplu 168 cm atunci putem estima ca valoarea mediei
icircn populaţie este 168 cm
11
Tipuri de culegere a datelor
1 Culegere de tip eşantion reprezentativ Grupul de indivizi incluşi icircn studiu sunt reprezentativi (calitativ şi
cantitativ) pentru populaţia generală Poate fi utilizat pentru studii descriptive (cel mai frecvent) dar uneori şi
pentru studii analitice
Este necesar pentru acest tip de culegere a datelor ca iniţial să fie cunoscută talia eşantionului (calculabilă icircn
funcţie de prevalenţă şi precizie) Pentru evaluarea datelor culese se utilizează tabelul de contingenţă 2 x 2
astfel (Figura 1)
Figura 1 - Tabelul de contingenţă 2 x 2
Unde
a ndash persoane expuse unui factor de risc care au boala studiată
b ndash persoane expuse unui factor de risc care nu au boala studiată
c - persoane neexpuse unui factor de risc care au boala studiată
d - persoane neexpuse unui factor de risc care nu au boala studiată
După aranjarea datelor icircn tabelul de contingenţă (2 x 2) se poate icircncepe analiza statistică a datelor atacirct ca
procente calculabile cacirct şi din punct de vedere a aplicării de teste statistice pentru elucidarea semnificaţiei
statistice
Este posibilă din acest tip de culegere de date calcularea
1 Prevalenţei unei boli
2 Frecvenţei expunerii
3 Gradul de asociere icircntre factorul eventual de risc şi boala
2 Culegerea de tip expus ndash neexpus Icircmparte subiecţii icircn două categorii expuşi sau neexpuşi factorului de risc
studiat Ca evoluţie următoare a studiului după o astfel de culegere a datelor se poate evalua icircn timp apariţia
icircmbolnăvirii despre care se efectuează studiul Icircn timp longitudinal prospectiv se poate calcula dacă factorul
studiat reprezintă un risc de icircmbolnăvire este indiferent sau chiar este cu efect protectiv Numărul subiecţilor
din cele două grupuri poate fi egal sau poate fi diferit Numărul acestora poate fi calculat icircn vederea obţinerii
unei bune reprezentativităţi cu ajutorul formulelor de selecţie Avacircnd icircn vedere calitatea longitudinală a
12
studiului este important ca numărul ales să fie mai mare pentru a putea suplinii eventualele pierderi din
urmărire Practic rezultatele sunt introduse icircn tabelul 2 x 2 de unde se pot calcula indicatorii doriţi (Figura 2)
Avacircnd icircn vedere modul de culegere a datelor este permisă calcularea de indicatori numai pe orizontală
orice comparare icircntre coloana dreaptă şi stacircngă fiind incorectă Avantajul acestui tip de culegere a datelor ar fi
eventualul număr mai redus de subiecţi dar dezavantajul major este cel al costurilor de urmărire icircn timp dar
trebuie luată icircn calcul şi pierderea de subiecţi din evidenţe Factorul controlat este deci prezenţa expunerii iar
factorul aleator este prezenţa bolii
Figura 2 Tabelul de contingenţă pentru tipul de culegere expus ndash neexpus
4 Culegerea de tip caz ndash martor Icircn acest caz ceea ce ghidează colectarea datelor este prezenţa sau absenţa
bolii icircn momentul prezent Se vor culege date de la două loturi constituite după criteriul de bolnav B+ şi de fără
boală B+ Datele culese sunt icircn trecut deci caracterul datelor va fi retrospectiv Icircn acest caz factorul controlat
este boala factorul aleator fiind expunerea (Figura 3)
Calculul de indicatori icircn acest caz se va putea efectua numai icircntre coloane orice calcul icircntre valorile de pe linii
fiind greşit Rezultate semnificative se pot obţine icircn acest caz utilizacircnd loturi mai mici de studiu prin
comparaţie cu tipul eşantion reprezentativ permiţacircnd icircn acelaşi timp studiul bolilor rare (cu prevalenţă mică)
Figura 3 Tabelul de contingenţă pentru tipul de culegere caz ndash martor
Metode de culegere a datelor
Metoda aleasă pentru culegerea datelor trebuie să fie aleasă după un atent studiu bibliografic icircn vederea
stabilirii celui mai eficient mod de a răspunde temei de studiu
Metodele de culegere trebuie să fie bine aplicabile şi consistente ca aport informaţional necesar
13
1 Fiziologice Sunt colectate date despre anumite caracteristici fiziologice ale pacienţilor (TA glicemie
colesterol etc) Această metodă aduce rezultate obiective cacirct timp instrumentul de evaluare este bine calibrat
şi prezintă variaţii mici
2 Metode observaţionale Instrumentul de culegere a datelor trebuie să fie sincronizat cu protocolul conceput
de cercetător Datele culese trebuie să fie de asemenea consistente adică să fie colectate de aceeaşi manieră
conducătorul studiului trebuind să instruiască investigatorii (colectorii de date) Icircnregistrarea datelor trebuie să
fie de asemenea sistematică şi bine standardizată Observaţii de control trebuie icircn mod obligatoriu făcute
pentru a putea aprecia icircn mod corect orice deviere datorată unor factorii externi Este obligatorie luarea icircn
consideraţie a aspectelor etice
3 Interviul Poate fi structurat cu un set specific de icircntrebări sau nestructurat cu o temă generală cu care se
icircncepe interviul Interviurile pot fi icircnregistrate sau intervievatorul poate nota pur şi simplu răspunsurile Există
două tipuri generice de interviu interviul de profunzime care se referă la o discuţie icircn general structurată cu
un număr de icircntrebări prestabilite icircn icircncăperea de studiu fiind doară intervievatorul şi persoana chestionată şi
interviul de grup unde prin conversaţii pornind de la temă generală expusă şi condusă de intervievator se
obţin date despre subiecţii participanţi la studiu Ambele metode de interviu au indicaţiile lor precise Un
interviu pe teme intime nu va putea fi corect icircn ceea ce priveşte datele colectate dacă se aplică un interviu de
grup
4 Chestionarul Document scris adresat unor persoane pentru a răspunde la una sau mai multe icircntrebări
Trebuie să aducă răspunsurile la icircntrebările care motivează studiul constituind ansamblul icircntrebărilor destinate
culegerii de informaţii (date) Redactarea chestionarului trebuie să ţină cont de structura acestuia introducere
conţinut exprimarea icircntrebărilor grafica chestionarului
5 Icircnregistrări preexistente
Icircn cercetarea medicală sunt cel mai frecvent utilizate Informaţiile dorite sunt deja existente ceea ce icirci revine
cercetătorului este ca să structureze datele icircn funcţie de scopul studiului pe care icircn conduce Aceste surse sunt
bull Foi de observaţie
bull Registre de consultaţie
bull Buletine de analize
bull Registre de operaţii
Icircn cazul icircn care nici o metodă de culegere a datelor nu este pe placul celui ce conduce studiul există
posibilitatea de a construi un instrument nou de culegere a datelor
Acest proces trebuie să urmărească nişte paşi obligatorii fiind mare consumator de timp
bull Definirea structurii cu care se va face măsurarea
bull Formularea itemilor de măsură
bull Analiza validităţii instrumentului de măsură ndash măsoară acesta fenomenul corect
bull Elaborarea de instrucţiuni de utilizare pentru investigatori
14
bull Pretestarea instrumentului
bull Aprecierea validităţii interne şi externe a datelor culese
Instrumente de cercetare
Formularea clară a temei de cercetare necesită o foarte bună definire a factorilor studiaţi şi a criteriilor de
judecată Acestea din urmă sunt ultimele care vor trebui definite icircn cadrul protocolului de studiu
Alegerea unui instrument de măsură
Nu există un instrument de măsură perfect sau universal corect Alegerea sa dintre cele existente şi cele deja
utilizate depind de trei factori
bull Obiectivul studiului
bull Boala studiată
bull Populaţia icircn studiu
De aceste trei elemente trebuie ţinut cont icircn fiecare etapă a dezvoltării instrumentului
Definirea obiectivului
Studiu transversal Dacă se doreşte studierea unui simptom sau a unei caracteristici ale populaţiei se poate
icircmpărţi populaţia de studiu icircn mai multe grupuri Este practic vorba de a determina diferenţele dintre subiecţi
icircn cea ce priveşte o variabilă necesară studiată printr-un studiu transversal (utilizarea dozării de Ac HBS
pentru a evalua progresele bolnavilor de hepatită tip B)
Studiu longitudinal Icircn acest caz nu se poate icircmpărţii populaţia de studiu icircn mai multe grupuri datele obţinute
fiind de la acelaşi subiect colectate după un interval de timp
Icircn funcţie de boală şi populaţie se aleg şi instrumentele de măsură cele mai adecvate
Instrumentele cercetării reprezintă un mecanism specific sau o strategie pe care cercetătorul o utilizează pentru
colectarea prelucrarea şi inferenţa datelor Aceste instrumente sunt
1 Studiul icircn bibliotecă
2 Computerul
3 Determinările experimentale
4 Statistica
5 Mintea umană
6 Facilităţi de limbaj şi comunicare
Determinările experimentale
Măsurarea constă icircn aprecierea şi cuantificarea fenomenelor calitativ sau cantitativ Interpretarea
datelor se referă la transformarea lor icircn unităţi de descoperire a unor fenomene mai puţin cercetate
Standardele acceptate se referă la norme medii distribuţii etc Tot icircn cadrul interpretării datelor datele
obţinute sunt caracterizate pe scale de valori nominal ordinal de interval sau de raport
Validarea şi reproductibilitatea măsurătorilor sunt aspecte importante şi foarte necesare pentru o
cercetare corect fundamentată care doreşte obţinerea unor concluzii pertinente
15
Statistica Este implicată icircn condensarea şi procesarea unui volum mai mare de date astfel icircncacirct să se poată
interpreta corect valorile obţinute şi să se permită comparările Utilizarea unor teste statistice specifice permite
determinarea semnificaţiei (diferenţei) statistice astfel icircncacirct estimatorii să poată fi aplicaţi la populaţia
generală Furnizează informaţii şi privind corelarea sau relaţionarea icircntre date
Mintea umană este cea care reuşeşte să integreze şi să icircnţeleagă rezultatele obţinute Semnificaţia ştiinţifică
este stabilită icircn funcţie de rezultatele statisticii de mintea umană conform afirmaţiei bdquosemnificaţia ştiinţifică
nu este egală cu semnificaţia statisticărdquo Metodele aplicate pentru a putea ajunge la o concluzie pertinentă sunt
logica deductivă raţionamentul inductiv şi gacircndirea critică
Limbaj şi comunicare Exprimarea orală sau icircn scris permite nuanţarea unor aspecte seci cifrice ale unor
studii Icircn acest mod devine mai evidentă semnificaţia ştiinţifică a unor rezultate statistice
34 Prelucrarea datelor
Instrumentele de prelucrare
Statistica este o ştiinţă ramură a matematicii care studiază evoluţia fenomenelor şi proceselor
colective pe baza observării lor ştiinţifice a culegerii şi prelucrării detaliate a informaţiilor statistice cu scopul
de a formula şi explica legile legităţile şi regularităţile ce le guvernează
Statistica permite deci aprecierea unor parametrii populaţionali prin studiul unui număr redus de
elemente ale populaţiei icircn studiu (ţintă) O populaţie poate fi definită printr-un şir de valori care pot fi grupate
icircn funcţie de parametrul studiat (glicemie colesterol TAD TAS etc) Pentru fiecare astfel de şir se defineşte
o variabilă (care va purta nume propriu glicemie colesterol etc) Practic variabila este considerată o funcţie
ia valori posibil diferite de la un element la altul icircn funcţie de caracteristicile proprii acestora Sunt clasificate
icircn două grupe variabile cantitative (caracteristică măsurabilă) şi calitative (caracteristică ce nu poate fi
măsurată)
La racircndul lor variabilele calitative pot fi
bull Nominale ndash grupuri de elemente ce nu pot fi ordonate (culoarea părului)
bull Nominale ordonate ndash concluziile pot fi grupate (eficienţa unui tratament slabă bună foarte bună)
bull Binare ndash apar numai două posibilităţi (bolnav sănătos)
Variabilele cantitative pot fi
bull Continue ndash o variabilă măsurabilă care poate lua o infinitate de valori
bull Discrete ndash variabile care nu pot lua decacirct valori icircntregi
Statistica descriptivă
Există două ramuri ale statisticii statistica descriptivă şi statistica inferenţială
Statistica descriptivă (după cum rezultă din denumire) se ocupă cu descrierea unor valori obţinute ale unei
variabile studiate
16
Valorile pe care variabila le ia se constituie icircntr-o serie statistică Indicatorii care definesc o variabilă (serie)
sunt
1 Ale tendinţei centrale
Media aritmetică - notată de regulă cu
Mediana - este acea valoare din şirul de date care icircmparte icircn două părţi egale şirul ordonat de valori (atenţie
şirul este ordonat crescător) situacircndu-se la mijlocul seriei statistice
Dacă numărul de valori n este un număr impar atunci mediana este valoarea unde
Dacă n este par deci avem un număr par de valori mediana este definitatilde ca fiind
unde k = n2
Modul - constituie valoarea care apare cel mai des deci valoarea cu numărul cel mai mare de apariţii
2 De dispersie
Amplitudinea - este diferenţa dintre valoarea maximă şi cea minimă
A = Amax - Amin
Amplitudinea relativă - notată A este raportul dintre amplitudinea absolută şi media aritmetică a seriei de
date
Varianţa notată este un indicator de icircmprăştiere a datelor Formula de calcul este
Abaterea standard (S) sau deviaţia standard reprezintă rădăcina pătrată din varianţă (dispersie)
Coeficientul de variaţie se calculează ca un raport procentual icircntre abaterea standard şi valoarea medie a şirului
de valori
Eroarea standard intervine icircn estimarea intervalelor de confidenţă Se calculează astfel
17
3 De asimetrie (skewness) indică distribuţia datelor dacă sunt sau nu distribuite normal
4 De boltire (kurtosis) estimează boltirea sau aplatizarea curbei de distribuţie
Prezentarea descriptivă a datelor se face prin icircnregistrarea datelor culese icircn tabele care să reprezinte icircn mod
sintetic valorile măsurate
Icircn concluzie statistica descriptivă permite
bull Stabilirea comparabilităţii icircntre grupurile de studiu şi aprecierea prezenţei erorilor sau confuziei
bull Reprezentarea datelor icircn tabele permite evaluarea fiecărui pacient şi dacă a existat pierderi din studiu
Statistica inferenţială
Statistica inferenţială (inductivă) este partea de analiză a datelor care permite extrapolarea unei
concluzii trase pe baza unui eşantion spre populaţia ţintă pentru care a fost efectuat studiul
Scopul analizei statistice este de a evidenţia efectul unui tratament sau al unui factor de risc prin date obţinute
din eşantionul studiat spre populaţia ţintă Aceasta implică testarea ipotezelor statistice sau altfel spus testarea
semnificaţiei statistice Este una dintre cele mai importante momente ale studiului Cum rezultatele sunt
obţinute prin studiul unui eşantion există posibilitatea ca acestea să fie datorate icircntacircmplării Testele
statistice ne ajută să apreciem icircn ce măsură rezultatele sunt icircntacircmplătoare şi mai ales icircn ce măsură şi dacă se
pot aplica populaţiei generale Icircn acest scop se impune o valoare limită alfa 005 care reprezintă limita
superioară a probabilităţii ca rezultatul obţinut să fie greşit (datorat icircntacircmplării) Astfel icircn funcţie de tipul
variabilelor şi indicatorii descriptivi aplicaţi şi evaluaţi se aplică teste de semnificaţie statistică (Tabelul 1)
Tabelul 1 Alegerea testelor de semnificaţie statistică
Tipul datelor
18
Diferenţierea variabilelor din punctul de vedere a distribuţiei se face folosind testul de normalitate
Kolmogorov ndash Smirnov
Testul statistic reprezintă metoda de comparaţie a două sau mai multe populaţii prin intermediul unor
variabile observate ale lor
Scopul unui test statistic este de a defini realitatea
Definirea icircntrebării de cercetare (ipoteza clinică)
Tratamentul cu Nebivolol este la fel de eficient ca şi cel cu Valsartan icircn tratamentul
hipertensiunii arteriale
Transpunerea icircntrebării de cercetare icircn termeni statistici (ipoteza statistică)
Media tensiunii arteriale a pacienţilor trataţi cu Valsartan nu diferă semnificativ de media
tensiunii arteriale a pacienţilor trataţi cu Nebivolol
Etapele unui test statistic
1 Formularea problemei icircn termenii ipotezelor statistice
2 Alegerea şi calcularea parametrului statistic al testului
3 Regiunea critică
4 Concluzia testului
1 Formularea problemei icircn termenii ipotezelor statistice
Ipoteza nulă ipoteza care trebuie testată testul efectuacircndu-se sub prezumţia că ipoteza nulă ar
fi adevărată
Ipoteza alternativă acea ipoteză care icircntr-un sens sau altul contrazice ipoteza nulă Această
ipoteză se mai numeşte şi ipoteza de lucru
Ipoteza nulă tipuri
O coadă (ldquoone-tailedrdquo sau ldquoone-siderdquo)
Media este mai mare
Media este mai mică
Două cozi (ldquoone-tailedrdquo sau ldquoone-siderdquo)
Media este egală
2 Alegerea şi calcularea parametrului statistic al testului
Parametrul statistic al testului exprimă icircntr-o anumită formă diferenţa dintre elementele comparate
Ţinacircnd seama de faptul că eşantionul sau eşantioanele utilizate sunt aleator extrase din populaţiile care
fac obiectul testului parametrul statistic este o variabilă aleatoare de selecţie care urmează o anumită
lege de probabilitate
Un parametru statistic al testului bun trebuie să icircndeplinească două condiţii
19
Trebuie să se comporte diferit atunci cacircnd ipoteza nulă H0 este adevărată faţă de situaţia icircn
care ipoteza alternativă H1 este adevărată
Distribuţia de probabilitate a parametrului statistic al testului sub prezumţia că H0 este
adevărată este cunoscută
3 Regiunea critică
- Trebuie să fim capabili să decidem icircn funcţie de valoarea parametrului statistic calculat care dintre
ipoteze cea nulă sau cea alternativă este adevărată
- Dacă valoarea parametrului statistic aparţine regiunii critice ipoteza nulă H0 va fi respinsă şi va fi
acceptată ipoteza alternativă H1
- Dacă valoarea parametrului statistic nu aparţine regiunii critice ipoteza nulă H0 va fi acceptată
- Decidem mărimea regiunii critice
Pentru aceasta trebuie să specificăm mărimea riscului de eroare pe care icircl acceptăm
Pe scurt definim nivelul de semnificaţie notat cu a sau mărimea riscului pe care
suntem dispuşi să ni-l asumăm icircn respingerea ipotezei nule H0 icircn cazul icircn care aceasta
este adevărată De obicei se alege un nivel de semnificaţie icircntre 1 şi 5
Probabilitatea unei erori de tipul I
probabilitatea de respingere a ipotezei nule H0 icircn favoarea ipotezei alternative H1 icircn
condiţiile icircn care H0 este adevărată
probabilitatea unei erori de tipul I se notează cu a şi se mai numeşte nivel de
semnificaţie al testului
Probabilitatea unei erori de tipul II
probabilitatea acceptării ipotezei nule icircn condiţiile icircn care ipoteza alternativă H1 este
adevărată
această probabilitate se notează cu b
- Unilaterală la dreapta ndash valoarea parametrului statistic al testului este mai mare sau egală cu
valoarea din dreapta a intervalului critic
- Unilaterală la stacircnga ndash valoarea parametrului statistic al testului este mai mică sau egală cu
valoarea din stacircnga a intervalului critic
- Bilaterală ndash valoarea parametrului statistic al testului este mai mică sau egală cu valoarea extremă
din stacircnga regiunii critice sau mai mare sau egală cu valoarea extremă din dreapta regiunii critice
valorile extreme ale regiunii critice avacircnd nivele egale de semnificaţie
4 Concluzia testului
- Ipoteza nulă H0 este respinsă dacă valoarea parametrului statistic aparţine regiunii critice
20
- Regiunea critică trebuie astfel aleasă icircncacirct dacă ipoteza alternativă H1 este adevărată
probabilitatea de respingere a ipotezei nule H0 este mai mare decacirct icircn cazul icircn care ipoteza nulă H0
ar fi adevărată
- Acceptarea ipotezei nule H0 atunci cacircnd ipoteza alternativă H1 este adevărată este cunoscută ca şi
eroarea de tipul II
a probabilitatea ei se notează cu b
b măsoară bdquonivelul de eroarerdquo
- Icircn testarea oricărei ipoteze statistice există patru situaţii care determină dacă decizia noastră este
corectă sau nu
Cazuri
H0 este adevărată H0 este falsă
Concluzie H0 se acceptă decizie corectă eroare de tipul
II
H0 se
respinge
eroare de tipul I decizie corectă
Luarea deciziei pe baza valorii probabilităţii p de semnificaţie a testului
Icircn momentul icircn care prelucrăm statistic o serie de date dorim să ştim dacă rezultatele obţinute sunt sau
nu semnificative statistic
Răspunsul la această icircntrebare este dat de valoarea lui p calculată de orice program statistic la
prelucrarea unor date
Icircn cazul testelor statistice ipoteza nulă este respinsă dacă nivelul de semnificaţie este mai mic decacirct
005 iar programele de prelucrare statistică a datelor vor afişa o steluţă () icircn tabelul rezultatelor
21
Dacă p le 005 respingem ipoteza nulă şi acceptăm ipoteza alternativă (am obţinut semnificaţia
statistică)
Dacă p gt 005 acceptăm ipoteza nulă (nu am obţinut semnificaţia statistică)
p = 013
NU respingem ipoteza nulă
Risc de eroare de tip II
α = 005
p = 002
Respingem ipoteza nulă
Risc de eroare de tip I
Semnificaţia lui p
Criteriu de luare a deciziei cu privire la o ipoteză statistică nulă
Cuantifică şansa ca o decizie de respingere a ipotezei nule să fie greşită
Măsură a semnificaţiei statistice şi NU CLINICĂ
22
Semnificaţia lui p (reguli empirice)
001 le p lt 005 rezultatul e semnificativ statistic
0001 le p lt 001 rezultatul e icircnalt semnificativ statistic
p lt 0001 rezultatul e foarte icircnalt semnificativ statistic
p ge 005 rezultatul e considerat nesemnificativ statistic
Limite ale valorii p
Valoarea p NU ne dă informaţii despre
Şansa de beneficiu a unui pacient individual
Procentul de pacienţi care vor avea un beneficiu icircn urma instituirii procedurii medicale
Gradul de beneficiu expectat pentru un anumit pacient
Puterea unui test statistic
Este capacitatea de a detecta o diferenţă acolo unde există
Creşterea volumului eşantionului determină creşterea puterii testului statistic aplicat
Valoarea este icircn relaţie directă cu eroarea de tip II
Puterea = 1 ndash β
Cea mai utilizată modalitate de creştere a puterii unui test statistic este de a creşte volumul
eşantionului
Tipul scalei de măsură ndash testul statistic
Denumire test Interval Nominal Observaţii
Corelaţie Pearson 2 0 Există o relaţie liniară
χ2 0 2
Student 1 1 Doar 2 grupuri
ANOVA 1 1 2 sau mai multe grupuri
Student perechi 1 1 Eşantioane perechi
Măsurători repetate (ANOVA) 1 1 Mai mult de 2 grupuri date
perechi
Inferenţa statistică pe date calitativ e
Tabela de contingenţă 2times2
Riscuri şi raţii
Testul χ2 (testarea asocierii icircn tabela de contingenţă)
Testul Fisher
23
Testul z pentru proporţii
Testul McNemar
Tabela de contingenţă 2times2
Scale de tip nominal (dicotomiale tabela de contingenţă de 2times2) sau ordinal (tabela de contingenţă de
rtimesc)
Frecvenţa absolută (numărul de evenimente per categorie)
Tabela de contingenţă de 2times2 4 categorii
AP = adevărat pozitiv
FP = fals pozitiv
FN = fals negativ
AN = adevărat negativ
Ulcer deschis Ulcer vindecat Total
Recurenţă + AP = 1 FP = 5 = 1+5 = 6
Recurenţă - FN = 7 AN = 16 = 7+16 = 23
Total =1+7=8 =5+16=21 29
Riscuri şi raţii Mărimi ale asocierii
Denumire Formula Definiţie
Rata falşilor pozitivi =FP(FP+AN) Probabilitatea unui test fals + (α)
Rata falşilor negativi =FN(FN+AP) Probabilitatea unui test fals ndash (β)
Sensibilitate =AP(AP+FN) Probabilitatea unui test real + (1- β)
Specificitate =AN(AN+FP) Probabilitatea unui test real ndash (1- α)
Acurateţe =(AP+AN)n Probabilitatea generală a unei decizii corecte
Valoarea predictivă pozitivă =AP(AP+FP) Probabilitatea ca un test pozitiv să fie corect
Valoarea predictivă negativă =AN(AN+FN) Probabilitatea ca un test negativ să fie corect
Riscul relativ =AP(FP+AN)FN(AP+FP)
Rata şansei =(AP∙AN)(FN∙FP)
Riscul atribuabil =AP(AP+FP)-FN(FN+AN)
24
Denumire Formula
Rata falşilor pozitivi = 5(5+1) = 08334
Rata falşilor negativi = 7(7+16) = 03043
Sensibilitate = 1(1+7) = 01250
Specificitate = 16(16+5) = 07619
Acurateţe = (1+16)29 = 05862
Valoarea predictivă pozitivă = 1(1+5) = 01667
Valoarea predictivă negativă = 16(16+7) = 06957
Riscul relativ = 1(5+16)7(1+5) = 2142 = 050
Rata şansei = (1∙16)(7∙5) = 04571
Riscul atribuabil = 1(1+5)-7(7+16) = 01667-03043=-01376
Testarea asocierii icircn tabela de contingenţă
Testul χ2
Nu trebuie utilizat pentru eşantioane de volum mic
Testul este valid doar dacă valoarea expectată (aşteptată) pentru fiecare celulă este cel puţin
egală cu 1 şi frecvenţa absolută observată este de minim 5
Dacă aceste condiţii nu sunt icircndeplinite se aplică testul exact al lui Fisher (Fisherrsquos Exact Test)
Indică dacă cele două variabile sunt sau nu independente DAR NU cuantifică puterea asocierii
dintre ele
Problema S-a investigat icircntr-un studiu asocierea dintre obezitatea (ca factor de risc) şi bolile
cardio-vasculare la persoanele icircn etate (gt 60 ani) Din totalul de 620 persoane investigate s-au
identificat 150 persoane cu obezitate şi boală cardio-vasculară 230 persoane fără obezitate şi
fără boală cardio-vasculară şi 60 persoane fără obezitate dar cu boală cardio-vasculară Există
o asociere icircntre obezitate şi boala cardio-vasculară (df=1 α=005 χ2critic = 384)
Testul χ2 exemplu
H025
Nu există asociere icircntre obezitate şi bolile cardio-vasculare
Obezitatea şi bolile cardio-vasculare sunt independente
H1
Există asociere icircntre obezitate şi bolile cardio-vasculare
Obezitatea şi bolile cardio-vasculare sunt asociate
a = 005 pragul de semnificaţie al testului
urmează o lege cu (r-1)(c-1) grade de libertate
χ2 = parametrul testului χ2
fio = frecvenţa observată
fit = frecvenţa teoretică
Regiunea critică este [χα2 yen)
Pentru α = 005 χα2 = 384
OBSERVAT BCV+ BCV- Total
Obezitate + AP = 150 FP = 180 330
Obezitate - FN = 60 AN = 230 290
Total 210 410 620
TEORETIC BCV+ BCV- Total
Obezitate + = 330times210620 = 330times410620 330
Obezitate - = 290times210620 = 290times410620 290
Total 210 410 620
TEORETIC BCV+ BCV- Total
Obezitate + = 330times210620 = 330times410620 330
26
Obezitate - = 290times210620 = 290times410620 290
Total 210 410 620
TEORETIC BCV+ BCV-
Obezitate + = 112 = 218
Obezitate - = 98 = 192
Deoarece 4177Icirc[384 yen) se respinge H0 cu un risc de eroare de 5
Există asociere icircntre obezitate şi bolile cardio-vasculare
Testul Fisher
Corecţie a testului χ2
Valoarea p asociată parametrului ne dă probabilitatea ca valoarea observată de independenţă să fie
atribuită doar şansei
O valoare p mică indică că există alte cauze decacirct şansa influenţează rezultatul şi astfel cele două
variabile investigate nu sunt independente
Testul Fisher = dispersia corectată a factorului x dispersia corectată a factorilor reziduali
Icircn acest context regula adunării dispersiilor se poate scrie unde
este variaţia lui y pe seama variaţiei variabilei x
este variaţia lui y pe seama influenţei factorilor reziduali (neicircnregistraţi)
este variaţia totală a caracteristicii y
Testul Fisher empiric se calculează după formula
27
se compară cu Ftab pentru nx şi nz grade de libertate la un anumit prag de semnificaţie stabilit
Dacă Fc gt Ftab rezultă că variaţia factorului de grupare x este semnificativă pentru variaţia caracteristicii y
Testul z pentru proporţii
1 Compararea unei frecvenţe observate cu o frecvenţă teoretică
2 Testarea egalităţii a două frecvenţe
Testul z Compararea unei frecvenţe observate cu o frecvenţă teoretică
Scop Investigarea semnificaţiei diferenţei icircntre o frecvenţă teoretică p (icircntr-o populaţie) şi o frecvenţă
observată f pe un eşantion reprezentativ (variabilă calitativă (binare))
Condiţii de aplicare Testul este corect aplicat dacă numărul n al observaţiilor eşantionului este
suficient de mare (n∙p n∙(1-p)gt10
Parametrul
n = volumul eşantionului
Suntem interesaţi de investigarea prevalenţei hepatitei B la personalul care lucrează icircn laboratoarele
clinicilor de boli infecţioase din Transilvania Se ştie din studii anterioare că prevalenţa hepatitei B icircn
populaţia generală din Transilvania este de 9 S-a luat icircn studiu un eşantion de 100 persoane şi s-a
obţinut o prevalenţă a hepatitei B de 6 Există diferenţă semnificativă icircntre frecvenţa hepatitei B la
personalul care lucrează icircn laboratoarele spitalelor de boli infecţioase din Transilvania faţă de
populaţia generală
f = 006 p = 009 n = 100
Ipoteza nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat
faţă de frecvenţa hepatitei B icircn populaţia generală
Ipoteza alternativă test bilateral Există diferenţă semnificativă icircntre frecvenţa hepatitei B la
nivelul eşantionului şi prevalenţa hepatitei B icircn populaţia generală
f = 006 p = 009 n = 100
Pragul de semnificaţie a = 005
Regiunea critică test bilateral (-yen -196 ]Egrave[196 yen)
28
Concluzia testului
Deoarece parametrul statistic calculat al testului nu aparţine regiunii critice se acceptă ipoteza
nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat faţă de
frecvenţa hepatitei B icircn populaţia generală
Testul McNemar
Evaluarea dependenţei variabilelor calitative perechi (dorim să determinăm dacă o anumită
caracteristică este sau nu asociată cu o anumită patologie)
Identificăm n pacienţi care prezintă patologia de interes (eg Cancer bronho-pulmonar) şi n
pacienţi cu aceleaşi caracteristici ca şi primul grup dar care nu o prezintă
Martor = da Martor = nu
Caz = da a b
Caz = nu c d
Testul McNemar - exemplu fumat vs cancer
Martor = da Martor = nu
Cancer = da a = 2 b = 5
Cancer = nu c = 0 d = 3
29
χ2critic(α=005) = 384
32 lt 384 rarr acceptăm ipoteza nulă
Fumatul nu este icircn relaţie cu apariţia cancerului bronho-pulmonar
Inferenţa statistică pe date cantitative
Variabile cantitative continue
Testul z şi Student (t) (o medie sau medii perechi)
Testul z şi Student (t) (testarea a două medii)
ANOVA (ge 3 medii)
Ranguri (variabile cantitative discrete sau cantitative care nu icircndeplinesc condiţia de
normalitate)
Testul sumei rangurilor Wilcoxon
Kruskal-Wallis (ge 3 eşantioane independente)
Friedman (ge 3 eşantioane dependente)
Teste de normalitate variabile cantitative continue
Shapiro-Wilk
Kolmogorov-Smirnov
Shapiro-Wilk
Chi-Square Goodness-of-Fit
Dacă datele urmează o distribuţie normală aplicăm un test parametric
Dacă datele nu urmează o distribuţie normală aplicăm un test de comparare al rangurilor
30
Testul Z de comparare a mediei unui eşantion cu media unei populaţii
Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ
extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie
s2 care se cunoaşte
Condiţii de aplicare
1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru
compararea mediei unui eşantion cu media unei populaţii)
2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal
distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă
3 Talia eşantionului este mare ( ge 30)
Ipoteze
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media
eşantionului şi media populaţiei
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
(-yen -196 ] Egrave [196 yen)
Parametrul testului
n = volumul eşantionului
= media eşantionului
s = deviaţia standard a populaţiei
Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)
Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard
cunoscută
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi
media standard
Condiţii de aplicare
Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se
realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această
condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea
31
Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai
puternic
Numărul de grade de libertate (df) df = n-1
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
Parametrul testului
n = volumul eşantionului
micro0 = media standard
= media eşantionului
s = deviaţia standard a eşantionului
Testul ANOVA compararea mediilor a mai multe eşantioane
H0 = toate mediile sunt egale
H1 = nu toate mediile sunt egale
Condiţii de aplicare
1 Datele sunt independente unele faţă de celelalte
2 Datele fiecărui grup sunt normal distribuite
3 Deviaţia standard este aceeaşi pentru toate grupurile
Id Medicament
A B C D E F
1 5 6 7 10 5 9
2 6 8 8 11 8 8
3 7 7 9 13 6 7
4 8 9 11 12 4 5
32
5 9 10 10 9 7 6
Suma 35 40 45 55 30 35
Media 7 8 9 11 6 7
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =
= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)
Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2
F = (suma pătratelor(icircntre))(suma pătratelor(icircn))
Suma pătratelor (icircntre) = 16times5 = 80
Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60
Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn
interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare
SP df Media pătratelor F = MPicircntreMPicircn
Icircntre 80 5 = 805 = 16 = 1625 = 64
Icircn 60 24 = 6024 = 25
Total 140 29 -
Testul sumei rangurilor Wilcoxon
Aplicat pentru
Un set de observaţii provenite dintr-o valoare ipotetică comună
Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)
Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero
Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace
Suma rangurilor pentru diferenţele negative = 2+3+1 = 6
Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30
33
Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului
egal cu 8 = 0109
Icircnainte După Diferenţa Rang
64 66 -2 2
66 58 8 5
67 68 -1 3
71 65 6 4
72 75 -3 1
76 67 9 6
78 59 19 8
89 74 15 7
Testul Kruskal-Wallis (ge 3 eşantioane independente)
Test de ranguri aplicate pe mai mult de 3 eşantioane
H = parametrul testului
n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)
Tk = suma rangurilor
Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie
pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni
34
df = k-1 (k = numărul de eşantioane)
df = 3-1 = 2
Hcritic(α=005) = 599
H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie
pozitivă şi respectiv biopsie negativă
Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie
a tipului de studiu pe eşantioane perechi)
1 Definirea numărului de tratamente k
2 Obţinerea rangurilor pentru fiecare tratament
3 Sumarea rangurilor fiecărui tratament
4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)
5 Dacă Fr gt Frcritic rarr respingem H0
Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost
măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi
n = 9 k = 3 T12 = 225 T2
2 = 38025 T32 = 38025
Frcritic = 599
Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de
prostată
35
De reţinut
Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei
Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-
of-Fit
Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z
Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t
Compararea mediilor a 3 sau mai multe eşantioane ANOVA
Compararea mediilor a două populaţii (σ) testul Z
Compararea mediilor a două eşantioane (s) testul t
Compararea mediilor a două eşantioane perechi (s) testul t
ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi
cu cel pentru compararea a două eşantioane perechi
Ranguri
Distribuţia datelor nu are importanţă
Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)
Trei sau mai multe eşantioane Kruskal-Wallis
Trei sau mai multe eşantioane perechi Friedman
Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia
Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a
datelor)
Variabile nominale
Un singur eşantion sau eşantioane perechi
Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte
Eşantioane perechi testul Mc Nemar
Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2
Icircn analiza proporţiilor există teste diferite pentru
Compararea unei frecvenţe cu o frecvenţă cunoscută
Compararea a două frecvenţe
Semnificaţia statistică
Valoarea p (p value)
Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor
două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E
posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării
aleatorii
36
Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală
urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii
Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este
probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un
experiment de dimensiunea acestuia
Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că
diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii
diferite
Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca
fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă
ar fi fost adevărată
Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă
1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe
baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De
fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001
2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie
3 Se aplică testul statistic aferent pentru a calcula valoarea p
4 Se compară valoarea p cu valoarea ndash prag
5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe
semnificativă dpdv statisticrdquo
6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e
semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să
conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă
Teste de semnificaţie
Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului
populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)
Testarea ipotezelor implică posibile erori
Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile
sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui
grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul
icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005
ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există
37
nici o diferenţă
Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ
statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de
ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost
ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau
dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă
cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă
semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe
ipotetice variate icircn cazul icircn care ele există
Măsuri ale frecvenţei
Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)
Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate
Generic formula pe care se bazează toate cele trei este
unde x şi y sunt cantităţile de comparat
Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea
unei frecvenţe pe grupe de sex vacircrstă etc
Proporţia implică icircn mod necesar ca x să fie inclus icircn y
Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară
frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp
Pentru calcularea unei rate trebuie ţinut cont de trei aspecte
bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin
bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp
bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo
Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un
tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei
populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei
aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)
38
Indicatori
Rata de incidenţă
Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă
icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii
Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o
perioadă de timp
Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de
timp x
Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei
susceptibili de a dezvolta icircmbolnăvirea studiată
Numitorul poate fi
bull Numărul mediu al populaţiei icircn perioada de timp studiată
bull Mărimea populaţiei icircn mijlocul perioadei de studiu
bull Mărimea populaţiei la icircnceputul studiului
Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă
Este obligatorie menţionarea perioadei de timp
Prevalenţa
Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la
un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă
schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa
momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)
39
Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include
numai cazuri noi respectiv include cazuri noi şi vechi
Rata de atac
Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este
folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp
raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori
Rata persoană-timp
Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din
momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte
migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost
observate
Riscul relativ (RR)
Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment
legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele
prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două
grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la
bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la
bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai
mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo
Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2
Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn
cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă
(Tabelul 1)
Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR
Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la
neexpuşi
40
Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de
culegere a datelor
Odds ratio (OR)
Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin
raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general
studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)
Tabelul 2 Tabelul 2 x 2 pentru calcularea OR
Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală
Rate de mortalitate
Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp
specificată Există mai multe tipuri de rate de mortalitate
o Mortalitate specifică pe sex
o Mortalitate specifică pe rasă
o Mortalitate specifică pe boală
o Mortalitate neonatală
o Mortalitate postneonatală
o Mortalitate infantilă
o Mortalitate maternă
Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP
41
Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de
viaţă şi vacircrsta la care survine decesul dacă este prematur
Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu
Ani de viaţă pierduţi datorat dizabilităţii
Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt
utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru
cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite
grupuri
Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de
risc şi o boală se folosesc riscul relativ şi odds ratio
35 Analiza şi interpretarea datelor
După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date
trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul
Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor
colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului
studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu
plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde
prezenţa biostatisticianului este necesară
Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu
elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat
iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului
iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate
depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori
testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere
clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza
Interpretarea rezultatelor statistice
Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne
motive (număr mic de date) acceptarea ei să fie falsă
Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine
gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia
ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument
de decizie Intervalul de confidenţă
42
Interpretarea statistica ne interpretarea clinică
Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă
Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice
obţinute pe eşantionul studiat
Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare
Ce interpretăm Rezultatele
personale obţinute icircn urma studiului
care au fost prezentate icircn secţiunea bdquoRezultaterdquo
Explicăm rezultatele obţinute
Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale
Interpretarea trebuie să se realizeze icircn
lumina limitelor studiului
contextul cultural social şi educaţional al locului unde s-a realizat cercetarea
contextul a ceea ce se cunoaşte din literatura de specialitate
Interpretăm doar rezultatele personale obţinute icircn urma studiului
Interpretarea statistică nu este tot una cu interpretarea clinică
Interpretarea statistică este importantă
Interpretarea clinică este foarte importantă
Intervalul de confidenţă
Media calculată pe baza unui eşantion nu va echivala media populaţiei
Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului
Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a
populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a
populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)
pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru
orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare
dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de
confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de
date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de
5
Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel
Dacă valoarea p este mică
Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare
aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o
medie diferită Diferenţa este semnificativă dpdv statistic
43
Icircn continuare
Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa
reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică
pentru a fi interesante din punct de vedere ştiinţific
Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC
oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care
este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a
obţine o concluzie clară
Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o
diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că
datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din
punct de vedere ştiinţific
Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul
detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat
Erorile studiilor medicale
Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura
anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară
caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea
asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri
legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias
Erorile potenţiale icircn studiile epidemiologice
1 Erori icircntacircmplătoare
2 Erori sistematice
3 Confuzia
4 Validitatea
1 Erori icircntacircmplătoare
Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a
parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel
de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot
fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii
(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor
de măsură (eroarea de măsurare)
44
2 Erori sistematice
Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate
care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu
acurateţe mare Acurateţea nu este afectată de mărimea eşantionului
Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de
experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea
dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus
şi greu de cuantificat (consum de alcool personalitate etc)
Principalele tipuri de erori din această categorie sunt
bull Biasul de selecţie
bull Biasul de informaţie
Biasul de selecţie
Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul
trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion
inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale
persoanelor incluse
Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se
ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia
Biasul de informaţie
Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de
instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze
expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere
nesemnificativă sau chiar să nu şi-o amintească de loc
3 Confuzia
Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune
prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este
cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă
de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte
important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor
protector
4 Validitatea
Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă
Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte
estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional
Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă
45
conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se
demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)
Validitatea externă se poate realiza numai dacă studiul este valid intern
Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii
studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de
studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt
laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi
validă din punct de vedere intern)
3 6 Prezentarea rezultatelor
După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite
Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor
icircntr-o formă bdquodigerabilărdquo este necesară
Scopul prezentării datelor
1 Transmiterea concluziilor studiului
a Datele corecte şi importante merită comunicate
b Datele trebuie să confirme sau să infirme ipoteza studiului
c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală
2 Acordarea posibilităţii altor cercetători să aprecieze studiul
a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti
b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor
prezentate
Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru
fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie
statistică
Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de
valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras
(Tabel 3)
Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)
46
Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct
numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor
precum şi prezentarea acestora sub formă inteligibilă
Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care
convin cercetătorului
Prezentarea datelor se poate face
1 Figuri şi tabele icircn articole scrise
2 Figuri şi tabele icircn prezentări orale
3 Figuri şi tabele icircn postere
4 Text scris sau incluse icircn text
5 Site-uri de WEB
Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor
Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie
Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele
exprimacircnd exact ceea ce acestea exprimă
Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate
anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel
să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se
acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca
mai sus sugestive sunt formatele simple şi puţin icircncărcate
Dacă nu există reguli impuse se respectă
1 Mesaj simplu fără falsificarea datelor
2 De obicei este necesar atacirct tabelul cacirct şi graficul
3 Să fie simplu şi clar
Tabele
Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile
coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică
elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de
1 Se folosesc doar linii orizontale
2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn
evidenţi prin linie de separare (Tabelul 4)
Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland
Noua Zeelandă)
(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)
47
3 Numerele sunt aliniate icircn funcţie de virgulă
4 Indicii statistici sunt explicaţi sub tabel
5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană
6 Abrevierile pot fi folosite
7 Numărul de zecimale trebuie limitat la maxim două
8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel
9 Plasarea legendei este obligatorie sub tabel
10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)
Icircn cazul prezentărilor orale sau a posterelor este indicat ca
1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării
2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte
3 Folosirea de simboluri este permisă
Clasificarea tabelelor
Tabelele se clasifică după
i) conţinut
bull cu distribuţii de frecvenţe
bull de clase de frecvenţe
bull de contingenţă
ii) structura
bull cu doua coloane
bull cu subclasificări
bull ldquomasterrdquo
Tabele ce conţin distribuţii de frecvenţe
O modalitate comodă de a prezenta o mulţime de date brute este
1 Se ordonează datele in ordine crescătoare
2 Se determine frecvenţa fiecărei valori
3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane
(Tabelul 5)
Tabelul 5 Distribuţii de frecvenţă absolută
48
Tabelul claselor de frecvenţe
1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă
2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)
Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)
Tabele de contingenţă
1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a
tabelelor de contingenţă
2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a
combinaţiilor de perechi ordonate de valori
3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre
a factor de risc si
b starea sănătăţii
4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)
5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)
Tabelul 7 Tabel de contingenţă 2 x 2
49
Grafice
Există două categorii de moduri grafice sub care se pot prezenta datele
1 Ilustraţii şi fotografii
2 Grafice
1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă
pentru lucrare
2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit
Putem vorbi despre mai multe tipuri de grafice
bull Grafice pentru reprezentarea datelor cantitative
1048707 Grafic cartezian (X Y)
1048707 Histograma
1048707 Poligonul de frecvenţe
1048707 Diagrama bdquoscatterrdquo
bull Grafice pentru reprezentarea datelor calitative
1048707 Grafic cu bare
1048707 Diagrama tip bdquoboxplotrdquo
1048707 Diagrama bdquopierdquo
1048707 Cartograma
Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi
dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)
Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)
Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie
Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)
Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)
50
Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir
de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele
două variabile studiate (Figura 6)
Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2
(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2
rămacircne aproximativ constantă)
Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea
comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea
comparativă a mai multor variabile
Figura 7 Grafic calitativ cu bare
51
Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo
Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două
posibilităţi reprezentate grafic este mai frecventă (Figura 8)
Figura 8 Reprezentare tip bdquopierdquo
Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli
sau a oricărui element comparativ Se foloseşte de epidemiologi
Rezultate
Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare
Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o
manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu
explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția
bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la
ilustraţii tabele grafice
Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi
nici rezultatele care invalidează eventual ipoteza
Discuţii
Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd
cultura ştiinţifică şi inteligenţa autorilor
Acest capitol răspunde la trei obiective
Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia
calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de
selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează
rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv
52
este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn
care a fost abordată problema fără a face o revistă a literaturii
Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea
rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul
Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor
afirmaţii nesusţinute de conţinutul lucrării
Concluzii
Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate
să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie
Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de
concluzii va scădea valoarea lucrării
Bibliografia (lista referinţelor citarea icircn text)
Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn
lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente
Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli
- să conţină cele mai importante şi recente lucrări
- să includă numai lucrări publicate
- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate
Bibliografie
Elisabeta Jaba ndash Statistică Ed Economică 1998
Mihai Ţarcă ndash Statistică volI Ed UAIC 1979
Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale
Ed University Press 2009
Sorana Daniela Bolboacă ndash Metodologia cercetării curs
53
4 Eşantionul bdquoclusterrdquo sau icircn cuiburi Icircn cazul unui studiu amplu cu scop de a investiga populaţia unei
icircntregi ţări sau regiuni putem ajunge icircn imposibilitatea de a alege şi mai ales investiga indivizi răspacircndiţi prin
icircntreaga zonă Din acest motiv se desemnează la icircntacircmplare un număr calculabil de
grupuri populaţionale extinse icircn toată zona de studiu Aceste grupuri poartă numele de bdquocuiburirdquo La nivelul
fiecărui bdquocuibrdquo se aplică o tehnică precedentă de selecţie a cazurilor Se poate sau de cele mai multe ori se face
la nivel de bdquocuibrdquo stratificarea iar apoi selecţia propriu-zisă se realizează sistematic sau simplu randomizat
Este metoda de eşantionare cel mai frecvent utilizată icircn cercetarea medicală de amploare Pentru ca eventualele
erori să nu se poată strecura s-a definit şi un indice DEF (design effect) cu care trebuie multiplicată talia
selecţiei care pentru eşantionarea icircn bdquocuiburirdquo este egal cu 2 astfel putem obţine şi o reprezentativitate
calitativă dar şi una cantitativă
Eşantionarea nonprobabilistică este o metodă neindicată icircn studiile medicale datorită lipsei de forţă icircn ceea ce
priveşte posibilitatea de aplicare a concluziilor asupra populaţiei de studiu
Se definesc şi icircn acest caz patru metode
1 Eşantion de convenienţă Membrii unui astfel de eşantion sunt aleşi numai pentru că sunt la icircndemacircnă
disponibili de a răspunde le un eventual chestionar
2 Eşantion pe cote Similar cu tipul de eşantion stratificat se referă la faptul că selecţia se face formacircnd
eşantionul din primele 30 de persoane care respectă un criteriu impus
3 Eşantion cu un scop Elementele incluse icircn eşantion sunt alese după un criteriu care exclude din start marea
majoritate a populaţiei
4 Eşantion raţional Selecţia se face prin prisma unui raţionament al celui care conduce studiul
Parametru şi estimator
Parametrul este o valoare de obicei necunoscută (şi care trebuie să fie estimată prin studiu) folosită pentru a
reprezenta o anumită caracteristică a populaţiei de studiu De exemplu media populaţiei (icircnălţime) este un
parametru populaţional Raportat la o populaţie parametrul este o valoare fixă şi exactă care nu variază
Fiecare eşantion extras din populaţie va indica o valoare a mediei care nu poate decacirct să estimeze parametrul
Icircn general parametrii sunt notaţi cu litere greceşti (ex Media = μ)
Estimatorul este o valoare calculată dintr-un eşantion studiat Este folosit pentru a putea aprecia parametrul
populaţional pe care icircn căutăm Este de asemenea posibil ca dintr-o populaţie să formăm mai multe eşantioane
mediile lor de cele mai multe ori nefiind identice icircntre ele şi nici identice cu media populaţiei Estimatorii
sunt notaţi cu litere latine (ex Media = μ)
Dacă valoarea mediei calculată pe eşantion este de exemplu 168 cm atunci putem estima ca valoarea mediei
icircn populaţie este 168 cm
11
Tipuri de culegere a datelor
1 Culegere de tip eşantion reprezentativ Grupul de indivizi incluşi icircn studiu sunt reprezentativi (calitativ şi
cantitativ) pentru populaţia generală Poate fi utilizat pentru studii descriptive (cel mai frecvent) dar uneori şi
pentru studii analitice
Este necesar pentru acest tip de culegere a datelor ca iniţial să fie cunoscută talia eşantionului (calculabilă icircn
funcţie de prevalenţă şi precizie) Pentru evaluarea datelor culese se utilizează tabelul de contingenţă 2 x 2
astfel (Figura 1)
Figura 1 - Tabelul de contingenţă 2 x 2
Unde
a ndash persoane expuse unui factor de risc care au boala studiată
b ndash persoane expuse unui factor de risc care nu au boala studiată
c - persoane neexpuse unui factor de risc care au boala studiată
d - persoane neexpuse unui factor de risc care nu au boala studiată
După aranjarea datelor icircn tabelul de contingenţă (2 x 2) se poate icircncepe analiza statistică a datelor atacirct ca
procente calculabile cacirct şi din punct de vedere a aplicării de teste statistice pentru elucidarea semnificaţiei
statistice
Este posibilă din acest tip de culegere de date calcularea
1 Prevalenţei unei boli
2 Frecvenţei expunerii
3 Gradul de asociere icircntre factorul eventual de risc şi boala
2 Culegerea de tip expus ndash neexpus Icircmparte subiecţii icircn două categorii expuşi sau neexpuşi factorului de risc
studiat Ca evoluţie următoare a studiului după o astfel de culegere a datelor se poate evalua icircn timp apariţia
icircmbolnăvirii despre care se efectuează studiul Icircn timp longitudinal prospectiv se poate calcula dacă factorul
studiat reprezintă un risc de icircmbolnăvire este indiferent sau chiar este cu efect protectiv Numărul subiecţilor
din cele două grupuri poate fi egal sau poate fi diferit Numărul acestora poate fi calculat icircn vederea obţinerii
unei bune reprezentativităţi cu ajutorul formulelor de selecţie Avacircnd icircn vedere calitatea longitudinală a
12
studiului este important ca numărul ales să fie mai mare pentru a putea suplinii eventualele pierderi din
urmărire Practic rezultatele sunt introduse icircn tabelul 2 x 2 de unde se pot calcula indicatorii doriţi (Figura 2)
Avacircnd icircn vedere modul de culegere a datelor este permisă calcularea de indicatori numai pe orizontală
orice comparare icircntre coloana dreaptă şi stacircngă fiind incorectă Avantajul acestui tip de culegere a datelor ar fi
eventualul număr mai redus de subiecţi dar dezavantajul major este cel al costurilor de urmărire icircn timp dar
trebuie luată icircn calcul şi pierderea de subiecţi din evidenţe Factorul controlat este deci prezenţa expunerii iar
factorul aleator este prezenţa bolii
Figura 2 Tabelul de contingenţă pentru tipul de culegere expus ndash neexpus
4 Culegerea de tip caz ndash martor Icircn acest caz ceea ce ghidează colectarea datelor este prezenţa sau absenţa
bolii icircn momentul prezent Se vor culege date de la două loturi constituite după criteriul de bolnav B+ şi de fără
boală B+ Datele culese sunt icircn trecut deci caracterul datelor va fi retrospectiv Icircn acest caz factorul controlat
este boala factorul aleator fiind expunerea (Figura 3)
Calculul de indicatori icircn acest caz se va putea efectua numai icircntre coloane orice calcul icircntre valorile de pe linii
fiind greşit Rezultate semnificative se pot obţine icircn acest caz utilizacircnd loturi mai mici de studiu prin
comparaţie cu tipul eşantion reprezentativ permiţacircnd icircn acelaşi timp studiul bolilor rare (cu prevalenţă mică)
Figura 3 Tabelul de contingenţă pentru tipul de culegere caz ndash martor
Metode de culegere a datelor
Metoda aleasă pentru culegerea datelor trebuie să fie aleasă după un atent studiu bibliografic icircn vederea
stabilirii celui mai eficient mod de a răspunde temei de studiu
Metodele de culegere trebuie să fie bine aplicabile şi consistente ca aport informaţional necesar
13
1 Fiziologice Sunt colectate date despre anumite caracteristici fiziologice ale pacienţilor (TA glicemie
colesterol etc) Această metodă aduce rezultate obiective cacirct timp instrumentul de evaluare este bine calibrat
şi prezintă variaţii mici
2 Metode observaţionale Instrumentul de culegere a datelor trebuie să fie sincronizat cu protocolul conceput
de cercetător Datele culese trebuie să fie de asemenea consistente adică să fie colectate de aceeaşi manieră
conducătorul studiului trebuind să instruiască investigatorii (colectorii de date) Icircnregistrarea datelor trebuie să
fie de asemenea sistematică şi bine standardizată Observaţii de control trebuie icircn mod obligatoriu făcute
pentru a putea aprecia icircn mod corect orice deviere datorată unor factorii externi Este obligatorie luarea icircn
consideraţie a aspectelor etice
3 Interviul Poate fi structurat cu un set specific de icircntrebări sau nestructurat cu o temă generală cu care se
icircncepe interviul Interviurile pot fi icircnregistrate sau intervievatorul poate nota pur şi simplu răspunsurile Există
două tipuri generice de interviu interviul de profunzime care se referă la o discuţie icircn general structurată cu
un număr de icircntrebări prestabilite icircn icircncăperea de studiu fiind doară intervievatorul şi persoana chestionată şi
interviul de grup unde prin conversaţii pornind de la temă generală expusă şi condusă de intervievator se
obţin date despre subiecţii participanţi la studiu Ambele metode de interviu au indicaţiile lor precise Un
interviu pe teme intime nu va putea fi corect icircn ceea ce priveşte datele colectate dacă se aplică un interviu de
grup
4 Chestionarul Document scris adresat unor persoane pentru a răspunde la una sau mai multe icircntrebări
Trebuie să aducă răspunsurile la icircntrebările care motivează studiul constituind ansamblul icircntrebărilor destinate
culegerii de informaţii (date) Redactarea chestionarului trebuie să ţină cont de structura acestuia introducere
conţinut exprimarea icircntrebărilor grafica chestionarului
5 Icircnregistrări preexistente
Icircn cercetarea medicală sunt cel mai frecvent utilizate Informaţiile dorite sunt deja existente ceea ce icirci revine
cercetătorului este ca să structureze datele icircn funcţie de scopul studiului pe care icircn conduce Aceste surse sunt
bull Foi de observaţie
bull Registre de consultaţie
bull Buletine de analize
bull Registre de operaţii
Icircn cazul icircn care nici o metodă de culegere a datelor nu este pe placul celui ce conduce studiul există
posibilitatea de a construi un instrument nou de culegere a datelor
Acest proces trebuie să urmărească nişte paşi obligatorii fiind mare consumator de timp
bull Definirea structurii cu care se va face măsurarea
bull Formularea itemilor de măsură
bull Analiza validităţii instrumentului de măsură ndash măsoară acesta fenomenul corect
bull Elaborarea de instrucţiuni de utilizare pentru investigatori
14
bull Pretestarea instrumentului
bull Aprecierea validităţii interne şi externe a datelor culese
Instrumente de cercetare
Formularea clară a temei de cercetare necesită o foarte bună definire a factorilor studiaţi şi a criteriilor de
judecată Acestea din urmă sunt ultimele care vor trebui definite icircn cadrul protocolului de studiu
Alegerea unui instrument de măsură
Nu există un instrument de măsură perfect sau universal corect Alegerea sa dintre cele existente şi cele deja
utilizate depind de trei factori
bull Obiectivul studiului
bull Boala studiată
bull Populaţia icircn studiu
De aceste trei elemente trebuie ţinut cont icircn fiecare etapă a dezvoltării instrumentului
Definirea obiectivului
Studiu transversal Dacă se doreşte studierea unui simptom sau a unei caracteristici ale populaţiei se poate
icircmpărţi populaţia de studiu icircn mai multe grupuri Este practic vorba de a determina diferenţele dintre subiecţi
icircn cea ce priveşte o variabilă necesară studiată printr-un studiu transversal (utilizarea dozării de Ac HBS
pentru a evalua progresele bolnavilor de hepatită tip B)
Studiu longitudinal Icircn acest caz nu se poate icircmpărţii populaţia de studiu icircn mai multe grupuri datele obţinute
fiind de la acelaşi subiect colectate după un interval de timp
Icircn funcţie de boală şi populaţie se aleg şi instrumentele de măsură cele mai adecvate
Instrumentele cercetării reprezintă un mecanism specific sau o strategie pe care cercetătorul o utilizează pentru
colectarea prelucrarea şi inferenţa datelor Aceste instrumente sunt
1 Studiul icircn bibliotecă
2 Computerul
3 Determinările experimentale
4 Statistica
5 Mintea umană
6 Facilităţi de limbaj şi comunicare
Determinările experimentale
Măsurarea constă icircn aprecierea şi cuantificarea fenomenelor calitativ sau cantitativ Interpretarea
datelor se referă la transformarea lor icircn unităţi de descoperire a unor fenomene mai puţin cercetate
Standardele acceptate se referă la norme medii distribuţii etc Tot icircn cadrul interpretării datelor datele
obţinute sunt caracterizate pe scale de valori nominal ordinal de interval sau de raport
Validarea şi reproductibilitatea măsurătorilor sunt aspecte importante şi foarte necesare pentru o
cercetare corect fundamentată care doreşte obţinerea unor concluzii pertinente
15
Statistica Este implicată icircn condensarea şi procesarea unui volum mai mare de date astfel icircncacirct să se poată
interpreta corect valorile obţinute şi să se permită comparările Utilizarea unor teste statistice specifice permite
determinarea semnificaţiei (diferenţei) statistice astfel icircncacirct estimatorii să poată fi aplicaţi la populaţia
generală Furnizează informaţii şi privind corelarea sau relaţionarea icircntre date
Mintea umană este cea care reuşeşte să integreze şi să icircnţeleagă rezultatele obţinute Semnificaţia ştiinţifică
este stabilită icircn funcţie de rezultatele statisticii de mintea umană conform afirmaţiei bdquosemnificaţia ştiinţifică
nu este egală cu semnificaţia statisticărdquo Metodele aplicate pentru a putea ajunge la o concluzie pertinentă sunt
logica deductivă raţionamentul inductiv şi gacircndirea critică
Limbaj şi comunicare Exprimarea orală sau icircn scris permite nuanţarea unor aspecte seci cifrice ale unor
studii Icircn acest mod devine mai evidentă semnificaţia ştiinţifică a unor rezultate statistice
34 Prelucrarea datelor
Instrumentele de prelucrare
Statistica este o ştiinţă ramură a matematicii care studiază evoluţia fenomenelor şi proceselor
colective pe baza observării lor ştiinţifice a culegerii şi prelucrării detaliate a informaţiilor statistice cu scopul
de a formula şi explica legile legităţile şi regularităţile ce le guvernează
Statistica permite deci aprecierea unor parametrii populaţionali prin studiul unui număr redus de
elemente ale populaţiei icircn studiu (ţintă) O populaţie poate fi definită printr-un şir de valori care pot fi grupate
icircn funcţie de parametrul studiat (glicemie colesterol TAD TAS etc) Pentru fiecare astfel de şir se defineşte
o variabilă (care va purta nume propriu glicemie colesterol etc) Practic variabila este considerată o funcţie
ia valori posibil diferite de la un element la altul icircn funcţie de caracteristicile proprii acestora Sunt clasificate
icircn două grupe variabile cantitative (caracteristică măsurabilă) şi calitative (caracteristică ce nu poate fi
măsurată)
La racircndul lor variabilele calitative pot fi
bull Nominale ndash grupuri de elemente ce nu pot fi ordonate (culoarea părului)
bull Nominale ordonate ndash concluziile pot fi grupate (eficienţa unui tratament slabă bună foarte bună)
bull Binare ndash apar numai două posibilităţi (bolnav sănătos)
Variabilele cantitative pot fi
bull Continue ndash o variabilă măsurabilă care poate lua o infinitate de valori
bull Discrete ndash variabile care nu pot lua decacirct valori icircntregi
Statistica descriptivă
Există două ramuri ale statisticii statistica descriptivă şi statistica inferenţială
Statistica descriptivă (după cum rezultă din denumire) se ocupă cu descrierea unor valori obţinute ale unei
variabile studiate
16
Valorile pe care variabila le ia se constituie icircntr-o serie statistică Indicatorii care definesc o variabilă (serie)
sunt
1 Ale tendinţei centrale
Media aritmetică - notată de regulă cu
Mediana - este acea valoare din şirul de date care icircmparte icircn două părţi egale şirul ordonat de valori (atenţie
şirul este ordonat crescător) situacircndu-se la mijlocul seriei statistice
Dacă numărul de valori n este un număr impar atunci mediana este valoarea unde
Dacă n este par deci avem un număr par de valori mediana este definitatilde ca fiind
unde k = n2
Modul - constituie valoarea care apare cel mai des deci valoarea cu numărul cel mai mare de apariţii
2 De dispersie
Amplitudinea - este diferenţa dintre valoarea maximă şi cea minimă
A = Amax - Amin
Amplitudinea relativă - notată A este raportul dintre amplitudinea absolută şi media aritmetică a seriei de
date
Varianţa notată este un indicator de icircmprăştiere a datelor Formula de calcul este
Abaterea standard (S) sau deviaţia standard reprezintă rădăcina pătrată din varianţă (dispersie)
Coeficientul de variaţie se calculează ca un raport procentual icircntre abaterea standard şi valoarea medie a şirului
de valori
Eroarea standard intervine icircn estimarea intervalelor de confidenţă Se calculează astfel
17
3 De asimetrie (skewness) indică distribuţia datelor dacă sunt sau nu distribuite normal
4 De boltire (kurtosis) estimează boltirea sau aplatizarea curbei de distribuţie
Prezentarea descriptivă a datelor se face prin icircnregistrarea datelor culese icircn tabele care să reprezinte icircn mod
sintetic valorile măsurate
Icircn concluzie statistica descriptivă permite
bull Stabilirea comparabilităţii icircntre grupurile de studiu şi aprecierea prezenţei erorilor sau confuziei
bull Reprezentarea datelor icircn tabele permite evaluarea fiecărui pacient şi dacă a existat pierderi din studiu
Statistica inferenţială
Statistica inferenţială (inductivă) este partea de analiză a datelor care permite extrapolarea unei
concluzii trase pe baza unui eşantion spre populaţia ţintă pentru care a fost efectuat studiul
Scopul analizei statistice este de a evidenţia efectul unui tratament sau al unui factor de risc prin date obţinute
din eşantionul studiat spre populaţia ţintă Aceasta implică testarea ipotezelor statistice sau altfel spus testarea
semnificaţiei statistice Este una dintre cele mai importante momente ale studiului Cum rezultatele sunt
obţinute prin studiul unui eşantion există posibilitatea ca acestea să fie datorate icircntacircmplării Testele
statistice ne ajută să apreciem icircn ce măsură rezultatele sunt icircntacircmplătoare şi mai ales icircn ce măsură şi dacă se
pot aplica populaţiei generale Icircn acest scop se impune o valoare limită alfa 005 care reprezintă limita
superioară a probabilităţii ca rezultatul obţinut să fie greşit (datorat icircntacircmplării) Astfel icircn funcţie de tipul
variabilelor şi indicatorii descriptivi aplicaţi şi evaluaţi se aplică teste de semnificaţie statistică (Tabelul 1)
Tabelul 1 Alegerea testelor de semnificaţie statistică
Tipul datelor
18
Diferenţierea variabilelor din punctul de vedere a distribuţiei se face folosind testul de normalitate
Kolmogorov ndash Smirnov
Testul statistic reprezintă metoda de comparaţie a două sau mai multe populaţii prin intermediul unor
variabile observate ale lor
Scopul unui test statistic este de a defini realitatea
Definirea icircntrebării de cercetare (ipoteza clinică)
Tratamentul cu Nebivolol este la fel de eficient ca şi cel cu Valsartan icircn tratamentul
hipertensiunii arteriale
Transpunerea icircntrebării de cercetare icircn termeni statistici (ipoteza statistică)
Media tensiunii arteriale a pacienţilor trataţi cu Valsartan nu diferă semnificativ de media
tensiunii arteriale a pacienţilor trataţi cu Nebivolol
Etapele unui test statistic
1 Formularea problemei icircn termenii ipotezelor statistice
2 Alegerea şi calcularea parametrului statistic al testului
3 Regiunea critică
4 Concluzia testului
1 Formularea problemei icircn termenii ipotezelor statistice
Ipoteza nulă ipoteza care trebuie testată testul efectuacircndu-se sub prezumţia că ipoteza nulă ar
fi adevărată
Ipoteza alternativă acea ipoteză care icircntr-un sens sau altul contrazice ipoteza nulă Această
ipoteză se mai numeşte şi ipoteza de lucru
Ipoteza nulă tipuri
O coadă (ldquoone-tailedrdquo sau ldquoone-siderdquo)
Media este mai mare
Media este mai mică
Două cozi (ldquoone-tailedrdquo sau ldquoone-siderdquo)
Media este egală
2 Alegerea şi calcularea parametrului statistic al testului
Parametrul statistic al testului exprimă icircntr-o anumită formă diferenţa dintre elementele comparate
Ţinacircnd seama de faptul că eşantionul sau eşantioanele utilizate sunt aleator extrase din populaţiile care
fac obiectul testului parametrul statistic este o variabilă aleatoare de selecţie care urmează o anumită
lege de probabilitate
Un parametru statistic al testului bun trebuie să icircndeplinească două condiţii
19
Trebuie să se comporte diferit atunci cacircnd ipoteza nulă H0 este adevărată faţă de situaţia icircn
care ipoteza alternativă H1 este adevărată
Distribuţia de probabilitate a parametrului statistic al testului sub prezumţia că H0 este
adevărată este cunoscută
3 Regiunea critică
- Trebuie să fim capabili să decidem icircn funcţie de valoarea parametrului statistic calculat care dintre
ipoteze cea nulă sau cea alternativă este adevărată
- Dacă valoarea parametrului statistic aparţine regiunii critice ipoteza nulă H0 va fi respinsă şi va fi
acceptată ipoteza alternativă H1
- Dacă valoarea parametrului statistic nu aparţine regiunii critice ipoteza nulă H0 va fi acceptată
- Decidem mărimea regiunii critice
Pentru aceasta trebuie să specificăm mărimea riscului de eroare pe care icircl acceptăm
Pe scurt definim nivelul de semnificaţie notat cu a sau mărimea riscului pe care
suntem dispuşi să ni-l asumăm icircn respingerea ipotezei nule H0 icircn cazul icircn care aceasta
este adevărată De obicei se alege un nivel de semnificaţie icircntre 1 şi 5
Probabilitatea unei erori de tipul I
probabilitatea de respingere a ipotezei nule H0 icircn favoarea ipotezei alternative H1 icircn
condiţiile icircn care H0 este adevărată
probabilitatea unei erori de tipul I se notează cu a şi se mai numeşte nivel de
semnificaţie al testului
Probabilitatea unei erori de tipul II
probabilitatea acceptării ipotezei nule icircn condiţiile icircn care ipoteza alternativă H1 este
adevărată
această probabilitate se notează cu b
- Unilaterală la dreapta ndash valoarea parametrului statistic al testului este mai mare sau egală cu
valoarea din dreapta a intervalului critic
- Unilaterală la stacircnga ndash valoarea parametrului statistic al testului este mai mică sau egală cu
valoarea din stacircnga a intervalului critic
- Bilaterală ndash valoarea parametrului statistic al testului este mai mică sau egală cu valoarea extremă
din stacircnga regiunii critice sau mai mare sau egală cu valoarea extremă din dreapta regiunii critice
valorile extreme ale regiunii critice avacircnd nivele egale de semnificaţie
4 Concluzia testului
- Ipoteza nulă H0 este respinsă dacă valoarea parametrului statistic aparţine regiunii critice
20
- Regiunea critică trebuie astfel aleasă icircncacirct dacă ipoteza alternativă H1 este adevărată
probabilitatea de respingere a ipotezei nule H0 este mai mare decacirct icircn cazul icircn care ipoteza nulă H0
ar fi adevărată
- Acceptarea ipotezei nule H0 atunci cacircnd ipoteza alternativă H1 este adevărată este cunoscută ca şi
eroarea de tipul II
a probabilitatea ei se notează cu b
b măsoară bdquonivelul de eroarerdquo
- Icircn testarea oricărei ipoteze statistice există patru situaţii care determină dacă decizia noastră este
corectă sau nu
Cazuri
H0 este adevărată H0 este falsă
Concluzie H0 se acceptă decizie corectă eroare de tipul
II
H0 se
respinge
eroare de tipul I decizie corectă
Luarea deciziei pe baza valorii probabilităţii p de semnificaţie a testului
Icircn momentul icircn care prelucrăm statistic o serie de date dorim să ştim dacă rezultatele obţinute sunt sau
nu semnificative statistic
Răspunsul la această icircntrebare este dat de valoarea lui p calculată de orice program statistic la
prelucrarea unor date
Icircn cazul testelor statistice ipoteza nulă este respinsă dacă nivelul de semnificaţie este mai mic decacirct
005 iar programele de prelucrare statistică a datelor vor afişa o steluţă () icircn tabelul rezultatelor
21
Dacă p le 005 respingem ipoteza nulă şi acceptăm ipoteza alternativă (am obţinut semnificaţia
statistică)
Dacă p gt 005 acceptăm ipoteza nulă (nu am obţinut semnificaţia statistică)
p = 013
NU respingem ipoteza nulă
Risc de eroare de tip II
α = 005
p = 002
Respingem ipoteza nulă
Risc de eroare de tip I
Semnificaţia lui p
Criteriu de luare a deciziei cu privire la o ipoteză statistică nulă
Cuantifică şansa ca o decizie de respingere a ipotezei nule să fie greşită
Măsură a semnificaţiei statistice şi NU CLINICĂ
22
Semnificaţia lui p (reguli empirice)
001 le p lt 005 rezultatul e semnificativ statistic
0001 le p lt 001 rezultatul e icircnalt semnificativ statistic
p lt 0001 rezultatul e foarte icircnalt semnificativ statistic
p ge 005 rezultatul e considerat nesemnificativ statistic
Limite ale valorii p
Valoarea p NU ne dă informaţii despre
Şansa de beneficiu a unui pacient individual
Procentul de pacienţi care vor avea un beneficiu icircn urma instituirii procedurii medicale
Gradul de beneficiu expectat pentru un anumit pacient
Puterea unui test statistic
Este capacitatea de a detecta o diferenţă acolo unde există
Creşterea volumului eşantionului determină creşterea puterii testului statistic aplicat
Valoarea este icircn relaţie directă cu eroarea de tip II
Puterea = 1 ndash β
Cea mai utilizată modalitate de creştere a puterii unui test statistic este de a creşte volumul
eşantionului
Tipul scalei de măsură ndash testul statistic
Denumire test Interval Nominal Observaţii
Corelaţie Pearson 2 0 Există o relaţie liniară
χ2 0 2
Student 1 1 Doar 2 grupuri
ANOVA 1 1 2 sau mai multe grupuri
Student perechi 1 1 Eşantioane perechi
Măsurători repetate (ANOVA) 1 1 Mai mult de 2 grupuri date
perechi
Inferenţa statistică pe date calitativ e
Tabela de contingenţă 2times2
Riscuri şi raţii
Testul χ2 (testarea asocierii icircn tabela de contingenţă)
Testul Fisher
23
Testul z pentru proporţii
Testul McNemar
Tabela de contingenţă 2times2
Scale de tip nominal (dicotomiale tabela de contingenţă de 2times2) sau ordinal (tabela de contingenţă de
rtimesc)
Frecvenţa absolută (numărul de evenimente per categorie)
Tabela de contingenţă de 2times2 4 categorii
AP = adevărat pozitiv
FP = fals pozitiv
FN = fals negativ
AN = adevărat negativ
Ulcer deschis Ulcer vindecat Total
Recurenţă + AP = 1 FP = 5 = 1+5 = 6
Recurenţă - FN = 7 AN = 16 = 7+16 = 23
Total =1+7=8 =5+16=21 29
Riscuri şi raţii Mărimi ale asocierii
Denumire Formula Definiţie
Rata falşilor pozitivi =FP(FP+AN) Probabilitatea unui test fals + (α)
Rata falşilor negativi =FN(FN+AP) Probabilitatea unui test fals ndash (β)
Sensibilitate =AP(AP+FN) Probabilitatea unui test real + (1- β)
Specificitate =AN(AN+FP) Probabilitatea unui test real ndash (1- α)
Acurateţe =(AP+AN)n Probabilitatea generală a unei decizii corecte
Valoarea predictivă pozitivă =AP(AP+FP) Probabilitatea ca un test pozitiv să fie corect
Valoarea predictivă negativă =AN(AN+FN) Probabilitatea ca un test negativ să fie corect
Riscul relativ =AP(FP+AN)FN(AP+FP)
Rata şansei =(AP∙AN)(FN∙FP)
Riscul atribuabil =AP(AP+FP)-FN(FN+AN)
24
Denumire Formula
Rata falşilor pozitivi = 5(5+1) = 08334
Rata falşilor negativi = 7(7+16) = 03043
Sensibilitate = 1(1+7) = 01250
Specificitate = 16(16+5) = 07619
Acurateţe = (1+16)29 = 05862
Valoarea predictivă pozitivă = 1(1+5) = 01667
Valoarea predictivă negativă = 16(16+7) = 06957
Riscul relativ = 1(5+16)7(1+5) = 2142 = 050
Rata şansei = (1∙16)(7∙5) = 04571
Riscul atribuabil = 1(1+5)-7(7+16) = 01667-03043=-01376
Testarea asocierii icircn tabela de contingenţă
Testul χ2
Nu trebuie utilizat pentru eşantioane de volum mic
Testul este valid doar dacă valoarea expectată (aşteptată) pentru fiecare celulă este cel puţin
egală cu 1 şi frecvenţa absolută observată este de minim 5
Dacă aceste condiţii nu sunt icircndeplinite se aplică testul exact al lui Fisher (Fisherrsquos Exact Test)
Indică dacă cele două variabile sunt sau nu independente DAR NU cuantifică puterea asocierii
dintre ele
Problema S-a investigat icircntr-un studiu asocierea dintre obezitatea (ca factor de risc) şi bolile
cardio-vasculare la persoanele icircn etate (gt 60 ani) Din totalul de 620 persoane investigate s-au
identificat 150 persoane cu obezitate şi boală cardio-vasculară 230 persoane fără obezitate şi
fără boală cardio-vasculară şi 60 persoane fără obezitate dar cu boală cardio-vasculară Există
o asociere icircntre obezitate şi boala cardio-vasculară (df=1 α=005 χ2critic = 384)
Testul χ2 exemplu
H025
Nu există asociere icircntre obezitate şi bolile cardio-vasculare
Obezitatea şi bolile cardio-vasculare sunt independente
H1
Există asociere icircntre obezitate şi bolile cardio-vasculare
Obezitatea şi bolile cardio-vasculare sunt asociate
a = 005 pragul de semnificaţie al testului
urmează o lege cu (r-1)(c-1) grade de libertate
χ2 = parametrul testului χ2
fio = frecvenţa observată
fit = frecvenţa teoretică
Regiunea critică este [χα2 yen)
Pentru α = 005 χα2 = 384
OBSERVAT BCV+ BCV- Total
Obezitate + AP = 150 FP = 180 330
Obezitate - FN = 60 AN = 230 290
Total 210 410 620
TEORETIC BCV+ BCV- Total
Obezitate + = 330times210620 = 330times410620 330
Obezitate - = 290times210620 = 290times410620 290
Total 210 410 620
TEORETIC BCV+ BCV- Total
Obezitate + = 330times210620 = 330times410620 330
26
Obezitate - = 290times210620 = 290times410620 290
Total 210 410 620
TEORETIC BCV+ BCV-
Obezitate + = 112 = 218
Obezitate - = 98 = 192
Deoarece 4177Icirc[384 yen) se respinge H0 cu un risc de eroare de 5
Există asociere icircntre obezitate şi bolile cardio-vasculare
Testul Fisher
Corecţie a testului χ2
Valoarea p asociată parametrului ne dă probabilitatea ca valoarea observată de independenţă să fie
atribuită doar şansei
O valoare p mică indică că există alte cauze decacirct şansa influenţează rezultatul şi astfel cele două
variabile investigate nu sunt independente
Testul Fisher = dispersia corectată a factorului x dispersia corectată a factorilor reziduali
Icircn acest context regula adunării dispersiilor se poate scrie unde
este variaţia lui y pe seama variaţiei variabilei x
este variaţia lui y pe seama influenţei factorilor reziduali (neicircnregistraţi)
este variaţia totală a caracteristicii y
Testul Fisher empiric se calculează după formula
27
se compară cu Ftab pentru nx şi nz grade de libertate la un anumit prag de semnificaţie stabilit
Dacă Fc gt Ftab rezultă că variaţia factorului de grupare x este semnificativă pentru variaţia caracteristicii y
Testul z pentru proporţii
1 Compararea unei frecvenţe observate cu o frecvenţă teoretică
2 Testarea egalităţii a două frecvenţe
Testul z Compararea unei frecvenţe observate cu o frecvenţă teoretică
Scop Investigarea semnificaţiei diferenţei icircntre o frecvenţă teoretică p (icircntr-o populaţie) şi o frecvenţă
observată f pe un eşantion reprezentativ (variabilă calitativă (binare))
Condiţii de aplicare Testul este corect aplicat dacă numărul n al observaţiilor eşantionului este
suficient de mare (n∙p n∙(1-p)gt10
Parametrul
n = volumul eşantionului
Suntem interesaţi de investigarea prevalenţei hepatitei B la personalul care lucrează icircn laboratoarele
clinicilor de boli infecţioase din Transilvania Se ştie din studii anterioare că prevalenţa hepatitei B icircn
populaţia generală din Transilvania este de 9 S-a luat icircn studiu un eşantion de 100 persoane şi s-a
obţinut o prevalenţă a hepatitei B de 6 Există diferenţă semnificativă icircntre frecvenţa hepatitei B la
personalul care lucrează icircn laboratoarele spitalelor de boli infecţioase din Transilvania faţă de
populaţia generală
f = 006 p = 009 n = 100
Ipoteza nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat
faţă de frecvenţa hepatitei B icircn populaţia generală
Ipoteza alternativă test bilateral Există diferenţă semnificativă icircntre frecvenţa hepatitei B la
nivelul eşantionului şi prevalenţa hepatitei B icircn populaţia generală
f = 006 p = 009 n = 100
Pragul de semnificaţie a = 005
Regiunea critică test bilateral (-yen -196 ]Egrave[196 yen)
28
Concluzia testului
Deoarece parametrul statistic calculat al testului nu aparţine regiunii critice se acceptă ipoteza
nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat faţă de
frecvenţa hepatitei B icircn populaţia generală
Testul McNemar
Evaluarea dependenţei variabilelor calitative perechi (dorim să determinăm dacă o anumită
caracteristică este sau nu asociată cu o anumită patologie)
Identificăm n pacienţi care prezintă patologia de interes (eg Cancer bronho-pulmonar) şi n
pacienţi cu aceleaşi caracteristici ca şi primul grup dar care nu o prezintă
Martor = da Martor = nu
Caz = da a b
Caz = nu c d
Testul McNemar - exemplu fumat vs cancer
Martor = da Martor = nu
Cancer = da a = 2 b = 5
Cancer = nu c = 0 d = 3
29
χ2critic(α=005) = 384
32 lt 384 rarr acceptăm ipoteza nulă
Fumatul nu este icircn relaţie cu apariţia cancerului bronho-pulmonar
Inferenţa statistică pe date cantitative
Variabile cantitative continue
Testul z şi Student (t) (o medie sau medii perechi)
Testul z şi Student (t) (testarea a două medii)
ANOVA (ge 3 medii)
Ranguri (variabile cantitative discrete sau cantitative care nu icircndeplinesc condiţia de
normalitate)
Testul sumei rangurilor Wilcoxon
Kruskal-Wallis (ge 3 eşantioane independente)
Friedman (ge 3 eşantioane dependente)
Teste de normalitate variabile cantitative continue
Shapiro-Wilk
Kolmogorov-Smirnov
Shapiro-Wilk
Chi-Square Goodness-of-Fit
Dacă datele urmează o distribuţie normală aplicăm un test parametric
Dacă datele nu urmează o distribuţie normală aplicăm un test de comparare al rangurilor
30
Testul Z de comparare a mediei unui eşantion cu media unei populaţii
Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ
extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie
s2 care se cunoaşte
Condiţii de aplicare
1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru
compararea mediei unui eşantion cu media unei populaţii)
2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal
distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă
3 Talia eşantionului este mare ( ge 30)
Ipoteze
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media
eşantionului şi media populaţiei
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
(-yen -196 ] Egrave [196 yen)
Parametrul testului
n = volumul eşantionului
= media eşantionului
s = deviaţia standard a populaţiei
Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)
Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard
cunoscută
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi
media standard
Condiţii de aplicare
Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se
realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această
condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea
31
Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai
puternic
Numărul de grade de libertate (df) df = n-1
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
Parametrul testului
n = volumul eşantionului
micro0 = media standard
= media eşantionului
s = deviaţia standard a eşantionului
Testul ANOVA compararea mediilor a mai multe eşantioane
H0 = toate mediile sunt egale
H1 = nu toate mediile sunt egale
Condiţii de aplicare
1 Datele sunt independente unele faţă de celelalte
2 Datele fiecărui grup sunt normal distribuite
3 Deviaţia standard este aceeaşi pentru toate grupurile
Id Medicament
A B C D E F
1 5 6 7 10 5 9
2 6 8 8 11 8 8
3 7 7 9 13 6 7
4 8 9 11 12 4 5
32
5 9 10 10 9 7 6
Suma 35 40 45 55 30 35
Media 7 8 9 11 6 7
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =
= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)
Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2
F = (suma pătratelor(icircntre))(suma pătratelor(icircn))
Suma pătratelor (icircntre) = 16times5 = 80
Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60
Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn
interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare
SP df Media pătratelor F = MPicircntreMPicircn
Icircntre 80 5 = 805 = 16 = 1625 = 64
Icircn 60 24 = 6024 = 25
Total 140 29 -
Testul sumei rangurilor Wilcoxon
Aplicat pentru
Un set de observaţii provenite dintr-o valoare ipotetică comună
Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)
Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero
Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace
Suma rangurilor pentru diferenţele negative = 2+3+1 = 6
Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30
33
Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului
egal cu 8 = 0109
Icircnainte După Diferenţa Rang
64 66 -2 2
66 58 8 5
67 68 -1 3
71 65 6 4
72 75 -3 1
76 67 9 6
78 59 19 8
89 74 15 7
Testul Kruskal-Wallis (ge 3 eşantioane independente)
Test de ranguri aplicate pe mai mult de 3 eşantioane
H = parametrul testului
n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)
Tk = suma rangurilor
Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie
pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni
34
df = k-1 (k = numărul de eşantioane)
df = 3-1 = 2
Hcritic(α=005) = 599
H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie
pozitivă şi respectiv biopsie negativă
Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie
a tipului de studiu pe eşantioane perechi)
1 Definirea numărului de tratamente k
2 Obţinerea rangurilor pentru fiecare tratament
3 Sumarea rangurilor fiecărui tratament
4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)
5 Dacă Fr gt Frcritic rarr respingem H0
Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost
măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi
n = 9 k = 3 T12 = 225 T2
2 = 38025 T32 = 38025
Frcritic = 599
Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de
prostată
35
De reţinut
Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei
Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-
of-Fit
Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z
Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t
Compararea mediilor a 3 sau mai multe eşantioane ANOVA
Compararea mediilor a două populaţii (σ) testul Z
Compararea mediilor a două eşantioane (s) testul t
Compararea mediilor a două eşantioane perechi (s) testul t
ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi
cu cel pentru compararea a două eşantioane perechi
Ranguri
Distribuţia datelor nu are importanţă
Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)
Trei sau mai multe eşantioane Kruskal-Wallis
Trei sau mai multe eşantioane perechi Friedman
Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia
Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a
datelor)
Variabile nominale
Un singur eşantion sau eşantioane perechi
Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte
Eşantioane perechi testul Mc Nemar
Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2
Icircn analiza proporţiilor există teste diferite pentru
Compararea unei frecvenţe cu o frecvenţă cunoscută
Compararea a două frecvenţe
Semnificaţia statistică
Valoarea p (p value)
Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor
două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E
posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării
aleatorii
36
Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală
urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii
Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este
probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un
experiment de dimensiunea acestuia
Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că
diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii
diferite
Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca
fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă
ar fi fost adevărată
Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă
1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe
baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De
fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001
2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie
3 Se aplică testul statistic aferent pentru a calcula valoarea p
4 Se compară valoarea p cu valoarea ndash prag
5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe
semnificativă dpdv statisticrdquo
6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e
semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să
conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă
Teste de semnificaţie
Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului
populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)
Testarea ipotezelor implică posibile erori
Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile
sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui
grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul
icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005
ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există
37
nici o diferenţă
Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ
statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de
ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost
ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau
dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă
cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă
semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe
ipotetice variate icircn cazul icircn care ele există
Măsuri ale frecvenţei
Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)
Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate
Generic formula pe care se bazează toate cele trei este
unde x şi y sunt cantităţile de comparat
Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea
unei frecvenţe pe grupe de sex vacircrstă etc
Proporţia implică icircn mod necesar ca x să fie inclus icircn y
Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară
frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp
Pentru calcularea unei rate trebuie ţinut cont de trei aspecte
bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin
bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp
bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo
Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un
tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei
populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei
aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)
38
Indicatori
Rata de incidenţă
Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă
icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii
Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o
perioadă de timp
Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de
timp x
Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei
susceptibili de a dezvolta icircmbolnăvirea studiată
Numitorul poate fi
bull Numărul mediu al populaţiei icircn perioada de timp studiată
bull Mărimea populaţiei icircn mijlocul perioadei de studiu
bull Mărimea populaţiei la icircnceputul studiului
Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă
Este obligatorie menţionarea perioadei de timp
Prevalenţa
Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la
un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă
schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa
momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)
39
Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include
numai cazuri noi respectiv include cazuri noi şi vechi
Rata de atac
Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este
folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp
raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori
Rata persoană-timp
Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din
momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte
migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost
observate
Riscul relativ (RR)
Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment
legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele
prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două
grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la
bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la
bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai
mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo
Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2
Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn
cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă
(Tabelul 1)
Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR
Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la
neexpuşi
40
Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de
culegere a datelor
Odds ratio (OR)
Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin
raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general
studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)
Tabelul 2 Tabelul 2 x 2 pentru calcularea OR
Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală
Rate de mortalitate
Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp
specificată Există mai multe tipuri de rate de mortalitate
o Mortalitate specifică pe sex
o Mortalitate specifică pe rasă
o Mortalitate specifică pe boală
o Mortalitate neonatală
o Mortalitate postneonatală
o Mortalitate infantilă
o Mortalitate maternă
Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP
41
Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de
viaţă şi vacircrsta la care survine decesul dacă este prematur
Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu
Ani de viaţă pierduţi datorat dizabilităţii
Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt
utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru
cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite
grupuri
Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de
risc şi o boală se folosesc riscul relativ şi odds ratio
35 Analiza şi interpretarea datelor
După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date
trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul
Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor
colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului
studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu
plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde
prezenţa biostatisticianului este necesară
Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu
elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat
iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului
iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate
depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori
testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere
clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza
Interpretarea rezultatelor statistice
Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne
motive (număr mic de date) acceptarea ei să fie falsă
Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine
gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia
ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument
de decizie Intervalul de confidenţă
42
Interpretarea statistica ne interpretarea clinică
Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă
Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice
obţinute pe eşantionul studiat
Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare
Ce interpretăm Rezultatele
personale obţinute icircn urma studiului
care au fost prezentate icircn secţiunea bdquoRezultaterdquo
Explicăm rezultatele obţinute
Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale
Interpretarea trebuie să se realizeze icircn
lumina limitelor studiului
contextul cultural social şi educaţional al locului unde s-a realizat cercetarea
contextul a ceea ce se cunoaşte din literatura de specialitate
Interpretăm doar rezultatele personale obţinute icircn urma studiului
Interpretarea statistică nu este tot una cu interpretarea clinică
Interpretarea statistică este importantă
Interpretarea clinică este foarte importantă
Intervalul de confidenţă
Media calculată pe baza unui eşantion nu va echivala media populaţiei
Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului
Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a
populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a
populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)
pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru
orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare
dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de
confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de
date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de
5
Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel
Dacă valoarea p este mică
Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare
aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o
medie diferită Diferenţa este semnificativă dpdv statistic
43
Icircn continuare
Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa
reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică
pentru a fi interesante din punct de vedere ştiinţific
Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC
oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care
este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a
obţine o concluzie clară
Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o
diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că
datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din
punct de vedere ştiinţific
Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul
detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat
Erorile studiilor medicale
Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura
anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară
caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea
asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri
legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias
Erorile potenţiale icircn studiile epidemiologice
1 Erori icircntacircmplătoare
2 Erori sistematice
3 Confuzia
4 Validitatea
1 Erori icircntacircmplătoare
Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a
parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel
de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot
fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii
(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor
de măsură (eroarea de măsurare)
44
2 Erori sistematice
Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate
care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu
acurateţe mare Acurateţea nu este afectată de mărimea eşantionului
Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de
experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea
dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus
şi greu de cuantificat (consum de alcool personalitate etc)
Principalele tipuri de erori din această categorie sunt
bull Biasul de selecţie
bull Biasul de informaţie
Biasul de selecţie
Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul
trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion
inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale
persoanelor incluse
Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se
ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia
Biasul de informaţie
Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de
instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze
expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere
nesemnificativă sau chiar să nu şi-o amintească de loc
3 Confuzia
Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune
prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este
cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă
de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte
important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor
protector
4 Validitatea
Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă
Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte
estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional
Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă
45
conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se
demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)
Validitatea externă se poate realiza numai dacă studiul este valid intern
Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii
studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de
studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt
laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi
validă din punct de vedere intern)
3 6 Prezentarea rezultatelor
După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite
Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor
icircntr-o formă bdquodigerabilărdquo este necesară
Scopul prezentării datelor
1 Transmiterea concluziilor studiului
a Datele corecte şi importante merită comunicate
b Datele trebuie să confirme sau să infirme ipoteza studiului
c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală
2 Acordarea posibilităţii altor cercetători să aprecieze studiul
a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti
b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor
prezentate
Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru
fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie
statistică
Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de
valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras
(Tabel 3)
Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)
46
Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct
numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor
precum şi prezentarea acestora sub formă inteligibilă
Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care
convin cercetătorului
Prezentarea datelor se poate face
1 Figuri şi tabele icircn articole scrise
2 Figuri şi tabele icircn prezentări orale
3 Figuri şi tabele icircn postere
4 Text scris sau incluse icircn text
5 Site-uri de WEB
Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor
Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie
Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele
exprimacircnd exact ceea ce acestea exprimă
Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate
anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel
să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se
acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca
mai sus sugestive sunt formatele simple şi puţin icircncărcate
Dacă nu există reguli impuse se respectă
1 Mesaj simplu fără falsificarea datelor
2 De obicei este necesar atacirct tabelul cacirct şi graficul
3 Să fie simplu şi clar
Tabele
Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile
coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică
elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de
1 Se folosesc doar linii orizontale
2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn
evidenţi prin linie de separare (Tabelul 4)
Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland
Noua Zeelandă)
(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)
47
3 Numerele sunt aliniate icircn funcţie de virgulă
4 Indicii statistici sunt explicaţi sub tabel
5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană
6 Abrevierile pot fi folosite
7 Numărul de zecimale trebuie limitat la maxim două
8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel
9 Plasarea legendei este obligatorie sub tabel
10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)
Icircn cazul prezentărilor orale sau a posterelor este indicat ca
1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării
2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte
3 Folosirea de simboluri este permisă
Clasificarea tabelelor
Tabelele se clasifică după
i) conţinut
bull cu distribuţii de frecvenţe
bull de clase de frecvenţe
bull de contingenţă
ii) structura
bull cu doua coloane
bull cu subclasificări
bull ldquomasterrdquo
Tabele ce conţin distribuţii de frecvenţe
O modalitate comodă de a prezenta o mulţime de date brute este
1 Se ordonează datele in ordine crescătoare
2 Se determine frecvenţa fiecărei valori
3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane
(Tabelul 5)
Tabelul 5 Distribuţii de frecvenţă absolută
48
Tabelul claselor de frecvenţe
1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă
2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)
Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)
Tabele de contingenţă
1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a
tabelelor de contingenţă
2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a
combinaţiilor de perechi ordonate de valori
3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre
a factor de risc si
b starea sănătăţii
4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)
5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)
Tabelul 7 Tabel de contingenţă 2 x 2
49
Grafice
Există două categorii de moduri grafice sub care se pot prezenta datele
1 Ilustraţii şi fotografii
2 Grafice
1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă
pentru lucrare
2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit
Putem vorbi despre mai multe tipuri de grafice
bull Grafice pentru reprezentarea datelor cantitative
1048707 Grafic cartezian (X Y)
1048707 Histograma
1048707 Poligonul de frecvenţe
1048707 Diagrama bdquoscatterrdquo
bull Grafice pentru reprezentarea datelor calitative
1048707 Grafic cu bare
1048707 Diagrama tip bdquoboxplotrdquo
1048707 Diagrama bdquopierdquo
1048707 Cartograma
Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi
dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)
Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)
Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie
Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)
Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)
50
Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir
de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele
două variabile studiate (Figura 6)
Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2
(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2
rămacircne aproximativ constantă)
Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea
comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea
comparativă a mai multor variabile
Figura 7 Grafic calitativ cu bare
51
Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo
Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două
posibilităţi reprezentate grafic este mai frecventă (Figura 8)
Figura 8 Reprezentare tip bdquopierdquo
Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli
sau a oricărui element comparativ Se foloseşte de epidemiologi
Rezultate
Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare
Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o
manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu
explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția
bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la
ilustraţii tabele grafice
Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi
nici rezultatele care invalidează eventual ipoteza
Discuţii
Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd
cultura ştiinţifică şi inteligenţa autorilor
Acest capitol răspunde la trei obiective
Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia
calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de
selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează
rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv
52
este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn
care a fost abordată problema fără a face o revistă a literaturii
Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea
rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul
Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor
afirmaţii nesusţinute de conţinutul lucrării
Concluzii
Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate
să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie
Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de
concluzii va scădea valoarea lucrării
Bibliografia (lista referinţelor citarea icircn text)
Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn
lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente
Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli
- să conţină cele mai importante şi recente lucrări
- să includă numai lucrări publicate
- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate
Bibliografie
Elisabeta Jaba ndash Statistică Ed Economică 1998
Mihai Ţarcă ndash Statistică volI Ed UAIC 1979
Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale
Ed University Press 2009
Sorana Daniela Bolboacă ndash Metodologia cercetării curs
53
Tipuri de culegere a datelor
1 Culegere de tip eşantion reprezentativ Grupul de indivizi incluşi icircn studiu sunt reprezentativi (calitativ şi
cantitativ) pentru populaţia generală Poate fi utilizat pentru studii descriptive (cel mai frecvent) dar uneori şi
pentru studii analitice
Este necesar pentru acest tip de culegere a datelor ca iniţial să fie cunoscută talia eşantionului (calculabilă icircn
funcţie de prevalenţă şi precizie) Pentru evaluarea datelor culese se utilizează tabelul de contingenţă 2 x 2
astfel (Figura 1)
Figura 1 - Tabelul de contingenţă 2 x 2
Unde
a ndash persoane expuse unui factor de risc care au boala studiată
b ndash persoane expuse unui factor de risc care nu au boala studiată
c - persoane neexpuse unui factor de risc care au boala studiată
d - persoane neexpuse unui factor de risc care nu au boala studiată
După aranjarea datelor icircn tabelul de contingenţă (2 x 2) se poate icircncepe analiza statistică a datelor atacirct ca
procente calculabile cacirct şi din punct de vedere a aplicării de teste statistice pentru elucidarea semnificaţiei
statistice
Este posibilă din acest tip de culegere de date calcularea
1 Prevalenţei unei boli
2 Frecvenţei expunerii
3 Gradul de asociere icircntre factorul eventual de risc şi boala
2 Culegerea de tip expus ndash neexpus Icircmparte subiecţii icircn două categorii expuşi sau neexpuşi factorului de risc
studiat Ca evoluţie următoare a studiului după o astfel de culegere a datelor se poate evalua icircn timp apariţia
icircmbolnăvirii despre care se efectuează studiul Icircn timp longitudinal prospectiv se poate calcula dacă factorul
studiat reprezintă un risc de icircmbolnăvire este indiferent sau chiar este cu efect protectiv Numărul subiecţilor
din cele două grupuri poate fi egal sau poate fi diferit Numărul acestora poate fi calculat icircn vederea obţinerii
unei bune reprezentativităţi cu ajutorul formulelor de selecţie Avacircnd icircn vedere calitatea longitudinală a
12
studiului este important ca numărul ales să fie mai mare pentru a putea suplinii eventualele pierderi din
urmărire Practic rezultatele sunt introduse icircn tabelul 2 x 2 de unde se pot calcula indicatorii doriţi (Figura 2)
Avacircnd icircn vedere modul de culegere a datelor este permisă calcularea de indicatori numai pe orizontală
orice comparare icircntre coloana dreaptă şi stacircngă fiind incorectă Avantajul acestui tip de culegere a datelor ar fi
eventualul număr mai redus de subiecţi dar dezavantajul major este cel al costurilor de urmărire icircn timp dar
trebuie luată icircn calcul şi pierderea de subiecţi din evidenţe Factorul controlat este deci prezenţa expunerii iar
factorul aleator este prezenţa bolii
Figura 2 Tabelul de contingenţă pentru tipul de culegere expus ndash neexpus
4 Culegerea de tip caz ndash martor Icircn acest caz ceea ce ghidează colectarea datelor este prezenţa sau absenţa
bolii icircn momentul prezent Se vor culege date de la două loturi constituite după criteriul de bolnav B+ şi de fără
boală B+ Datele culese sunt icircn trecut deci caracterul datelor va fi retrospectiv Icircn acest caz factorul controlat
este boala factorul aleator fiind expunerea (Figura 3)
Calculul de indicatori icircn acest caz se va putea efectua numai icircntre coloane orice calcul icircntre valorile de pe linii
fiind greşit Rezultate semnificative se pot obţine icircn acest caz utilizacircnd loturi mai mici de studiu prin
comparaţie cu tipul eşantion reprezentativ permiţacircnd icircn acelaşi timp studiul bolilor rare (cu prevalenţă mică)
Figura 3 Tabelul de contingenţă pentru tipul de culegere caz ndash martor
Metode de culegere a datelor
Metoda aleasă pentru culegerea datelor trebuie să fie aleasă după un atent studiu bibliografic icircn vederea
stabilirii celui mai eficient mod de a răspunde temei de studiu
Metodele de culegere trebuie să fie bine aplicabile şi consistente ca aport informaţional necesar
13
1 Fiziologice Sunt colectate date despre anumite caracteristici fiziologice ale pacienţilor (TA glicemie
colesterol etc) Această metodă aduce rezultate obiective cacirct timp instrumentul de evaluare este bine calibrat
şi prezintă variaţii mici
2 Metode observaţionale Instrumentul de culegere a datelor trebuie să fie sincronizat cu protocolul conceput
de cercetător Datele culese trebuie să fie de asemenea consistente adică să fie colectate de aceeaşi manieră
conducătorul studiului trebuind să instruiască investigatorii (colectorii de date) Icircnregistrarea datelor trebuie să
fie de asemenea sistematică şi bine standardizată Observaţii de control trebuie icircn mod obligatoriu făcute
pentru a putea aprecia icircn mod corect orice deviere datorată unor factorii externi Este obligatorie luarea icircn
consideraţie a aspectelor etice
3 Interviul Poate fi structurat cu un set specific de icircntrebări sau nestructurat cu o temă generală cu care se
icircncepe interviul Interviurile pot fi icircnregistrate sau intervievatorul poate nota pur şi simplu răspunsurile Există
două tipuri generice de interviu interviul de profunzime care se referă la o discuţie icircn general structurată cu
un număr de icircntrebări prestabilite icircn icircncăperea de studiu fiind doară intervievatorul şi persoana chestionată şi
interviul de grup unde prin conversaţii pornind de la temă generală expusă şi condusă de intervievator se
obţin date despre subiecţii participanţi la studiu Ambele metode de interviu au indicaţiile lor precise Un
interviu pe teme intime nu va putea fi corect icircn ceea ce priveşte datele colectate dacă se aplică un interviu de
grup
4 Chestionarul Document scris adresat unor persoane pentru a răspunde la una sau mai multe icircntrebări
Trebuie să aducă răspunsurile la icircntrebările care motivează studiul constituind ansamblul icircntrebărilor destinate
culegerii de informaţii (date) Redactarea chestionarului trebuie să ţină cont de structura acestuia introducere
conţinut exprimarea icircntrebărilor grafica chestionarului
5 Icircnregistrări preexistente
Icircn cercetarea medicală sunt cel mai frecvent utilizate Informaţiile dorite sunt deja existente ceea ce icirci revine
cercetătorului este ca să structureze datele icircn funcţie de scopul studiului pe care icircn conduce Aceste surse sunt
bull Foi de observaţie
bull Registre de consultaţie
bull Buletine de analize
bull Registre de operaţii
Icircn cazul icircn care nici o metodă de culegere a datelor nu este pe placul celui ce conduce studiul există
posibilitatea de a construi un instrument nou de culegere a datelor
Acest proces trebuie să urmărească nişte paşi obligatorii fiind mare consumator de timp
bull Definirea structurii cu care se va face măsurarea
bull Formularea itemilor de măsură
bull Analiza validităţii instrumentului de măsură ndash măsoară acesta fenomenul corect
bull Elaborarea de instrucţiuni de utilizare pentru investigatori
14
bull Pretestarea instrumentului
bull Aprecierea validităţii interne şi externe a datelor culese
Instrumente de cercetare
Formularea clară a temei de cercetare necesită o foarte bună definire a factorilor studiaţi şi a criteriilor de
judecată Acestea din urmă sunt ultimele care vor trebui definite icircn cadrul protocolului de studiu
Alegerea unui instrument de măsură
Nu există un instrument de măsură perfect sau universal corect Alegerea sa dintre cele existente şi cele deja
utilizate depind de trei factori
bull Obiectivul studiului
bull Boala studiată
bull Populaţia icircn studiu
De aceste trei elemente trebuie ţinut cont icircn fiecare etapă a dezvoltării instrumentului
Definirea obiectivului
Studiu transversal Dacă se doreşte studierea unui simptom sau a unei caracteristici ale populaţiei se poate
icircmpărţi populaţia de studiu icircn mai multe grupuri Este practic vorba de a determina diferenţele dintre subiecţi
icircn cea ce priveşte o variabilă necesară studiată printr-un studiu transversal (utilizarea dozării de Ac HBS
pentru a evalua progresele bolnavilor de hepatită tip B)
Studiu longitudinal Icircn acest caz nu se poate icircmpărţii populaţia de studiu icircn mai multe grupuri datele obţinute
fiind de la acelaşi subiect colectate după un interval de timp
Icircn funcţie de boală şi populaţie se aleg şi instrumentele de măsură cele mai adecvate
Instrumentele cercetării reprezintă un mecanism specific sau o strategie pe care cercetătorul o utilizează pentru
colectarea prelucrarea şi inferenţa datelor Aceste instrumente sunt
1 Studiul icircn bibliotecă
2 Computerul
3 Determinările experimentale
4 Statistica
5 Mintea umană
6 Facilităţi de limbaj şi comunicare
Determinările experimentale
Măsurarea constă icircn aprecierea şi cuantificarea fenomenelor calitativ sau cantitativ Interpretarea
datelor se referă la transformarea lor icircn unităţi de descoperire a unor fenomene mai puţin cercetate
Standardele acceptate se referă la norme medii distribuţii etc Tot icircn cadrul interpretării datelor datele
obţinute sunt caracterizate pe scale de valori nominal ordinal de interval sau de raport
Validarea şi reproductibilitatea măsurătorilor sunt aspecte importante şi foarte necesare pentru o
cercetare corect fundamentată care doreşte obţinerea unor concluzii pertinente
15
Statistica Este implicată icircn condensarea şi procesarea unui volum mai mare de date astfel icircncacirct să se poată
interpreta corect valorile obţinute şi să se permită comparările Utilizarea unor teste statistice specifice permite
determinarea semnificaţiei (diferenţei) statistice astfel icircncacirct estimatorii să poată fi aplicaţi la populaţia
generală Furnizează informaţii şi privind corelarea sau relaţionarea icircntre date
Mintea umană este cea care reuşeşte să integreze şi să icircnţeleagă rezultatele obţinute Semnificaţia ştiinţifică
este stabilită icircn funcţie de rezultatele statisticii de mintea umană conform afirmaţiei bdquosemnificaţia ştiinţifică
nu este egală cu semnificaţia statisticărdquo Metodele aplicate pentru a putea ajunge la o concluzie pertinentă sunt
logica deductivă raţionamentul inductiv şi gacircndirea critică
Limbaj şi comunicare Exprimarea orală sau icircn scris permite nuanţarea unor aspecte seci cifrice ale unor
studii Icircn acest mod devine mai evidentă semnificaţia ştiinţifică a unor rezultate statistice
34 Prelucrarea datelor
Instrumentele de prelucrare
Statistica este o ştiinţă ramură a matematicii care studiază evoluţia fenomenelor şi proceselor
colective pe baza observării lor ştiinţifice a culegerii şi prelucrării detaliate a informaţiilor statistice cu scopul
de a formula şi explica legile legităţile şi regularităţile ce le guvernează
Statistica permite deci aprecierea unor parametrii populaţionali prin studiul unui număr redus de
elemente ale populaţiei icircn studiu (ţintă) O populaţie poate fi definită printr-un şir de valori care pot fi grupate
icircn funcţie de parametrul studiat (glicemie colesterol TAD TAS etc) Pentru fiecare astfel de şir se defineşte
o variabilă (care va purta nume propriu glicemie colesterol etc) Practic variabila este considerată o funcţie
ia valori posibil diferite de la un element la altul icircn funcţie de caracteristicile proprii acestora Sunt clasificate
icircn două grupe variabile cantitative (caracteristică măsurabilă) şi calitative (caracteristică ce nu poate fi
măsurată)
La racircndul lor variabilele calitative pot fi
bull Nominale ndash grupuri de elemente ce nu pot fi ordonate (culoarea părului)
bull Nominale ordonate ndash concluziile pot fi grupate (eficienţa unui tratament slabă bună foarte bună)
bull Binare ndash apar numai două posibilităţi (bolnav sănătos)
Variabilele cantitative pot fi
bull Continue ndash o variabilă măsurabilă care poate lua o infinitate de valori
bull Discrete ndash variabile care nu pot lua decacirct valori icircntregi
Statistica descriptivă
Există două ramuri ale statisticii statistica descriptivă şi statistica inferenţială
Statistica descriptivă (după cum rezultă din denumire) se ocupă cu descrierea unor valori obţinute ale unei
variabile studiate
16
Valorile pe care variabila le ia se constituie icircntr-o serie statistică Indicatorii care definesc o variabilă (serie)
sunt
1 Ale tendinţei centrale
Media aritmetică - notată de regulă cu
Mediana - este acea valoare din şirul de date care icircmparte icircn două părţi egale şirul ordonat de valori (atenţie
şirul este ordonat crescător) situacircndu-se la mijlocul seriei statistice
Dacă numărul de valori n este un număr impar atunci mediana este valoarea unde
Dacă n este par deci avem un număr par de valori mediana este definitatilde ca fiind
unde k = n2
Modul - constituie valoarea care apare cel mai des deci valoarea cu numărul cel mai mare de apariţii
2 De dispersie
Amplitudinea - este diferenţa dintre valoarea maximă şi cea minimă
A = Amax - Amin
Amplitudinea relativă - notată A este raportul dintre amplitudinea absolută şi media aritmetică a seriei de
date
Varianţa notată este un indicator de icircmprăştiere a datelor Formula de calcul este
Abaterea standard (S) sau deviaţia standard reprezintă rădăcina pătrată din varianţă (dispersie)
Coeficientul de variaţie se calculează ca un raport procentual icircntre abaterea standard şi valoarea medie a şirului
de valori
Eroarea standard intervine icircn estimarea intervalelor de confidenţă Se calculează astfel
17
3 De asimetrie (skewness) indică distribuţia datelor dacă sunt sau nu distribuite normal
4 De boltire (kurtosis) estimează boltirea sau aplatizarea curbei de distribuţie
Prezentarea descriptivă a datelor se face prin icircnregistrarea datelor culese icircn tabele care să reprezinte icircn mod
sintetic valorile măsurate
Icircn concluzie statistica descriptivă permite
bull Stabilirea comparabilităţii icircntre grupurile de studiu şi aprecierea prezenţei erorilor sau confuziei
bull Reprezentarea datelor icircn tabele permite evaluarea fiecărui pacient şi dacă a existat pierderi din studiu
Statistica inferenţială
Statistica inferenţială (inductivă) este partea de analiză a datelor care permite extrapolarea unei
concluzii trase pe baza unui eşantion spre populaţia ţintă pentru care a fost efectuat studiul
Scopul analizei statistice este de a evidenţia efectul unui tratament sau al unui factor de risc prin date obţinute
din eşantionul studiat spre populaţia ţintă Aceasta implică testarea ipotezelor statistice sau altfel spus testarea
semnificaţiei statistice Este una dintre cele mai importante momente ale studiului Cum rezultatele sunt
obţinute prin studiul unui eşantion există posibilitatea ca acestea să fie datorate icircntacircmplării Testele
statistice ne ajută să apreciem icircn ce măsură rezultatele sunt icircntacircmplătoare şi mai ales icircn ce măsură şi dacă se
pot aplica populaţiei generale Icircn acest scop se impune o valoare limită alfa 005 care reprezintă limita
superioară a probabilităţii ca rezultatul obţinut să fie greşit (datorat icircntacircmplării) Astfel icircn funcţie de tipul
variabilelor şi indicatorii descriptivi aplicaţi şi evaluaţi se aplică teste de semnificaţie statistică (Tabelul 1)
Tabelul 1 Alegerea testelor de semnificaţie statistică
Tipul datelor
18
Diferenţierea variabilelor din punctul de vedere a distribuţiei se face folosind testul de normalitate
Kolmogorov ndash Smirnov
Testul statistic reprezintă metoda de comparaţie a două sau mai multe populaţii prin intermediul unor
variabile observate ale lor
Scopul unui test statistic este de a defini realitatea
Definirea icircntrebării de cercetare (ipoteza clinică)
Tratamentul cu Nebivolol este la fel de eficient ca şi cel cu Valsartan icircn tratamentul
hipertensiunii arteriale
Transpunerea icircntrebării de cercetare icircn termeni statistici (ipoteza statistică)
Media tensiunii arteriale a pacienţilor trataţi cu Valsartan nu diferă semnificativ de media
tensiunii arteriale a pacienţilor trataţi cu Nebivolol
Etapele unui test statistic
1 Formularea problemei icircn termenii ipotezelor statistice
2 Alegerea şi calcularea parametrului statistic al testului
3 Regiunea critică
4 Concluzia testului
1 Formularea problemei icircn termenii ipotezelor statistice
Ipoteza nulă ipoteza care trebuie testată testul efectuacircndu-se sub prezumţia că ipoteza nulă ar
fi adevărată
Ipoteza alternativă acea ipoteză care icircntr-un sens sau altul contrazice ipoteza nulă Această
ipoteză se mai numeşte şi ipoteza de lucru
Ipoteza nulă tipuri
O coadă (ldquoone-tailedrdquo sau ldquoone-siderdquo)
Media este mai mare
Media este mai mică
Două cozi (ldquoone-tailedrdquo sau ldquoone-siderdquo)
Media este egală
2 Alegerea şi calcularea parametrului statistic al testului
Parametrul statistic al testului exprimă icircntr-o anumită formă diferenţa dintre elementele comparate
Ţinacircnd seama de faptul că eşantionul sau eşantioanele utilizate sunt aleator extrase din populaţiile care
fac obiectul testului parametrul statistic este o variabilă aleatoare de selecţie care urmează o anumită
lege de probabilitate
Un parametru statistic al testului bun trebuie să icircndeplinească două condiţii
19
Trebuie să se comporte diferit atunci cacircnd ipoteza nulă H0 este adevărată faţă de situaţia icircn
care ipoteza alternativă H1 este adevărată
Distribuţia de probabilitate a parametrului statistic al testului sub prezumţia că H0 este
adevărată este cunoscută
3 Regiunea critică
- Trebuie să fim capabili să decidem icircn funcţie de valoarea parametrului statistic calculat care dintre
ipoteze cea nulă sau cea alternativă este adevărată
- Dacă valoarea parametrului statistic aparţine regiunii critice ipoteza nulă H0 va fi respinsă şi va fi
acceptată ipoteza alternativă H1
- Dacă valoarea parametrului statistic nu aparţine regiunii critice ipoteza nulă H0 va fi acceptată
- Decidem mărimea regiunii critice
Pentru aceasta trebuie să specificăm mărimea riscului de eroare pe care icircl acceptăm
Pe scurt definim nivelul de semnificaţie notat cu a sau mărimea riscului pe care
suntem dispuşi să ni-l asumăm icircn respingerea ipotezei nule H0 icircn cazul icircn care aceasta
este adevărată De obicei se alege un nivel de semnificaţie icircntre 1 şi 5
Probabilitatea unei erori de tipul I
probabilitatea de respingere a ipotezei nule H0 icircn favoarea ipotezei alternative H1 icircn
condiţiile icircn care H0 este adevărată
probabilitatea unei erori de tipul I se notează cu a şi se mai numeşte nivel de
semnificaţie al testului
Probabilitatea unei erori de tipul II
probabilitatea acceptării ipotezei nule icircn condiţiile icircn care ipoteza alternativă H1 este
adevărată
această probabilitate se notează cu b
- Unilaterală la dreapta ndash valoarea parametrului statistic al testului este mai mare sau egală cu
valoarea din dreapta a intervalului critic
- Unilaterală la stacircnga ndash valoarea parametrului statistic al testului este mai mică sau egală cu
valoarea din stacircnga a intervalului critic
- Bilaterală ndash valoarea parametrului statistic al testului este mai mică sau egală cu valoarea extremă
din stacircnga regiunii critice sau mai mare sau egală cu valoarea extremă din dreapta regiunii critice
valorile extreme ale regiunii critice avacircnd nivele egale de semnificaţie
4 Concluzia testului
- Ipoteza nulă H0 este respinsă dacă valoarea parametrului statistic aparţine regiunii critice
20
- Regiunea critică trebuie astfel aleasă icircncacirct dacă ipoteza alternativă H1 este adevărată
probabilitatea de respingere a ipotezei nule H0 este mai mare decacirct icircn cazul icircn care ipoteza nulă H0
ar fi adevărată
- Acceptarea ipotezei nule H0 atunci cacircnd ipoteza alternativă H1 este adevărată este cunoscută ca şi
eroarea de tipul II
a probabilitatea ei se notează cu b
b măsoară bdquonivelul de eroarerdquo
- Icircn testarea oricărei ipoteze statistice există patru situaţii care determină dacă decizia noastră este
corectă sau nu
Cazuri
H0 este adevărată H0 este falsă
Concluzie H0 se acceptă decizie corectă eroare de tipul
II
H0 se
respinge
eroare de tipul I decizie corectă
Luarea deciziei pe baza valorii probabilităţii p de semnificaţie a testului
Icircn momentul icircn care prelucrăm statistic o serie de date dorim să ştim dacă rezultatele obţinute sunt sau
nu semnificative statistic
Răspunsul la această icircntrebare este dat de valoarea lui p calculată de orice program statistic la
prelucrarea unor date
Icircn cazul testelor statistice ipoteza nulă este respinsă dacă nivelul de semnificaţie este mai mic decacirct
005 iar programele de prelucrare statistică a datelor vor afişa o steluţă () icircn tabelul rezultatelor
21
Dacă p le 005 respingem ipoteza nulă şi acceptăm ipoteza alternativă (am obţinut semnificaţia
statistică)
Dacă p gt 005 acceptăm ipoteza nulă (nu am obţinut semnificaţia statistică)
p = 013
NU respingem ipoteza nulă
Risc de eroare de tip II
α = 005
p = 002
Respingem ipoteza nulă
Risc de eroare de tip I
Semnificaţia lui p
Criteriu de luare a deciziei cu privire la o ipoteză statistică nulă
Cuantifică şansa ca o decizie de respingere a ipotezei nule să fie greşită
Măsură a semnificaţiei statistice şi NU CLINICĂ
22
Semnificaţia lui p (reguli empirice)
001 le p lt 005 rezultatul e semnificativ statistic
0001 le p lt 001 rezultatul e icircnalt semnificativ statistic
p lt 0001 rezultatul e foarte icircnalt semnificativ statistic
p ge 005 rezultatul e considerat nesemnificativ statistic
Limite ale valorii p
Valoarea p NU ne dă informaţii despre
Şansa de beneficiu a unui pacient individual
Procentul de pacienţi care vor avea un beneficiu icircn urma instituirii procedurii medicale
Gradul de beneficiu expectat pentru un anumit pacient
Puterea unui test statistic
Este capacitatea de a detecta o diferenţă acolo unde există
Creşterea volumului eşantionului determină creşterea puterii testului statistic aplicat
Valoarea este icircn relaţie directă cu eroarea de tip II
Puterea = 1 ndash β
Cea mai utilizată modalitate de creştere a puterii unui test statistic este de a creşte volumul
eşantionului
Tipul scalei de măsură ndash testul statistic
Denumire test Interval Nominal Observaţii
Corelaţie Pearson 2 0 Există o relaţie liniară
χ2 0 2
Student 1 1 Doar 2 grupuri
ANOVA 1 1 2 sau mai multe grupuri
Student perechi 1 1 Eşantioane perechi
Măsurători repetate (ANOVA) 1 1 Mai mult de 2 grupuri date
perechi
Inferenţa statistică pe date calitativ e
Tabela de contingenţă 2times2
Riscuri şi raţii
Testul χ2 (testarea asocierii icircn tabela de contingenţă)
Testul Fisher
23
Testul z pentru proporţii
Testul McNemar
Tabela de contingenţă 2times2
Scale de tip nominal (dicotomiale tabela de contingenţă de 2times2) sau ordinal (tabela de contingenţă de
rtimesc)
Frecvenţa absolută (numărul de evenimente per categorie)
Tabela de contingenţă de 2times2 4 categorii
AP = adevărat pozitiv
FP = fals pozitiv
FN = fals negativ
AN = adevărat negativ
Ulcer deschis Ulcer vindecat Total
Recurenţă + AP = 1 FP = 5 = 1+5 = 6
Recurenţă - FN = 7 AN = 16 = 7+16 = 23
Total =1+7=8 =5+16=21 29
Riscuri şi raţii Mărimi ale asocierii
Denumire Formula Definiţie
Rata falşilor pozitivi =FP(FP+AN) Probabilitatea unui test fals + (α)
Rata falşilor negativi =FN(FN+AP) Probabilitatea unui test fals ndash (β)
Sensibilitate =AP(AP+FN) Probabilitatea unui test real + (1- β)
Specificitate =AN(AN+FP) Probabilitatea unui test real ndash (1- α)
Acurateţe =(AP+AN)n Probabilitatea generală a unei decizii corecte
Valoarea predictivă pozitivă =AP(AP+FP) Probabilitatea ca un test pozitiv să fie corect
Valoarea predictivă negativă =AN(AN+FN) Probabilitatea ca un test negativ să fie corect
Riscul relativ =AP(FP+AN)FN(AP+FP)
Rata şansei =(AP∙AN)(FN∙FP)
Riscul atribuabil =AP(AP+FP)-FN(FN+AN)
24
Denumire Formula
Rata falşilor pozitivi = 5(5+1) = 08334
Rata falşilor negativi = 7(7+16) = 03043
Sensibilitate = 1(1+7) = 01250
Specificitate = 16(16+5) = 07619
Acurateţe = (1+16)29 = 05862
Valoarea predictivă pozitivă = 1(1+5) = 01667
Valoarea predictivă negativă = 16(16+7) = 06957
Riscul relativ = 1(5+16)7(1+5) = 2142 = 050
Rata şansei = (1∙16)(7∙5) = 04571
Riscul atribuabil = 1(1+5)-7(7+16) = 01667-03043=-01376
Testarea asocierii icircn tabela de contingenţă
Testul χ2
Nu trebuie utilizat pentru eşantioane de volum mic
Testul este valid doar dacă valoarea expectată (aşteptată) pentru fiecare celulă este cel puţin
egală cu 1 şi frecvenţa absolută observată este de minim 5
Dacă aceste condiţii nu sunt icircndeplinite se aplică testul exact al lui Fisher (Fisherrsquos Exact Test)
Indică dacă cele două variabile sunt sau nu independente DAR NU cuantifică puterea asocierii
dintre ele
Problema S-a investigat icircntr-un studiu asocierea dintre obezitatea (ca factor de risc) şi bolile
cardio-vasculare la persoanele icircn etate (gt 60 ani) Din totalul de 620 persoane investigate s-au
identificat 150 persoane cu obezitate şi boală cardio-vasculară 230 persoane fără obezitate şi
fără boală cardio-vasculară şi 60 persoane fără obezitate dar cu boală cardio-vasculară Există
o asociere icircntre obezitate şi boala cardio-vasculară (df=1 α=005 χ2critic = 384)
Testul χ2 exemplu
H025
Nu există asociere icircntre obezitate şi bolile cardio-vasculare
Obezitatea şi bolile cardio-vasculare sunt independente
H1
Există asociere icircntre obezitate şi bolile cardio-vasculare
Obezitatea şi bolile cardio-vasculare sunt asociate
a = 005 pragul de semnificaţie al testului
urmează o lege cu (r-1)(c-1) grade de libertate
χ2 = parametrul testului χ2
fio = frecvenţa observată
fit = frecvenţa teoretică
Regiunea critică este [χα2 yen)
Pentru α = 005 χα2 = 384
OBSERVAT BCV+ BCV- Total
Obezitate + AP = 150 FP = 180 330
Obezitate - FN = 60 AN = 230 290
Total 210 410 620
TEORETIC BCV+ BCV- Total
Obezitate + = 330times210620 = 330times410620 330
Obezitate - = 290times210620 = 290times410620 290
Total 210 410 620
TEORETIC BCV+ BCV- Total
Obezitate + = 330times210620 = 330times410620 330
26
Obezitate - = 290times210620 = 290times410620 290
Total 210 410 620
TEORETIC BCV+ BCV-
Obezitate + = 112 = 218
Obezitate - = 98 = 192
Deoarece 4177Icirc[384 yen) se respinge H0 cu un risc de eroare de 5
Există asociere icircntre obezitate şi bolile cardio-vasculare
Testul Fisher
Corecţie a testului χ2
Valoarea p asociată parametrului ne dă probabilitatea ca valoarea observată de independenţă să fie
atribuită doar şansei
O valoare p mică indică că există alte cauze decacirct şansa influenţează rezultatul şi astfel cele două
variabile investigate nu sunt independente
Testul Fisher = dispersia corectată a factorului x dispersia corectată a factorilor reziduali
Icircn acest context regula adunării dispersiilor se poate scrie unde
este variaţia lui y pe seama variaţiei variabilei x
este variaţia lui y pe seama influenţei factorilor reziduali (neicircnregistraţi)
este variaţia totală a caracteristicii y
Testul Fisher empiric se calculează după formula
27
se compară cu Ftab pentru nx şi nz grade de libertate la un anumit prag de semnificaţie stabilit
Dacă Fc gt Ftab rezultă că variaţia factorului de grupare x este semnificativă pentru variaţia caracteristicii y
Testul z pentru proporţii
1 Compararea unei frecvenţe observate cu o frecvenţă teoretică
2 Testarea egalităţii a două frecvenţe
Testul z Compararea unei frecvenţe observate cu o frecvenţă teoretică
Scop Investigarea semnificaţiei diferenţei icircntre o frecvenţă teoretică p (icircntr-o populaţie) şi o frecvenţă
observată f pe un eşantion reprezentativ (variabilă calitativă (binare))
Condiţii de aplicare Testul este corect aplicat dacă numărul n al observaţiilor eşantionului este
suficient de mare (n∙p n∙(1-p)gt10
Parametrul
n = volumul eşantionului
Suntem interesaţi de investigarea prevalenţei hepatitei B la personalul care lucrează icircn laboratoarele
clinicilor de boli infecţioase din Transilvania Se ştie din studii anterioare că prevalenţa hepatitei B icircn
populaţia generală din Transilvania este de 9 S-a luat icircn studiu un eşantion de 100 persoane şi s-a
obţinut o prevalenţă a hepatitei B de 6 Există diferenţă semnificativă icircntre frecvenţa hepatitei B la
personalul care lucrează icircn laboratoarele spitalelor de boli infecţioase din Transilvania faţă de
populaţia generală
f = 006 p = 009 n = 100
Ipoteza nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat
faţă de frecvenţa hepatitei B icircn populaţia generală
Ipoteza alternativă test bilateral Există diferenţă semnificativă icircntre frecvenţa hepatitei B la
nivelul eşantionului şi prevalenţa hepatitei B icircn populaţia generală
f = 006 p = 009 n = 100
Pragul de semnificaţie a = 005
Regiunea critică test bilateral (-yen -196 ]Egrave[196 yen)
28
Concluzia testului
Deoarece parametrul statistic calculat al testului nu aparţine regiunii critice se acceptă ipoteza
nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat faţă de
frecvenţa hepatitei B icircn populaţia generală
Testul McNemar
Evaluarea dependenţei variabilelor calitative perechi (dorim să determinăm dacă o anumită
caracteristică este sau nu asociată cu o anumită patologie)
Identificăm n pacienţi care prezintă patologia de interes (eg Cancer bronho-pulmonar) şi n
pacienţi cu aceleaşi caracteristici ca şi primul grup dar care nu o prezintă
Martor = da Martor = nu
Caz = da a b
Caz = nu c d
Testul McNemar - exemplu fumat vs cancer
Martor = da Martor = nu
Cancer = da a = 2 b = 5
Cancer = nu c = 0 d = 3
29
χ2critic(α=005) = 384
32 lt 384 rarr acceptăm ipoteza nulă
Fumatul nu este icircn relaţie cu apariţia cancerului bronho-pulmonar
Inferenţa statistică pe date cantitative
Variabile cantitative continue
Testul z şi Student (t) (o medie sau medii perechi)
Testul z şi Student (t) (testarea a două medii)
ANOVA (ge 3 medii)
Ranguri (variabile cantitative discrete sau cantitative care nu icircndeplinesc condiţia de
normalitate)
Testul sumei rangurilor Wilcoxon
Kruskal-Wallis (ge 3 eşantioane independente)
Friedman (ge 3 eşantioane dependente)
Teste de normalitate variabile cantitative continue
Shapiro-Wilk
Kolmogorov-Smirnov
Shapiro-Wilk
Chi-Square Goodness-of-Fit
Dacă datele urmează o distribuţie normală aplicăm un test parametric
Dacă datele nu urmează o distribuţie normală aplicăm un test de comparare al rangurilor
30
Testul Z de comparare a mediei unui eşantion cu media unei populaţii
Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ
extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie
s2 care se cunoaşte
Condiţii de aplicare
1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru
compararea mediei unui eşantion cu media unei populaţii)
2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal
distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă
3 Talia eşantionului este mare ( ge 30)
Ipoteze
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media
eşantionului şi media populaţiei
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
(-yen -196 ] Egrave [196 yen)
Parametrul testului
n = volumul eşantionului
= media eşantionului
s = deviaţia standard a populaţiei
Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)
Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard
cunoscută
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi
media standard
Condiţii de aplicare
Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se
realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această
condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea
31
Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai
puternic
Numărul de grade de libertate (df) df = n-1
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
Parametrul testului
n = volumul eşantionului
micro0 = media standard
= media eşantionului
s = deviaţia standard a eşantionului
Testul ANOVA compararea mediilor a mai multe eşantioane
H0 = toate mediile sunt egale
H1 = nu toate mediile sunt egale
Condiţii de aplicare
1 Datele sunt independente unele faţă de celelalte
2 Datele fiecărui grup sunt normal distribuite
3 Deviaţia standard este aceeaşi pentru toate grupurile
Id Medicament
A B C D E F
1 5 6 7 10 5 9
2 6 8 8 11 8 8
3 7 7 9 13 6 7
4 8 9 11 12 4 5
32
5 9 10 10 9 7 6
Suma 35 40 45 55 30 35
Media 7 8 9 11 6 7
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =
= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)
Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2
F = (suma pătratelor(icircntre))(suma pătratelor(icircn))
Suma pătratelor (icircntre) = 16times5 = 80
Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60
Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn
interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare
SP df Media pătratelor F = MPicircntreMPicircn
Icircntre 80 5 = 805 = 16 = 1625 = 64
Icircn 60 24 = 6024 = 25
Total 140 29 -
Testul sumei rangurilor Wilcoxon
Aplicat pentru
Un set de observaţii provenite dintr-o valoare ipotetică comună
Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)
Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero
Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace
Suma rangurilor pentru diferenţele negative = 2+3+1 = 6
Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30
33
Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului
egal cu 8 = 0109
Icircnainte După Diferenţa Rang
64 66 -2 2
66 58 8 5
67 68 -1 3
71 65 6 4
72 75 -3 1
76 67 9 6
78 59 19 8
89 74 15 7
Testul Kruskal-Wallis (ge 3 eşantioane independente)
Test de ranguri aplicate pe mai mult de 3 eşantioane
H = parametrul testului
n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)
Tk = suma rangurilor
Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie
pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni
34
df = k-1 (k = numărul de eşantioane)
df = 3-1 = 2
Hcritic(α=005) = 599
H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie
pozitivă şi respectiv biopsie negativă
Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie
a tipului de studiu pe eşantioane perechi)
1 Definirea numărului de tratamente k
2 Obţinerea rangurilor pentru fiecare tratament
3 Sumarea rangurilor fiecărui tratament
4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)
5 Dacă Fr gt Frcritic rarr respingem H0
Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost
măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi
n = 9 k = 3 T12 = 225 T2
2 = 38025 T32 = 38025
Frcritic = 599
Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de
prostată
35
De reţinut
Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei
Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-
of-Fit
Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z
Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t
Compararea mediilor a 3 sau mai multe eşantioane ANOVA
Compararea mediilor a două populaţii (σ) testul Z
Compararea mediilor a două eşantioane (s) testul t
Compararea mediilor a două eşantioane perechi (s) testul t
ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi
cu cel pentru compararea a două eşantioane perechi
Ranguri
Distribuţia datelor nu are importanţă
Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)
Trei sau mai multe eşantioane Kruskal-Wallis
Trei sau mai multe eşantioane perechi Friedman
Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia
Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a
datelor)
Variabile nominale
Un singur eşantion sau eşantioane perechi
Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte
Eşantioane perechi testul Mc Nemar
Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2
Icircn analiza proporţiilor există teste diferite pentru
Compararea unei frecvenţe cu o frecvenţă cunoscută
Compararea a două frecvenţe
Semnificaţia statistică
Valoarea p (p value)
Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor
două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E
posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării
aleatorii
36
Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală
urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii
Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este
probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un
experiment de dimensiunea acestuia
Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că
diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii
diferite
Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca
fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă
ar fi fost adevărată
Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă
1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe
baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De
fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001
2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie
3 Se aplică testul statistic aferent pentru a calcula valoarea p
4 Se compară valoarea p cu valoarea ndash prag
5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe
semnificativă dpdv statisticrdquo
6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e
semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să
conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă
Teste de semnificaţie
Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului
populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)
Testarea ipotezelor implică posibile erori
Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile
sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui
grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul
icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005
ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există
37
nici o diferenţă
Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ
statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de
ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost
ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau
dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă
cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă
semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe
ipotetice variate icircn cazul icircn care ele există
Măsuri ale frecvenţei
Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)
Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate
Generic formula pe care se bazează toate cele trei este
unde x şi y sunt cantităţile de comparat
Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea
unei frecvenţe pe grupe de sex vacircrstă etc
Proporţia implică icircn mod necesar ca x să fie inclus icircn y
Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară
frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp
Pentru calcularea unei rate trebuie ţinut cont de trei aspecte
bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin
bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp
bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo
Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un
tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei
populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei
aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)
38
Indicatori
Rata de incidenţă
Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă
icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii
Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o
perioadă de timp
Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de
timp x
Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei
susceptibili de a dezvolta icircmbolnăvirea studiată
Numitorul poate fi
bull Numărul mediu al populaţiei icircn perioada de timp studiată
bull Mărimea populaţiei icircn mijlocul perioadei de studiu
bull Mărimea populaţiei la icircnceputul studiului
Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă
Este obligatorie menţionarea perioadei de timp
Prevalenţa
Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la
un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă
schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa
momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)
39
Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include
numai cazuri noi respectiv include cazuri noi şi vechi
Rata de atac
Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este
folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp
raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori
Rata persoană-timp
Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din
momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte
migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost
observate
Riscul relativ (RR)
Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment
legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele
prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două
grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la
bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la
bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai
mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo
Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2
Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn
cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă
(Tabelul 1)
Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR
Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la
neexpuşi
40
Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de
culegere a datelor
Odds ratio (OR)
Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin
raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general
studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)
Tabelul 2 Tabelul 2 x 2 pentru calcularea OR
Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală
Rate de mortalitate
Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp
specificată Există mai multe tipuri de rate de mortalitate
o Mortalitate specifică pe sex
o Mortalitate specifică pe rasă
o Mortalitate specifică pe boală
o Mortalitate neonatală
o Mortalitate postneonatală
o Mortalitate infantilă
o Mortalitate maternă
Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP
41
Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de
viaţă şi vacircrsta la care survine decesul dacă este prematur
Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu
Ani de viaţă pierduţi datorat dizabilităţii
Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt
utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru
cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite
grupuri
Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de
risc şi o boală se folosesc riscul relativ şi odds ratio
35 Analiza şi interpretarea datelor
După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date
trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul
Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor
colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului
studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu
plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde
prezenţa biostatisticianului este necesară
Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu
elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat
iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului
iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate
depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori
testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere
clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza
Interpretarea rezultatelor statistice
Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne
motive (număr mic de date) acceptarea ei să fie falsă
Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine
gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia
ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument
de decizie Intervalul de confidenţă
42
Interpretarea statistica ne interpretarea clinică
Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă
Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice
obţinute pe eşantionul studiat
Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare
Ce interpretăm Rezultatele
personale obţinute icircn urma studiului
care au fost prezentate icircn secţiunea bdquoRezultaterdquo
Explicăm rezultatele obţinute
Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale
Interpretarea trebuie să se realizeze icircn
lumina limitelor studiului
contextul cultural social şi educaţional al locului unde s-a realizat cercetarea
contextul a ceea ce se cunoaşte din literatura de specialitate
Interpretăm doar rezultatele personale obţinute icircn urma studiului
Interpretarea statistică nu este tot una cu interpretarea clinică
Interpretarea statistică este importantă
Interpretarea clinică este foarte importantă
Intervalul de confidenţă
Media calculată pe baza unui eşantion nu va echivala media populaţiei
Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului
Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a
populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a
populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)
pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru
orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare
dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de
confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de
date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de
5
Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel
Dacă valoarea p este mică
Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare
aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o
medie diferită Diferenţa este semnificativă dpdv statistic
43
Icircn continuare
Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa
reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică
pentru a fi interesante din punct de vedere ştiinţific
Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC
oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care
este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a
obţine o concluzie clară
Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o
diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că
datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din
punct de vedere ştiinţific
Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul
detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat
Erorile studiilor medicale
Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura
anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară
caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea
asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri
legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias
Erorile potenţiale icircn studiile epidemiologice
1 Erori icircntacircmplătoare
2 Erori sistematice
3 Confuzia
4 Validitatea
1 Erori icircntacircmplătoare
Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a
parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel
de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot
fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii
(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor
de măsură (eroarea de măsurare)
44
2 Erori sistematice
Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate
care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu
acurateţe mare Acurateţea nu este afectată de mărimea eşantionului
Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de
experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea
dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus
şi greu de cuantificat (consum de alcool personalitate etc)
Principalele tipuri de erori din această categorie sunt
bull Biasul de selecţie
bull Biasul de informaţie
Biasul de selecţie
Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul
trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion
inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale
persoanelor incluse
Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se
ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia
Biasul de informaţie
Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de
instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze
expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere
nesemnificativă sau chiar să nu şi-o amintească de loc
3 Confuzia
Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune
prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este
cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă
de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte
important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor
protector
4 Validitatea
Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă
Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte
estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional
Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă
45
conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se
demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)
Validitatea externă se poate realiza numai dacă studiul este valid intern
Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii
studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de
studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt
laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi
validă din punct de vedere intern)
3 6 Prezentarea rezultatelor
După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite
Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor
icircntr-o formă bdquodigerabilărdquo este necesară
Scopul prezentării datelor
1 Transmiterea concluziilor studiului
a Datele corecte şi importante merită comunicate
b Datele trebuie să confirme sau să infirme ipoteza studiului
c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală
2 Acordarea posibilităţii altor cercetători să aprecieze studiul
a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti
b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor
prezentate
Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru
fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie
statistică
Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de
valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras
(Tabel 3)
Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)
46
Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct
numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor
precum şi prezentarea acestora sub formă inteligibilă
Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care
convin cercetătorului
Prezentarea datelor se poate face
1 Figuri şi tabele icircn articole scrise
2 Figuri şi tabele icircn prezentări orale
3 Figuri şi tabele icircn postere
4 Text scris sau incluse icircn text
5 Site-uri de WEB
Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor
Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie
Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele
exprimacircnd exact ceea ce acestea exprimă
Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate
anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel
să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se
acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca
mai sus sugestive sunt formatele simple şi puţin icircncărcate
Dacă nu există reguli impuse se respectă
1 Mesaj simplu fără falsificarea datelor
2 De obicei este necesar atacirct tabelul cacirct şi graficul
3 Să fie simplu şi clar
Tabele
Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile
coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică
elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de
1 Se folosesc doar linii orizontale
2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn
evidenţi prin linie de separare (Tabelul 4)
Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland
Noua Zeelandă)
(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)
47
3 Numerele sunt aliniate icircn funcţie de virgulă
4 Indicii statistici sunt explicaţi sub tabel
5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană
6 Abrevierile pot fi folosite
7 Numărul de zecimale trebuie limitat la maxim două
8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel
9 Plasarea legendei este obligatorie sub tabel
10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)
Icircn cazul prezentărilor orale sau a posterelor este indicat ca
1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării
2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte
3 Folosirea de simboluri este permisă
Clasificarea tabelelor
Tabelele se clasifică după
i) conţinut
bull cu distribuţii de frecvenţe
bull de clase de frecvenţe
bull de contingenţă
ii) structura
bull cu doua coloane
bull cu subclasificări
bull ldquomasterrdquo
Tabele ce conţin distribuţii de frecvenţe
O modalitate comodă de a prezenta o mulţime de date brute este
1 Se ordonează datele in ordine crescătoare
2 Se determine frecvenţa fiecărei valori
3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane
(Tabelul 5)
Tabelul 5 Distribuţii de frecvenţă absolută
48
Tabelul claselor de frecvenţe
1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă
2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)
Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)
Tabele de contingenţă
1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a
tabelelor de contingenţă
2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a
combinaţiilor de perechi ordonate de valori
3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre
a factor de risc si
b starea sănătăţii
4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)
5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)
Tabelul 7 Tabel de contingenţă 2 x 2
49
Grafice
Există două categorii de moduri grafice sub care se pot prezenta datele
1 Ilustraţii şi fotografii
2 Grafice
1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă
pentru lucrare
2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit
Putem vorbi despre mai multe tipuri de grafice
bull Grafice pentru reprezentarea datelor cantitative
1048707 Grafic cartezian (X Y)
1048707 Histograma
1048707 Poligonul de frecvenţe
1048707 Diagrama bdquoscatterrdquo
bull Grafice pentru reprezentarea datelor calitative
1048707 Grafic cu bare
1048707 Diagrama tip bdquoboxplotrdquo
1048707 Diagrama bdquopierdquo
1048707 Cartograma
Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi
dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)
Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)
Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie
Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)
Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)
50
Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir
de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele
două variabile studiate (Figura 6)
Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2
(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2
rămacircne aproximativ constantă)
Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea
comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea
comparativă a mai multor variabile
Figura 7 Grafic calitativ cu bare
51
Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo
Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două
posibilităţi reprezentate grafic este mai frecventă (Figura 8)
Figura 8 Reprezentare tip bdquopierdquo
Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli
sau a oricărui element comparativ Se foloseşte de epidemiologi
Rezultate
Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare
Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o
manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu
explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția
bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la
ilustraţii tabele grafice
Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi
nici rezultatele care invalidează eventual ipoteza
Discuţii
Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd
cultura ştiinţifică şi inteligenţa autorilor
Acest capitol răspunde la trei obiective
Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia
calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de
selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează
rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv
52
este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn
care a fost abordată problema fără a face o revistă a literaturii
Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea
rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul
Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor
afirmaţii nesusţinute de conţinutul lucrării
Concluzii
Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate
să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie
Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de
concluzii va scădea valoarea lucrării
Bibliografia (lista referinţelor citarea icircn text)
Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn
lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente
Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli
- să conţină cele mai importante şi recente lucrări
- să includă numai lucrări publicate
- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate
Bibliografie
Elisabeta Jaba ndash Statistică Ed Economică 1998
Mihai Ţarcă ndash Statistică volI Ed UAIC 1979
Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale
Ed University Press 2009
Sorana Daniela Bolboacă ndash Metodologia cercetării curs
53
studiului este important ca numărul ales să fie mai mare pentru a putea suplinii eventualele pierderi din
urmărire Practic rezultatele sunt introduse icircn tabelul 2 x 2 de unde se pot calcula indicatorii doriţi (Figura 2)
Avacircnd icircn vedere modul de culegere a datelor este permisă calcularea de indicatori numai pe orizontală
orice comparare icircntre coloana dreaptă şi stacircngă fiind incorectă Avantajul acestui tip de culegere a datelor ar fi
eventualul număr mai redus de subiecţi dar dezavantajul major este cel al costurilor de urmărire icircn timp dar
trebuie luată icircn calcul şi pierderea de subiecţi din evidenţe Factorul controlat este deci prezenţa expunerii iar
factorul aleator este prezenţa bolii
Figura 2 Tabelul de contingenţă pentru tipul de culegere expus ndash neexpus
4 Culegerea de tip caz ndash martor Icircn acest caz ceea ce ghidează colectarea datelor este prezenţa sau absenţa
bolii icircn momentul prezent Se vor culege date de la două loturi constituite după criteriul de bolnav B+ şi de fără
boală B+ Datele culese sunt icircn trecut deci caracterul datelor va fi retrospectiv Icircn acest caz factorul controlat
este boala factorul aleator fiind expunerea (Figura 3)
Calculul de indicatori icircn acest caz se va putea efectua numai icircntre coloane orice calcul icircntre valorile de pe linii
fiind greşit Rezultate semnificative se pot obţine icircn acest caz utilizacircnd loturi mai mici de studiu prin
comparaţie cu tipul eşantion reprezentativ permiţacircnd icircn acelaşi timp studiul bolilor rare (cu prevalenţă mică)
Figura 3 Tabelul de contingenţă pentru tipul de culegere caz ndash martor
Metode de culegere a datelor
Metoda aleasă pentru culegerea datelor trebuie să fie aleasă după un atent studiu bibliografic icircn vederea
stabilirii celui mai eficient mod de a răspunde temei de studiu
Metodele de culegere trebuie să fie bine aplicabile şi consistente ca aport informaţional necesar
13
1 Fiziologice Sunt colectate date despre anumite caracteristici fiziologice ale pacienţilor (TA glicemie
colesterol etc) Această metodă aduce rezultate obiective cacirct timp instrumentul de evaluare este bine calibrat
şi prezintă variaţii mici
2 Metode observaţionale Instrumentul de culegere a datelor trebuie să fie sincronizat cu protocolul conceput
de cercetător Datele culese trebuie să fie de asemenea consistente adică să fie colectate de aceeaşi manieră
conducătorul studiului trebuind să instruiască investigatorii (colectorii de date) Icircnregistrarea datelor trebuie să
fie de asemenea sistematică şi bine standardizată Observaţii de control trebuie icircn mod obligatoriu făcute
pentru a putea aprecia icircn mod corect orice deviere datorată unor factorii externi Este obligatorie luarea icircn
consideraţie a aspectelor etice
3 Interviul Poate fi structurat cu un set specific de icircntrebări sau nestructurat cu o temă generală cu care se
icircncepe interviul Interviurile pot fi icircnregistrate sau intervievatorul poate nota pur şi simplu răspunsurile Există
două tipuri generice de interviu interviul de profunzime care se referă la o discuţie icircn general structurată cu
un număr de icircntrebări prestabilite icircn icircncăperea de studiu fiind doară intervievatorul şi persoana chestionată şi
interviul de grup unde prin conversaţii pornind de la temă generală expusă şi condusă de intervievator se
obţin date despre subiecţii participanţi la studiu Ambele metode de interviu au indicaţiile lor precise Un
interviu pe teme intime nu va putea fi corect icircn ceea ce priveşte datele colectate dacă se aplică un interviu de
grup
4 Chestionarul Document scris adresat unor persoane pentru a răspunde la una sau mai multe icircntrebări
Trebuie să aducă răspunsurile la icircntrebările care motivează studiul constituind ansamblul icircntrebărilor destinate
culegerii de informaţii (date) Redactarea chestionarului trebuie să ţină cont de structura acestuia introducere
conţinut exprimarea icircntrebărilor grafica chestionarului
5 Icircnregistrări preexistente
Icircn cercetarea medicală sunt cel mai frecvent utilizate Informaţiile dorite sunt deja existente ceea ce icirci revine
cercetătorului este ca să structureze datele icircn funcţie de scopul studiului pe care icircn conduce Aceste surse sunt
bull Foi de observaţie
bull Registre de consultaţie
bull Buletine de analize
bull Registre de operaţii
Icircn cazul icircn care nici o metodă de culegere a datelor nu este pe placul celui ce conduce studiul există
posibilitatea de a construi un instrument nou de culegere a datelor
Acest proces trebuie să urmărească nişte paşi obligatorii fiind mare consumator de timp
bull Definirea structurii cu care se va face măsurarea
bull Formularea itemilor de măsură
bull Analiza validităţii instrumentului de măsură ndash măsoară acesta fenomenul corect
bull Elaborarea de instrucţiuni de utilizare pentru investigatori
14
bull Pretestarea instrumentului
bull Aprecierea validităţii interne şi externe a datelor culese
Instrumente de cercetare
Formularea clară a temei de cercetare necesită o foarte bună definire a factorilor studiaţi şi a criteriilor de
judecată Acestea din urmă sunt ultimele care vor trebui definite icircn cadrul protocolului de studiu
Alegerea unui instrument de măsură
Nu există un instrument de măsură perfect sau universal corect Alegerea sa dintre cele existente şi cele deja
utilizate depind de trei factori
bull Obiectivul studiului
bull Boala studiată
bull Populaţia icircn studiu
De aceste trei elemente trebuie ţinut cont icircn fiecare etapă a dezvoltării instrumentului
Definirea obiectivului
Studiu transversal Dacă se doreşte studierea unui simptom sau a unei caracteristici ale populaţiei se poate
icircmpărţi populaţia de studiu icircn mai multe grupuri Este practic vorba de a determina diferenţele dintre subiecţi
icircn cea ce priveşte o variabilă necesară studiată printr-un studiu transversal (utilizarea dozării de Ac HBS
pentru a evalua progresele bolnavilor de hepatită tip B)
Studiu longitudinal Icircn acest caz nu se poate icircmpărţii populaţia de studiu icircn mai multe grupuri datele obţinute
fiind de la acelaşi subiect colectate după un interval de timp
Icircn funcţie de boală şi populaţie se aleg şi instrumentele de măsură cele mai adecvate
Instrumentele cercetării reprezintă un mecanism specific sau o strategie pe care cercetătorul o utilizează pentru
colectarea prelucrarea şi inferenţa datelor Aceste instrumente sunt
1 Studiul icircn bibliotecă
2 Computerul
3 Determinările experimentale
4 Statistica
5 Mintea umană
6 Facilităţi de limbaj şi comunicare
Determinările experimentale
Măsurarea constă icircn aprecierea şi cuantificarea fenomenelor calitativ sau cantitativ Interpretarea
datelor se referă la transformarea lor icircn unităţi de descoperire a unor fenomene mai puţin cercetate
Standardele acceptate se referă la norme medii distribuţii etc Tot icircn cadrul interpretării datelor datele
obţinute sunt caracterizate pe scale de valori nominal ordinal de interval sau de raport
Validarea şi reproductibilitatea măsurătorilor sunt aspecte importante şi foarte necesare pentru o
cercetare corect fundamentată care doreşte obţinerea unor concluzii pertinente
15
Statistica Este implicată icircn condensarea şi procesarea unui volum mai mare de date astfel icircncacirct să se poată
interpreta corect valorile obţinute şi să se permită comparările Utilizarea unor teste statistice specifice permite
determinarea semnificaţiei (diferenţei) statistice astfel icircncacirct estimatorii să poată fi aplicaţi la populaţia
generală Furnizează informaţii şi privind corelarea sau relaţionarea icircntre date
Mintea umană este cea care reuşeşte să integreze şi să icircnţeleagă rezultatele obţinute Semnificaţia ştiinţifică
este stabilită icircn funcţie de rezultatele statisticii de mintea umană conform afirmaţiei bdquosemnificaţia ştiinţifică
nu este egală cu semnificaţia statisticărdquo Metodele aplicate pentru a putea ajunge la o concluzie pertinentă sunt
logica deductivă raţionamentul inductiv şi gacircndirea critică
Limbaj şi comunicare Exprimarea orală sau icircn scris permite nuanţarea unor aspecte seci cifrice ale unor
studii Icircn acest mod devine mai evidentă semnificaţia ştiinţifică a unor rezultate statistice
34 Prelucrarea datelor
Instrumentele de prelucrare
Statistica este o ştiinţă ramură a matematicii care studiază evoluţia fenomenelor şi proceselor
colective pe baza observării lor ştiinţifice a culegerii şi prelucrării detaliate a informaţiilor statistice cu scopul
de a formula şi explica legile legităţile şi regularităţile ce le guvernează
Statistica permite deci aprecierea unor parametrii populaţionali prin studiul unui număr redus de
elemente ale populaţiei icircn studiu (ţintă) O populaţie poate fi definită printr-un şir de valori care pot fi grupate
icircn funcţie de parametrul studiat (glicemie colesterol TAD TAS etc) Pentru fiecare astfel de şir se defineşte
o variabilă (care va purta nume propriu glicemie colesterol etc) Practic variabila este considerată o funcţie
ia valori posibil diferite de la un element la altul icircn funcţie de caracteristicile proprii acestora Sunt clasificate
icircn două grupe variabile cantitative (caracteristică măsurabilă) şi calitative (caracteristică ce nu poate fi
măsurată)
La racircndul lor variabilele calitative pot fi
bull Nominale ndash grupuri de elemente ce nu pot fi ordonate (culoarea părului)
bull Nominale ordonate ndash concluziile pot fi grupate (eficienţa unui tratament slabă bună foarte bună)
bull Binare ndash apar numai două posibilităţi (bolnav sănătos)
Variabilele cantitative pot fi
bull Continue ndash o variabilă măsurabilă care poate lua o infinitate de valori
bull Discrete ndash variabile care nu pot lua decacirct valori icircntregi
Statistica descriptivă
Există două ramuri ale statisticii statistica descriptivă şi statistica inferenţială
Statistica descriptivă (după cum rezultă din denumire) se ocupă cu descrierea unor valori obţinute ale unei
variabile studiate
16
Valorile pe care variabila le ia se constituie icircntr-o serie statistică Indicatorii care definesc o variabilă (serie)
sunt
1 Ale tendinţei centrale
Media aritmetică - notată de regulă cu
Mediana - este acea valoare din şirul de date care icircmparte icircn două părţi egale şirul ordonat de valori (atenţie
şirul este ordonat crescător) situacircndu-se la mijlocul seriei statistice
Dacă numărul de valori n este un număr impar atunci mediana este valoarea unde
Dacă n este par deci avem un număr par de valori mediana este definitatilde ca fiind
unde k = n2
Modul - constituie valoarea care apare cel mai des deci valoarea cu numărul cel mai mare de apariţii
2 De dispersie
Amplitudinea - este diferenţa dintre valoarea maximă şi cea minimă
A = Amax - Amin
Amplitudinea relativă - notată A este raportul dintre amplitudinea absolută şi media aritmetică a seriei de
date
Varianţa notată este un indicator de icircmprăştiere a datelor Formula de calcul este
Abaterea standard (S) sau deviaţia standard reprezintă rădăcina pătrată din varianţă (dispersie)
Coeficientul de variaţie se calculează ca un raport procentual icircntre abaterea standard şi valoarea medie a şirului
de valori
Eroarea standard intervine icircn estimarea intervalelor de confidenţă Se calculează astfel
17
3 De asimetrie (skewness) indică distribuţia datelor dacă sunt sau nu distribuite normal
4 De boltire (kurtosis) estimează boltirea sau aplatizarea curbei de distribuţie
Prezentarea descriptivă a datelor se face prin icircnregistrarea datelor culese icircn tabele care să reprezinte icircn mod
sintetic valorile măsurate
Icircn concluzie statistica descriptivă permite
bull Stabilirea comparabilităţii icircntre grupurile de studiu şi aprecierea prezenţei erorilor sau confuziei
bull Reprezentarea datelor icircn tabele permite evaluarea fiecărui pacient şi dacă a existat pierderi din studiu
Statistica inferenţială
Statistica inferenţială (inductivă) este partea de analiză a datelor care permite extrapolarea unei
concluzii trase pe baza unui eşantion spre populaţia ţintă pentru care a fost efectuat studiul
Scopul analizei statistice este de a evidenţia efectul unui tratament sau al unui factor de risc prin date obţinute
din eşantionul studiat spre populaţia ţintă Aceasta implică testarea ipotezelor statistice sau altfel spus testarea
semnificaţiei statistice Este una dintre cele mai importante momente ale studiului Cum rezultatele sunt
obţinute prin studiul unui eşantion există posibilitatea ca acestea să fie datorate icircntacircmplării Testele
statistice ne ajută să apreciem icircn ce măsură rezultatele sunt icircntacircmplătoare şi mai ales icircn ce măsură şi dacă se
pot aplica populaţiei generale Icircn acest scop se impune o valoare limită alfa 005 care reprezintă limita
superioară a probabilităţii ca rezultatul obţinut să fie greşit (datorat icircntacircmplării) Astfel icircn funcţie de tipul
variabilelor şi indicatorii descriptivi aplicaţi şi evaluaţi se aplică teste de semnificaţie statistică (Tabelul 1)
Tabelul 1 Alegerea testelor de semnificaţie statistică
Tipul datelor
18
Diferenţierea variabilelor din punctul de vedere a distribuţiei se face folosind testul de normalitate
Kolmogorov ndash Smirnov
Testul statistic reprezintă metoda de comparaţie a două sau mai multe populaţii prin intermediul unor
variabile observate ale lor
Scopul unui test statistic este de a defini realitatea
Definirea icircntrebării de cercetare (ipoteza clinică)
Tratamentul cu Nebivolol este la fel de eficient ca şi cel cu Valsartan icircn tratamentul
hipertensiunii arteriale
Transpunerea icircntrebării de cercetare icircn termeni statistici (ipoteza statistică)
Media tensiunii arteriale a pacienţilor trataţi cu Valsartan nu diferă semnificativ de media
tensiunii arteriale a pacienţilor trataţi cu Nebivolol
Etapele unui test statistic
1 Formularea problemei icircn termenii ipotezelor statistice
2 Alegerea şi calcularea parametrului statistic al testului
3 Regiunea critică
4 Concluzia testului
1 Formularea problemei icircn termenii ipotezelor statistice
Ipoteza nulă ipoteza care trebuie testată testul efectuacircndu-se sub prezumţia că ipoteza nulă ar
fi adevărată
Ipoteza alternativă acea ipoteză care icircntr-un sens sau altul contrazice ipoteza nulă Această
ipoteză se mai numeşte şi ipoteza de lucru
Ipoteza nulă tipuri
O coadă (ldquoone-tailedrdquo sau ldquoone-siderdquo)
Media este mai mare
Media este mai mică
Două cozi (ldquoone-tailedrdquo sau ldquoone-siderdquo)
Media este egală
2 Alegerea şi calcularea parametrului statistic al testului
Parametrul statistic al testului exprimă icircntr-o anumită formă diferenţa dintre elementele comparate
Ţinacircnd seama de faptul că eşantionul sau eşantioanele utilizate sunt aleator extrase din populaţiile care
fac obiectul testului parametrul statistic este o variabilă aleatoare de selecţie care urmează o anumită
lege de probabilitate
Un parametru statistic al testului bun trebuie să icircndeplinească două condiţii
19
Trebuie să se comporte diferit atunci cacircnd ipoteza nulă H0 este adevărată faţă de situaţia icircn
care ipoteza alternativă H1 este adevărată
Distribuţia de probabilitate a parametrului statistic al testului sub prezumţia că H0 este
adevărată este cunoscută
3 Regiunea critică
- Trebuie să fim capabili să decidem icircn funcţie de valoarea parametrului statistic calculat care dintre
ipoteze cea nulă sau cea alternativă este adevărată
- Dacă valoarea parametrului statistic aparţine regiunii critice ipoteza nulă H0 va fi respinsă şi va fi
acceptată ipoteza alternativă H1
- Dacă valoarea parametrului statistic nu aparţine regiunii critice ipoteza nulă H0 va fi acceptată
- Decidem mărimea regiunii critice
Pentru aceasta trebuie să specificăm mărimea riscului de eroare pe care icircl acceptăm
Pe scurt definim nivelul de semnificaţie notat cu a sau mărimea riscului pe care
suntem dispuşi să ni-l asumăm icircn respingerea ipotezei nule H0 icircn cazul icircn care aceasta
este adevărată De obicei se alege un nivel de semnificaţie icircntre 1 şi 5
Probabilitatea unei erori de tipul I
probabilitatea de respingere a ipotezei nule H0 icircn favoarea ipotezei alternative H1 icircn
condiţiile icircn care H0 este adevărată
probabilitatea unei erori de tipul I se notează cu a şi se mai numeşte nivel de
semnificaţie al testului
Probabilitatea unei erori de tipul II
probabilitatea acceptării ipotezei nule icircn condiţiile icircn care ipoteza alternativă H1 este
adevărată
această probabilitate se notează cu b
- Unilaterală la dreapta ndash valoarea parametrului statistic al testului este mai mare sau egală cu
valoarea din dreapta a intervalului critic
- Unilaterală la stacircnga ndash valoarea parametrului statistic al testului este mai mică sau egală cu
valoarea din stacircnga a intervalului critic
- Bilaterală ndash valoarea parametrului statistic al testului este mai mică sau egală cu valoarea extremă
din stacircnga regiunii critice sau mai mare sau egală cu valoarea extremă din dreapta regiunii critice
valorile extreme ale regiunii critice avacircnd nivele egale de semnificaţie
4 Concluzia testului
- Ipoteza nulă H0 este respinsă dacă valoarea parametrului statistic aparţine regiunii critice
20
- Regiunea critică trebuie astfel aleasă icircncacirct dacă ipoteza alternativă H1 este adevărată
probabilitatea de respingere a ipotezei nule H0 este mai mare decacirct icircn cazul icircn care ipoteza nulă H0
ar fi adevărată
- Acceptarea ipotezei nule H0 atunci cacircnd ipoteza alternativă H1 este adevărată este cunoscută ca şi
eroarea de tipul II
a probabilitatea ei se notează cu b
b măsoară bdquonivelul de eroarerdquo
- Icircn testarea oricărei ipoteze statistice există patru situaţii care determină dacă decizia noastră este
corectă sau nu
Cazuri
H0 este adevărată H0 este falsă
Concluzie H0 se acceptă decizie corectă eroare de tipul
II
H0 se
respinge
eroare de tipul I decizie corectă
Luarea deciziei pe baza valorii probabilităţii p de semnificaţie a testului
Icircn momentul icircn care prelucrăm statistic o serie de date dorim să ştim dacă rezultatele obţinute sunt sau
nu semnificative statistic
Răspunsul la această icircntrebare este dat de valoarea lui p calculată de orice program statistic la
prelucrarea unor date
Icircn cazul testelor statistice ipoteza nulă este respinsă dacă nivelul de semnificaţie este mai mic decacirct
005 iar programele de prelucrare statistică a datelor vor afişa o steluţă () icircn tabelul rezultatelor
21
Dacă p le 005 respingem ipoteza nulă şi acceptăm ipoteza alternativă (am obţinut semnificaţia
statistică)
Dacă p gt 005 acceptăm ipoteza nulă (nu am obţinut semnificaţia statistică)
p = 013
NU respingem ipoteza nulă
Risc de eroare de tip II
α = 005
p = 002
Respingem ipoteza nulă
Risc de eroare de tip I
Semnificaţia lui p
Criteriu de luare a deciziei cu privire la o ipoteză statistică nulă
Cuantifică şansa ca o decizie de respingere a ipotezei nule să fie greşită
Măsură a semnificaţiei statistice şi NU CLINICĂ
22
Semnificaţia lui p (reguli empirice)
001 le p lt 005 rezultatul e semnificativ statistic
0001 le p lt 001 rezultatul e icircnalt semnificativ statistic
p lt 0001 rezultatul e foarte icircnalt semnificativ statistic
p ge 005 rezultatul e considerat nesemnificativ statistic
Limite ale valorii p
Valoarea p NU ne dă informaţii despre
Şansa de beneficiu a unui pacient individual
Procentul de pacienţi care vor avea un beneficiu icircn urma instituirii procedurii medicale
Gradul de beneficiu expectat pentru un anumit pacient
Puterea unui test statistic
Este capacitatea de a detecta o diferenţă acolo unde există
Creşterea volumului eşantionului determină creşterea puterii testului statistic aplicat
Valoarea este icircn relaţie directă cu eroarea de tip II
Puterea = 1 ndash β
Cea mai utilizată modalitate de creştere a puterii unui test statistic este de a creşte volumul
eşantionului
Tipul scalei de măsură ndash testul statistic
Denumire test Interval Nominal Observaţii
Corelaţie Pearson 2 0 Există o relaţie liniară
χ2 0 2
Student 1 1 Doar 2 grupuri
ANOVA 1 1 2 sau mai multe grupuri
Student perechi 1 1 Eşantioane perechi
Măsurători repetate (ANOVA) 1 1 Mai mult de 2 grupuri date
perechi
Inferenţa statistică pe date calitativ e
Tabela de contingenţă 2times2
Riscuri şi raţii
Testul χ2 (testarea asocierii icircn tabela de contingenţă)
Testul Fisher
23
Testul z pentru proporţii
Testul McNemar
Tabela de contingenţă 2times2
Scale de tip nominal (dicotomiale tabela de contingenţă de 2times2) sau ordinal (tabela de contingenţă de
rtimesc)
Frecvenţa absolută (numărul de evenimente per categorie)
Tabela de contingenţă de 2times2 4 categorii
AP = adevărat pozitiv
FP = fals pozitiv
FN = fals negativ
AN = adevărat negativ
Ulcer deschis Ulcer vindecat Total
Recurenţă + AP = 1 FP = 5 = 1+5 = 6
Recurenţă - FN = 7 AN = 16 = 7+16 = 23
Total =1+7=8 =5+16=21 29
Riscuri şi raţii Mărimi ale asocierii
Denumire Formula Definiţie
Rata falşilor pozitivi =FP(FP+AN) Probabilitatea unui test fals + (α)
Rata falşilor negativi =FN(FN+AP) Probabilitatea unui test fals ndash (β)
Sensibilitate =AP(AP+FN) Probabilitatea unui test real + (1- β)
Specificitate =AN(AN+FP) Probabilitatea unui test real ndash (1- α)
Acurateţe =(AP+AN)n Probabilitatea generală a unei decizii corecte
Valoarea predictivă pozitivă =AP(AP+FP) Probabilitatea ca un test pozitiv să fie corect
Valoarea predictivă negativă =AN(AN+FN) Probabilitatea ca un test negativ să fie corect
Riscul relativ =AP(FP+AN)FN(AP+FP)
Rata şansei =(AP∙AN)(FN∙FP)
Riscul atribuabil =AP(AP+FP)-FN(FN+AN)
24
Denumire Formula
Rata falşilor pozitivi = 5(5+1) = 08334
Rata falşilor negativi = 7(7+16) = 03043
Sensibilitate = 1(1+7) = 01250
Specificitate = 16(16+5) = 07619
Acurateţe = (1+16)29 = 05862
Valoarea predictivă pozitivă = 1(1+5) = 01667
Valoarea predictivă negativă = 16(16+7) = 06957
Riscul relativ = 1(5+16)7(1+5) = 2142 = 050
Rata şansei = (1∙16)(7∙5) = 04571
Riscul atribuabil = 1(1+5)-7(7+16) = 01667-03043=-01376
Testarea asocierii icircn tabela de contingenţă
Testul χ2
Nu trebuie utilizat pentru eşantioane de volum mic
Testul este valid doar dacă valoarea expectată (aşteptată) pentru fiecare celulă este cel puţin
egală cu 1 şi frecvenţa absolută observată este de minim 5
Dacă aceste condiţii nu sunt icircndeplinite se aplică testul exact al lui Fisher (Fisherrsquos Exact Test)
Indică dacă cele două variabile sunt sau nu independente DAR NU cuantifică puterea asocierii
dintre ele
Problema S-a investigat icircntr-un studiu asocierea dintre obezitatea (ca factor de risc) şi bolile
cardio-vasculare la persoanele icircn etate (gt 60 ani) Din totalul de 620 persoane investigate s-au
identificat 150 persoane cu obezitate şi boală cardio-vasculară 230 persoane fără obezitate şi
fără boală cardio-vasculară şi 60 persoane fără obezitate dar cu boală cardio-vasculară Există
o asociere icircntre obezitate şi boala cardio-vasculară (df=1 α=005 χ2critic = 384)
Testul χ2 exemplu
H025
Nu există asociere icircntre obezitate şi bolile cardio-vasculare
Obezitatea şi bolile cardio-vasculare sunt independente
H1
Există asociere icircntre obezitate şi bolile cardio-vasculare
Obezitatea şi bolile cardio-vasculare sunt asociate
a = 005 pragul de semnificaţie al testului
urmează o lege cu (r-1)(c-1) grade de libertate
χ2 = parametrul testului χ2
fio = frecvenţa observată
fit = frecvenţa teoretică
Regiunea critică este [χα2 yen)
Pentru α = 005 χα2 = 384
OBSERVAT BCV+ BCV- Total
Obezitate + AP = 150 FP = 180 330
Obezitate - FN = 60 AN = 230 290
Total 210 410 620
TEORETIC BCV+ BCV- Total
Obezitate + = 330times210620 = 330times410620 330
Obezitate - = 290times210620 = 290times410620 290
Total 210 410 620
TEORETIC BCV+ BCV- Total
Obezitate + = 330times210620 = 330times410620 330
26
Obezitate - = 290times210620 = 290times410620 290
Total 210 410 620
TEORETIC BCV+ BCV-
Obezitate + = 112 = 218
Obezitate - = 98 = 192
Deoarece 4177Icirc[384 yen) se respinge H0 cu un risc de eroare de 5
Există asociere icircntre obezitate şi bolile cardio-vasculare
Testul Fisher
Corecţie a testului χ2
Valoarea p asociată parametrului ne dă probabilitatea ca valoarea observată de independenţă să fie
atribuită doar şansei
O valoare p mică indică că există alte cauze decacirct şansa influenţează rezultatul şi astfel cele două
variabile investigate nu sunt independente
Testul Fisher = dispersia corectată a factorului x dispersia corectată a factorilor reziduali
Icircn acest context regula adunării dispersiilor se poate scrie unde
este variaţia lui y pe seama variaţiei variabilei x
este variaţia lui y pe seama influenţei factorilor reziduali (neicircnregistraţi)
este variaţia totală a caracteristicii y
Testul Fisher empiric se calculează după formula
27
se compară cu Ftab pentru nx şi nz grade de libertate la un anumit prag de semnificaţie stabilit
Dacă Fc gt Ftab rezultă că variaţia factorului de grupare x este semnificativă pentru variaţia caracteristicii y
Testul z pentru proporţii
1 Compararea unei frecvenţe observate cu o frecvenţă teoretică
2 Testarea egalităţii a două frecvenţe
Testul z Compararea unei frecvenţe observate cu o frecvenţă teoretică
Scop Investigarea semnificaţiei diferenţei icircntre o frecvenţă teoretică p (icircntr-o populaţie) şi o frecvenţă
observată f pe un eşantion reprezentativ (variabilă calitativă (binare))
Condiţii de aplicare Testul este corect aplicat dacă numărul n al observaţiilor eşantionului este
suficient de mare (n∙p n∙(1-p)gt10
Parametrul
n = volumul eşantionului
Suntem interesaţi de investigarea prevalenţei hepatitei B la personalul care lucrează icircn laboratoarele
clinicilor de boli infecţioase din Transilvania Se ştie din studii anterioare că prevalenţa hepatitei B icircn
populaţia generală din Transilvania este de 9 S-a luat icircn studiu un eşantion de 100 persoane şi s-a
obţinut o prevalenţă a hepatitei B de 6 Există diferenţă semnificativă icircntre frecvenţa hepatitei B la
personalul care lucrează icircn laboratoarele spitalelor de boli infecţioase din Transilvania faţă de
populaţia generală
f = 006 p = 009 n = 100
Ipoteza nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat
faţă de frecvenţa hepatitei B icircn populaţia generală
Ipoteza alternativă test bilateral Există diferenţă semnificativă icircntre frecvenţa hepatitei B la
nivelul eşantionului şi prevalenţa hepatitei B icircn populaţia generală
f = 006 p = 009 n = 100
Pragul de semnificaţie a = 005
Regiunea critică test bilateral (-yen -196 ]Egrave[196 yen)
28
Concluzia testului
Deoarece parametrul statistic calculat al testului nu aparţine regiunii critice se acceptă ipoteza
nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat faţă de
frecvenţa hepatitei B icircn populaţia generală
Testul McNemar
Evaluarea dependenţei variabilelor calitative perechi (dorim să determinăm dacă o anumită
caracteristică este sau nu asociată cu o anumită patologie)
Identificăm n pacienţi care prezintă patologia de interes (eg Cancer bronho-pulmonar) şi n
pacienţi cu aceleaşi caracteristici ca şi primul grup dar care nu o prezintă
Martor = da Martor = nu
Caz = da a b
Caz = nu c d
Testul McNemar - exemplu fumat vs cancer
Martor = da Martor = nu
Cancer = da a = 2 b = 5
Cancer = nu c = 0 d = 3
29
χ2critic(α=005) = 384
32 lt 384 rarr acceptăm ipoteza nulă
Fumatul nu este icircn relaţie cu apariţia cancerului bronho-pulmonar
Inferenţa statistică pe date cantitative
Variabile cantitative continue
Testul z şi Student (t) (o medie sau medii perechi)
Testul z şi Student (t) (testarea a două medii)
ANOVA (ge 3 medii)
Ranguri (variabile cantitative discrete sau cantitative care nu icircndeplinesc condiţia de
normalitate)
Testul sumei rangurilor Wilcoxon
Kruskal-Wallis (ge 3 eşantioane independente)
Friedman (ge 3 eşantioane dependente)
Teste de normalitate variabile cantitative continue
Shapiro-Wilk
Kolmogorov-Smirnov
Shapiro-Wilk
Chi-Square Goodness-of-Fit
Dacă datele urmează o distribuţie normală aplicăm un test parametric
Dacă datele nu urmează o distribuţie normală aplicăm un test de comparare al rangurilor
30
Testul Z de comparare a mediei unui eşantion cu media unei populaţii
Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ
extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie
s2 care se cunoaşte
Condiţii de aplicare
1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru
compararea mediei unui eşantion cu media unei populaţii)
2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal
distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă
3 Talia eşantionului este mare ( ge 30)
Ipoteze
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media
eşantionului şi media populaţiei
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
(-yen -196 ] Egrave [196 yen)
Parametrul testului
n = volumul eşantionului
= media eşantionului
s = deviaţia standard a populaţiei
Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)
Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard
cunoscută
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi
media standard
Condiţii de aplicare
Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se
realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această
condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea
31
Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai
puternic
Numărul de grade de libertate (df) df = n-1
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
Parametrul testului
n = volumul eşantionului
micro0 = media standard
= media eşantionului
s = deviaţia standard a eşantionului
Testul ANOVA compararea mediilor a mai multe eşantioane
H0 = toate mediile sunt egale
H1 = nu toate mediile sunt egale
Condiţii de aplicare
1 Datele sunt independente unele faţă de celelalte
2 Datele fiecărui grup sunt normal distribuite
3 Deviaţia standard este aceeaşi pentru toate grupurile
Id Medicament
A B C D E F
1 5 6 7 10 5 9
2 6 8 8 11 8 8
3 7 7 9 13 6 7
4 8 9 11 12 4 5
32
5 9 10 10 9 7 6
Suma 35 40 45 55 30 35
Media 7 8 9 11 6 7
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =
= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)
Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2
F = (suma pătratelor(icircntre))(suma pătratelor(icircn))
Suma pătratelor (icircntre) = 16times5 = 80
Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60
Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn
interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare
SP df Media pătratelor F = MPicircntreMPicircn
Icircntre 80 5 = 805 = 16 = 1625 = 64
Icircn 60 24 = 6024 = 25
Total 140 29 -
Testul sumei rangurilor Wilcoxon
Aplicat pentru
Un set de observaţii provenite dintr-o valoare ipotetică comună
Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)
Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero
Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace
Suma rangurilor pentru diferenţele negative = 2+3+1 = 6
Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30
33
Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului
egal cu 8 = 0109
Icircnainte După Diferenţa Rang
64 66 -2 2
66 58 8 5
67 68 -1 3
71 65 6 4
72 75 -3 1
76 67 9 6
78 59 19 8
89 74 15 7
Testul Kruskal-Wallis (ge 3 eşantioane independente)
Test de ranguri aplicate pe mai mult de 3 eşantioane
H = parametrul testului
n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)
Tk = suma rangurilor
Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie
pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni
34
df = k-1 (k = numărul de eşantioane)
df = 3-1 = 2
Hcritic(α=005) = 599
H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie
pozitivă şi respectiv biopsie negativă
Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie
a tipului de studiu pe eşantioane perechi)
1 Definirea numărului de tratamente k
2 Obţinerea rangurilor pentru fiecare tratament
3 Sumarea rangurilor fiecărui tratament
4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)
5 Dacă Fr gt Frcritic rarr respingem H0
Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost
măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi
n = 9 k = 3 T12 = 225 T2
2 = 38025 T32 = 38025
Frcritic = 599
Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de
prostată
35
De reţinut
Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei
Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-
of-Fit
Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z
Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t
Compararea mediilor a 3 sau mai multe eşantioane ANOVA
Compararea mediilor a două populaţii (σ) testul Z
Compararea mediilor a două eşantioane (s) testul t
Compararea mediilor a două eşantioane perechi (s) testul t
ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi
cu cel pentru compararea a două eşantioane perechi
Ranguri
Distribuţia datelor nu are importanţă
Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)
Trei sau mai multe eşantioane Kruskal-Wallis
Trei sau mai multe eşantioane perechi Friedman
Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia
Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a
datelor)
Variabile nominale
Un singur eşantion sau eşantioane perechi
Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte
Eşantioane perechi testul Mc Nemar
Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2
Icircn analiza proporţiilor există teste diferite pentru
Compararea unei frecvenţe cu o frecvenţă cunoscută
Compararea a două frecvenţe
Semnificaţia statistică
Valoarea p (p value)
Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor
două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E
posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării
aleatorii
36
Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală
urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii
Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este
probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un
experiment de dimensiunea acestuia
Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că
diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii
diferite
Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca
fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă
ar fi fost adevărată
Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă
1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe
baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De
fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001
2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie
3 Se aplică testul statistic aferent pentru a calcula valoarea p
4 Se compară valoarea p cu valoarea ndash prag
5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe
semnificativă dpdv statisticrdquo
6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e
semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să
conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă
Teste de semnificaţie
Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului
populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)
Testarea ipotezelor implică posibile erori
Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile
sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui
grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul
icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005
ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există
37
nici o diferenţă
Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ
statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de
ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost
ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau
dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă
cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă
semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe
ipotetice variate icircn cazul icircn care ele există
Măsuri ale frecvenţei
Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)
Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate
Generic formula pe care se bazează toate cele trei este
unde x şi y sunt cantităţile de comparat
Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea
unei frecvenţe pe grupe de sex vacircrstă etc
Proporţia implică icircn mod necesar ca x să fie inclus icircn y
Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară
frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp
Pentru calcularea unei rate trebuie ţinut cont de trei aspecte
bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin
bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp
bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo
Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un
tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei
populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei
aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)
38
Indicatori
Rata de incidenţă
Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă
icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii
Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o
perioadă de timp
Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de
timp x
Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei
susceptibili de a dezvolta icircmbolnăvirea studiată
Numitorul poate fi
bull Numărul mediu al populaţiei icircn perioada de timp studiată
bull Mărimea populaţiei icircn mijlocul perioadei de studiu
bull Mărimea populaţiei la icircnceputul studiului
Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă
Este obligatorie menţionarea perioadei de timp
Prevalenţa
Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la
un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă
schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa
momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)
39
Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include
numai cazuri noi respectiv include cazuri noi şi vechi
Rata de atac
Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este
folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp
raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori
Rata persoană-timp
Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din
momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte
migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost
observate
Riscul relativ (RR)
Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment
legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele
prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două
grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la
bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la
bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai
mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo
Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2
Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn
cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă
(Tabelul 1)
Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR
Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la
neexpuşi
40
Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de
culegere a datelor
Odds ratio (OR)
Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin
raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general
studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)
Tabelul 2 Tabelul 2 x 2 pentru calcularea OR
Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală
Rate de mortalitate
Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp
specificată Există mai multe tipuri de rate de mortalitate
o Mortalitate specifică pe sex
o Mortalitate specifică pe rasă
o Mortalitate specifică pe boală
o Mortalitate neonatală
o Mortalitate postneonatală
o Mortalitate infantilă
o Mortalitate maternă
Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP
41
Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de
viaţă şi vacircrsta la care survine decesul dacă este prematur
Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu
Ani de viaţă pierduţi datorat dizabilităţii
Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt
utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru
cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite
grupuri
Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de
risc şi o boală se folosesc riscul relativ şi odds ratio
35 Analiza şi interpretarea datelor
După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date
trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul
Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor
colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului
studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu
plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde
prezenţa biostatisticianului este necesară
Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu
elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat
iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului
iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate
depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori
testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere
clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza
Interpretarea rezultatelor statistice
Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne
motive (număr mic de date) acceptarea ei să fie falsă
Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine
gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia
ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument
de decizie Intervalul de confidenţă
42
Interpretarea statistica ne interpretarea clinică
Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă
Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice
obţinute pe eşantionul studiat
Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare
Ce interpretăm Rezultatele
personale obţinute icircn urma studiului
care au fost prezentate icircn secţiunea bdquoRezultaterdquo
Explicăm rezultatele obţinute
Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale
Interpretarea trebuie să se realizeze icircn
lumina limitelor studiului
contextul cultural social şi educaţional al locului unde s-a realizat cercetarea
contextul a ceea ce se cunoaşte din literatura de specialitate
Interpretăm doar rezultatele personale obţinute icircn urma studiului
Interpretarea statistică nu este tot una cu interpretarea clinică
Interpretarea statistică este importantă
Interpretarea clinică este foarte importantă
Intervalul de confidenţă
Media calculată pe baza unui eşantion nu va echivala media populaţiei
Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului
Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a
populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a
populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)
pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru
orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare
dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de
confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de
date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de
5
Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel
Dacă valoarea p este mică
Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare
aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o
medie diferită Diferenţa este semnificativă dpdv statistic
43
Icircn continuare
Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa
reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică
pentru a fi interesante din punct de vedere ştiinţific
Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC
oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care
este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a
obţine o concluzie clară
Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o
diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că
datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din
punct de vedere ştiinţific
Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul
detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat
Erorile studiilor medicale
Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura
anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară
caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea
asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri
legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias
Erorile potenţiale icircn studiile epidemiologice
1 Erori icircntacircmplătoare
2 Erori sistematice
3 Confuzia
4 Validitatea
1 Erori icircntacircmplătoare
Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a
parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel
de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot
fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii
(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor
de măsură (eroarea de măsurare)
44
2 Erori sistematice
Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate
care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu
acurateţe mare Acurateţea nu este afectată de mărimea eşantionului
Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de
experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea
dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus
şi greu de cuantificat (consum de alcool personalitate etc)
Principalele tipuri de erori din această categorie sunt
bull Biasul de selecţie
bull Biasul de informaţie
Biasul de selecţie
Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul
trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion
inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale
persoanelor incluse
Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se
ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia
Biasul de informaţie
Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de
instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze
expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere
nesemnificativă sau chiar să nu şi-o amintească de loc
3 Confuzia
Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune
prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este
cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă
de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte
important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor
protector
4 Validitatea
Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă
Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte
estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional
Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă
45
conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se
demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)
Validitatea externă se poate realiza numai dacă studiul este valid intern
Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii
studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de
studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt
laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi
validă din punct de vedere intern)
3 6 Prezentarea rezultatelor
După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite
Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor
icircntr-o formă bdquodigerabilărdquo este necesară
Scopul prezentării datelor
1 Transmiterea concluziilor studiului
a Datele corecte şi importante merită comunicate
b Datele trebuie să confirme sau să infirme ipoteza studiului
c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală
2 Acordarea posibilităţii altor cercetători să aprecieze studiul
a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti
b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor
prezentate
Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru
fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie
statistică
Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de
valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras
(Tabel 3)
Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)
46
Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct
numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor
precum şi prezentarea acestora sub formă inteligibilă
Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care
convin cercetătorului
Prezentarea datelor se poate face
1 Figuri şi tabele icircn articole scrise
2 Figuri şi tabele icircn prezentări orale
3 Figuri şi tabele icircn postere
4 Text scris sau incluse icircn text
5 Site-uri de WEB
Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor
Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie
Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele
exprimacircnd exact ceea ce acestea exprimă
Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate
anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel
să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se
acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca
mai sus sugestive sunt formatele simple şi puţin icircncărcate
Dacă nu există reguli impuse se respectă
1 Mesaj simplu fără falsificarea datelor
2 De obicei este necesar atacirct tabelul cacirct şi graficul
3 Să fie simplu şi clar
Tabele
Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile
coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică
elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de
1 Se folosesc doar linii orizontale
2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn
evidenţi prin linie de separare (Tabelul 4)
Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland
Noua Zeelandă)
(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)
47
3 Numerele sunt aliniate icircn funcţie de virgulă
4 Indicii statistici sunt explicaţi sub tabel
5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană
6 Abrevierile pot fi folosite
7 Numărul de zecimale trebuie limitat la maxim două
8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel
9 Plasarea legendei este obligatorie sub tabel
10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)
Icircn cazul prezentărilor orale sau a posterelor este indicat ca
1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării
2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte
3 Folosirea de simboluri este permisă
Clasificarea tabelelor
Tabelele se clasifică după
i) conţinut
bull cu distribuţii de frecvenţe
bull de clase de frecvenţe
bull de contingenţă
ii) structura
bull cu doua coloane
bull cu subclasificări
bull ldquomasterrdquo
Tabele ce conţin distribuţii de frecvenţe
O modalitate comodă de a prezenta o mulţime de date brute este
1 Se ordonează datele in ordine crescătoare
2 Se determine frecvenţa fiecărei valori
3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane
(Tabelul 5)
Tabelul 5 Distribuţii de frecvenţă absolută
48
Tabelul claselor de frecvenţe
1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă
2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)
Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)
Tabele de contingenţă
1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a
tabelelor de contingenţă
2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a
combinaţiilor de perechi ordonate de valori
3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre
a factor de risc si
b starea sănătăţii
4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)
5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)
Tabelul 7 Tabel de contingenţă 2 x 2
49
Grafice
Există două categorii de moduri grafice sub care se pot prezenta datele
1 Ilustraţii şi fotografii
2 Grafice
1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă
pentru lucrare
2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit
Putem vorbi despre mai multe tipuri de grafice
bull Grafice pentru reprezentarea datelor cantitative
1048707 Grafic cartezian (X Y)
1048707 Histograma
1048707 Poligonul de frecvenţe
1048707 Diagrama bdquoscatterrdquo
bull Grafice pentru reprezentarea datelor calitative
1048707 Grafic cu bare
1048707 Diagrama tip bdquoboxplotrdquo
1048707 Diagrama bdquopierdquo
1048707 Cartograma
Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi
dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)
Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)
Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie
Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)
Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)
50
Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir
de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele
două variabile studiate (Figura 6)
Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2
(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2
rămacircne aproximativ constantă)
Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea
comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea
comparativă a mai multor variabile
Figura 7 Grafic calitativ cu bare
51
Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo
Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două
posibilităţi reprezentate grafic este mai frecventă (Figura 8)
Figura 8 Reprezentare tip bdquopierdquo
Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli
sau a oricărui element comparativ Se foloseşte de epidemiologi
Rezultate
Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare
Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o
manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu
explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția
bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la
ilustraţii tabele grafice
Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi
nici rezultatele care invalidează eventual ipoteza
Discuţii
Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd
cultura ştiinţifică şi inteligenţa autorilor
Acest capitol răspunde la trei obiective
Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia
calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de
selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează
rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv
52
este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn
care a fost abordată problema fără a face o revistă a literaturii
Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea
rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul
Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor
afirmaţii nesusţinute de conţinutul lucrării
Concluzii
Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate
să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie
Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de
concluzii va scădea valoarea lucrării
Bibliografia (lista referinţelor citarea icircn text)
Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn
lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente
Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli
- să conţină cele mai importante şi recente lucrări
- să includă numai lucrări publicate
- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate
Bibliografie
Elisabeta Jaba ndash Statistică Ed Economică 1998
Mihai Ţarcă ndash Statistică volI Ed UAIC 1979
Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale
Ed University Press 2009
Sorana Daniela Bolboacă ndash Metodologia cercetării curs
53
1 Fiziologice Sunt colectate date despre anumite caracteristici fiziologice ale pacienţilor (TA glicemie
colesterol etc) Această metodă aduce rezultate obiective cacirct timp instrumentul de evaluare este bine calibrat
şi prezintă variaţii mici
2 Metode observaţionale Instrumentul de culegere a datelor trebuie să fie sincronizat cu protocolul conceput
de cercetător Datele culese trebuie să fie de asemenea consistente adică să fie colectate de aceeaşi manieră
conducătorul studiului trebuind să instruiască investigatorii (colectorii de date) Icircnregistrarea datelor trebuie să
fie de asemenea sistematică şi bine standardizată Observaţii de control trebuie icircn mod obligatoriu făcute
pentru a putea aprecia icircn mod corect orice deviere datorată unor factorii externi Este obligatorie luarea icircn
consideraţie a aspectelor etice
3 Interviul Poate fi structurat cu un set specific de icircntrebări sau nestructurat cu o temă generală cu care se
icircncepe interviul Interviurile pot fi icircnregistrate sau intervievatorul poate nota pur şi simplu răspunsurile Există
două tipuri generice de interviu interviul de profunzime care se referă la o discuţie icircn general structurată cu
un număr de icircntrebări prestabilite icircn icircncăperea de studiu fiind doară intervievatorul şi persoana chestionată şi
interviul de grup unde prin conversaţii pornind de la temă generală expusă şi condusă de intervievator se
obţin date despre subiecţii participanţi la studiu Ambele metode de interviu au indicaţiile lor precise Un
interviu pe teme intime nu va putea fi corect icircn ceea ce priveşte datele colectate dacă se aplică un interviu de
grup
4 Chestionarul Document scris adresat unor persoane pentru a răspunde la una sau mai multe icircntrebări
Trebuie să aducă răspunsurile la icircntrebările care motivează studiul constituind ansamblul icircntrebărilor destinate
culegerii de informaţii (date) Redactarea chestionarului trebuie să ţină cont de structura acestuia introducere
conţinut exprimarea icircntrebărilor grafica chestionarului
5 Icircnregistrări preexistente
Icircn cercetarea medicală sunt cel mai frecvent utilizate Informaţiile dorite sunt deja existente ceea ce icirci revine
cercetătorului este ca să structureze datele icircn funcţie de scopul studiului pe care icircn conduce Aceste surse sunt
bull Foi de observaţie
bull Registre de consultaţie
bull Buletine de analize
bull Registre de operaţii
Icircn cazul icircn care nici o metodă de culegere a datelor nu este pe placul celui ce conduce studiul există
posibilitatea de a construi un instrument nou de culegere a datelor
Acest proces trebuie să urmărească nişte paşi obligatorii fiind mare consumator de timp
bull Definirea structurii cu care se va face măsurarea
bull Formularea itemilor de măsură
bull Analiza validităţii instrumentului de măsură ndash măsoară acesta fenomenul corect
bull Elaborarea de instrucţiuni de utilizare pentru investigatori
14
bull Pretestarea instrumentului
bull Aprecierea validităţii interne şi externe a datelor culese
Instrumente de cercetare
Formularea clară a temei de cercetare necesită o foarte bună definire a factorilor studiaţi şi a criteriilor de
judecată Acestea din urmă sunt ultimele care vor trebui definite icircn cadrul protocolului de studiu
Alegerea unui instrument de măsură
Nu există un instrument de măsură perfect sau universal corect Alegerea sa dintre cele existente şi cele deja
utilizate depind de trei factori
bull Obiectivul studiului
bull Boala studiată
bull Populaţia icircn studiu
De aceste trei elemente trebuie ţinut cont icircn fiecare etapă a dezvoltării instrumentului
Definirea obiectivului
Studiu transversal Dacă se doreşte studierea unui simptom sau a unei caracteristici ale populaţiei se poate
icircmpărţi populaţia de studiu icircn mai multe grupuri Este practic vorba de a determina diferenţele dintre subiecţi
icircn cea ce priveşte o variabilă necesară studiată printr-un studiu transversal (utilizarea dozării de Ac HBS
pentru a evalua progresele bolnavilor de hepatită tip B)
Studiu longitudinal Icircn acest caz nu se poate icircmpărţii populaţia de studiu icircn mai multe grupuri datele obţinute
fiind de la acelaşi subiect colectate după un interval de timp
Icircn funcţie de boală şi populaţie se aleg şi instrumentele de măsură cele mai adecvate
Instrumentele cercetării reprezintă un mecanism specific sau o strategie pe care cercetătorul o utilizează pentru
colectarea prelucrarea şi inferenţa datelor Aceste instrumente sunt
1 Studiul icircn bibliotecă
2 Computerul
3 Determinările experimentale
4 Statistica
5 Mintea umană
6 Facilităţi de limbaj şi comunicare
Determinările experimentale
Măsurarea constă icircn aprecierea şi cuantificarea fenomenelor calitativ sau cantitativ Interpretarea
datelor se referă la transformarea lor icircn unităţi de descoperire a unor fenomene mai puţin cercetate
Standardele acceptate se referă la norme medii distribuţii etc Tot icircn cadrul interpretării datelor datele
obţinute sunt caracterizate pe scale de valori nominal ordinal de interval sau de raport
Validarea şi reproductibilitatea măsurătorilor sunt aspecte importante şi foarte necesare pentru o
cercetare corect fundamentată care doreşte obţinerea unor concluzii pertinente
15
Statistica Este implicată icircn condensarea şi procesarea unui volum mai mare de date astfel icircncacirct să se poată
interpreta corect valorile obţinute şi să se permită comparările Utilizarea unor teste statistice specifice permite
determinarea semnificaţiei (diferenţei) statistice astfel icircncacirct estimatorii să poată fi aplicaţi la populaţia
generală Furnizează informaţii şi privind corelarea sau relaţionarea icircntre date
Mintea umană este cea care reuşeşte să integreze şi să icircnţeleagă rezultatele obţinute Semnificaţia ştiinţifică
este stabilită icircn funcţie de rezultatele statisticii de mintea umană conform afirmaţiei bdquosemnificaţia ştiinţifică
nu este egală cu semnificaţia statisticărdquo Metodele aplicate pentru a putea ajunge la o concluzie pertinentă sunt
logica deductivă raţionamentul inductiv şi gacircndirea critică
Limbaj şi comunicare Exprimarea orală sau icircn scris permite nuanţarea unor aspecte seci cifrice ale unor
studii Icircn acest mod devine mai evidentă semnificaţia ştiinţifică a unor rezultate statistice
34 Prelucrarea datelor
Instrumentele de prelucrare
Statistica este o ştiinţă ramură a matematicii care studiază evoluţia fenomenelor şi proceselor
colective pe baza observării lor ştiinţifice a culegerii şi prelucrării detaliate a informaţiilor statistice cu scopul
de a formula şi explica legile legităţile şi regularităţile ce le guvernează
Statistica permite deci aprecierea unor parametrii populaţionali prin studiul unui număr redus de
elemente ale populaţiei icircn studiu (ţintă) O populaţie poate fi definită printr-un şir de valori care pot fi grupate
icircn funcţie de parametrul studiat (glicemie colesterol TAD TAS etc) Pentru fiecare astfel de şir se defineşte
o variabilă (care va purta nume propriu glicemie colesterol etc) Practic variabila este considerată o funcţie
ia valori posibil diferite de la un element la altul icircn funcţie de caracteristicile proprii acestora Sunt clasificate
icircn două grupe variabile cantitative (caracteristică măsurabilă) şi calitative (caracteristică ce nu poate fi
măsurată)
La racircndul lor variabilele calitative pot fi
bull Nominale ndash grupuri de elemente ce nu pot fi ordonate (culoarea părului)
bull Nominale ordonate ndash concluziile pot fi grupate (eficienţa unui tratament slabă bună foarte bună)
bull Binare ndash apar numai două posibilităţi (bolnav sănătos)
Variabilele cantitative pot fi
bull Continue ndash o variabilă măsurabilă care poate lua o infinitate de valori
bull Discrete ndash variabile care nu pot lua decacirct valori icircntregi
Statistica descriptivă
Există două ramuri ale statisticii statistica descriptivă şi statistica inferenţială
Statistica descriptivă (după cum rezultă din denumire) se ocupă cu descrierea unor valori obţinute ale unei
variabile studiate
16
Valorile pe care variabila le ia se constituie icircntr-o serie statistică Indicatorii care definesc o variabilă (serie)
sunt
1 Ale tendinţei centrale
Media aritmetică - notată de regulă cu
Mediana - este acea valoare din şirul de date care icircmparte icircn două părţi egale şirul ordonat de valori (atenţie
şirul este ordonat crescător) situacircndu-se la mijlocul seriei statistice
Dacă numărul de valori n este un număr impar atunci mediana este valoarea unde
Dacă n este par deci avem un număr par de valori mediana este definitatilde ca fiind
unde k = n2
Modul - constituie valoarea care apare cel mai des deci valoarea cu numărul cel mai mare de apariţii
2 De dispersie
Amplitudinea - este diferenţa dintre valoarea maximă şi cea minimă
A = Amax - Amin
Amplitudinea relativă - notată A este raportul dintre amplitudinea absolută şi media aritmetică a seriei de
date
Varianţa notată este un indicator de icircmprăştiere a datelor Formula de calcul este
Abaterea standard (S) sau deviaţia standard reprezintă rădăcina pătrată din varianţă (dispersie)
Coeficientul de variaţie se calculează ca un raport procentual icircntre abaterea standard şi valoarea medie a şirului
de valori
Eroarea standard intervine icircn estimarea intervalelor de confidenţă Se calculează astfel
17
3 De asimetrie (skewness) indică distribuţia datelor dacă sunt sau nu distribuite normal
4 De boltire (kurtosis) estimează boltirea sau aplatizarea curbei de distribuţie
Prezentarea descriptivă a datelor se face prin icircnregistrarea datelor culese icircn tabele care să reprezinte icircn mod
sintetic valorile măsurate
Icircn concluzie statistica descriptivă permite
bull Stabilirea comparabilităţii icircntre grupurile de studiu şi aprecierea prezenţei erorilor sau confuziei
bull Reprezentarea datelor icircn tabele permite evaluarea fiecărui pacient şi dacă a existat pierderi din studiu
Statistica inferenţială
Statistica inferenţială (inductivă) este partea de analiză a datelor care permite extrapolarea unei
concluzii trase pe baza unui eşantion spre populaţia ţintă pentru care a fost efectuat studiul
Scopul analizei statistice este de a evidenţia efectul unui tratament sau al unui factor de risc prin date obţinute
din eşantionul studiat spre populaţia ţintă Aceasta implică testarea ipotezelor statistice sau altfel spus testarea
semnificaţiei statistice Este una dintre cele mai importante momente ale studiului Cum rezultatele sunt
obţinute prin studiul unui eşantion există posibilitatea ca acestea să fie datorate icircntacircmplării Testele
statistice ne ajută să apreciem icircn ce măsură rezultatele sunt icircntacircmplătoare şi mai ales icircn ce măsură şi dacă se
pot aplica populaţiei generale Icircn acest scop se impune o valoare limită alfa 005 care reprezintă limita
superioară a probabilităţii ca rezultatul obţinut să fie greşit (datorat icircntacircmplării) Astfel icircn funcţie de tipul
variabilelor şi indicatorii descriptivi aplicaţi şi evaluaţi se aplică teste de semnificaţie statistică (Tabelul 1)
Tabelul 1 Alegerea testelor de semnificaţie statistică
Tipul datelor
18
Diferenţierea variabilelor din punctul de vedere a distribuţiei se face folosind testul de normalitate
Kolmogorov ndash Smirnov
Testul statistic reprezintă metoda de comparaţie a două sau mai multe populaţii prin intermediul unor
variabile observate ale lor
Scopul unui test statistic este de a defini realitatea
Definirea icircntrebării de cercetare (ipoteza clinică)
Tratamentul cu Nebivolol este la fel de eficient ca şi cel cu Valsartan icircn tratamentul
hipertensiunii arteriale
Transpunerea icircntrebării de cercetare icircn termeni statistici (ipoteza statistică)
Media tensiunii arteriale a pacienţilor trataţi cu Valsartan nu diferă semnificativ de media
tensiunii arteriale a pacienţilor trataţi cu Nebivolol
Etapele unui test statistic
1 Formularea problemei icircn termenii ipotezelor statistice
2 Alegerea şi calcularea parametrului statistic al testului
3 Regiunea critică
4 Concluzia testului
1 Formularea problemei icircn termenii ipotezelor statistice
Ipoteza nulă ipoteza care trebuie testată testul efectuacircndu-se sub prezumţia că ipoteza nulă ar
fi adevărată
Ipoteza alternativă acea ipoteză care icircntr-un sens sau altul contrazice ipoteza nulă Această
ipoteză se mai numeşte şi ipoteza de lucru
Ipoteza nulă tipuri
O coadă (ldquoone-tailedrdquo sau ldquoone-siderdquo)
Media este mai mare
Media este mai mică
Două cozi (ldquoone-tailedrdquo sau ldquoone-siderdquo)
Media este egală
2 Alegerea şi calcularea parametrului statistic al testului
Parametrul statistic al testului exprimă icircntr-o anumită formă diferenţa dintre elementele comparate
Ţinacircnd seama de faptul că eşantionul sau eşantioanele utilizate sunt aleator extrase din populaţiile care
fac obiectul testului parametrul statistic este o variabilă aleatoare de selecţie care urmează o anumită
lege de probabilitate
Un parametru statistic al testului bun trebuie să icircndeplinească două condiţii
19
Trebuie să se comporte diferit atunci cacircnd ipoteza nulă H0 este adevărată faţă de situaţia icircn
care ipoteza alternativă H1 este adevărată
Distribuţia de probabilitate a parametrului statistic al testului sub prezumţia că H0 este
adevărată este cunoscută
3 Regiunea critică
- Trebuie să fim capabili să decidem icircn funcţie de valoarea parametrului statistic calculat care dintre
ipoteze cea nulă sau cea alternativă este adevărată
- Dacă valoarea parametrului statistic aparţine regiunii critice ipoteza nulă H0 va fi respinsă şi va fi
acceptată ipoteza alternativă H1
- Dacă valoarea parametrului statistic nu aparţine regiunii critice ipoteza nulă H0 va fi acceptată
- Decidem mărimea regiunii critice
Pentru aceasta trebuie să specificăm mărimea riscului de eroare pe care icircl acceptăm
Pe scurt definim nivelul de semnificaţie notat cu a sau mărimea riscului pe care
suntem dispuşi să ni-l asumăm icircn respingerea ipotezei nule H0 icircn cazul icircn care aceasta
este adevărată De obicei se alege un nivel de semnificaţie icircntre 1 şi 5
Probabilitatea unei erori de tipul I
probabilitatea de respingere a ipotezei nule H0 icircn favoarea ipotezei alternative H1 icircn
condiţiile icircn care H0 este adevărată
probabilitatea unei erori de tipul I se notează cu a şi se mai numeşte nivel de
semnificaţie al testului
Probabilitatea unei erori de tipul II
probabilitatea acceptării ipotezei nule icircn condiţiile icircn care ipoteza alternativă H1 este
adevărată
această probabilitate se notează cu b
- Unilaterală la dreapta ndash valoarea parametrului statistic al testului este mai mare sau egală cu
valoarea din dreapta a intervalului critic
- Unilaterală la stacircnga ndash valoarea parametrului statistic al testului este mai mică sau egală cu
valoarea din stacircnga a intervalului critic
- Bilaterală ndash valoarea parametrului statistic al testului este mai mică sau egală cu valoarea extremă
din stacircnga regiunii critice sau mai mare sau egală cu valoarea extremă din dreapta regiunii critice
valorile extreme ale regiunii critice avacircnd nivele egale de semnificaţie
4 Concluzia testului
- Ipoteza nulă H0 este respinsă dacă valoarea parametrului statistic aparţine regiunii critice
20
- Regiunea critică trebuie astfel aleasă icircncacirct dacă ipoteza alternativă H1 este adevărată
probabilitatea de respingere a ipotezei nule H0 este mai mare decacirct icircn cazul icircn care ipoteza nulă H0
ar fi adevărată
- Acceptarea ipotezei nule H0 atunci cacircnd ipoteza alternativă H1 este adevărată este cunoscută ca şi
eroarea de tipul II
a probabilitatea ei se notează cu b
b măsoară bdquonivelul de eroarerdquo
- Icircn testarea oricărei ipoteze statistice există patru situaţii care determină dacă decizia noastră este
corectă sau nu
Cazuri
H0 este adevărată H0 este falsă
Concluzie H0 se acceptă decizie corectă eroare de tipul
II
H0 se
respinge
eroare de tipul I decizie corectă
Luarea deciziei pe baza valorii probabilităţii p de semnificaţie a testului
Icircn momentul icircn care prelucrăm statistic o serie de date dorim să ştim dacă rezultatele obţinute sunt sau
nu semnificative statistic
Răspunsul la această icircntrebare este dat de valoarea lui p calculată de orice program statistic la
prelucrarea unor date
Icircn cazul testelor statistice ipoteza nulă este respinsă dacă nivelul de semnificaţie este mai mic decacirct
005 iar programele de prelucrare statistică a datelor vor afişa o steluţă () icircn tabelul rezultatelor
21
Dacă p le 005 respingem ipoteza nulă şi acceptăm ipoteza alternativă (am obţinut semnificaţia
statistică)
Dacă p gt 005 acceptăm ipoteza nulă (nu am obţinut semnificaţia statistică)
p = 013
NU respingem ipoteza nulă
Risc de eroare de tip II
α = 005
p = 002
Respingem ipoteza nulă
Risc de eroare de tip I
Semnificaţia lui p
Criteriu de luare a deciziei cu privire la o ipoteză statistică nulă
Cuantifică şansa ca o decizie de respingere a ipotezei nule să fie greşită
Măsură a semnificaţiei statistice şi NU CLINICĂ
22
Semnificaţia lui p (reguli empirice)
001 le p lt 005 rezultatul e semnificativ statistic
0001 le p lt 001 rezultatul e icircnalt semnificativ statistic
p lt 0001 rezultatul e foarte icircnalt semnificativ statistic
p ge 005 rezultatul e considerat nesemnificativ statistic
Limite ale valorii p
Valoarea p NU ne dă informaţii despre
Şansa de beneficiu a unui pacient individual
Procentul de pacienţi care vor avea un beneficiu icircn urma instituirii procedurii medicale
Gradul de beneficiu expectat pentru un anumit pacient
Puterea unui test statistic
Este capacitatea de a detecta o diferenţă acolo unde există
Creşterea volumului eşantionului determină creşterea puterii testului statistic aplicat
Valoarea este icircn relaţie directă cu eroarea de tip II
Puterea = 1 ndash β
Cea mai utilizată modalitate de creştere a puterii unui test statistic este de a creşte volumul
eşantionului
Tipul scalei de măsură ndash testul statistic
Denumire test Interval Nominal Observaţii
Corelaţie Pearson 2 0 Există o relaţie liniară
χ2 0 2
Student 1 1 Doar 2 grupuri
ANOVA 1 1 2 sau mai multe grupuri
Student perechi 1 1 Eşantioane perechi
Măsurători repetate (ANOVA) 1 1 Mai mult de 2 grupuri date
perechi
Inferenţa statistică pe date calitativ e
Tabela de contingenţă 2times2
Riscuri şi raţii
Testul χ2 (testarea asocierii icircn tabela de contingenţă)
Testul Fisher
23
Testul z pentru proporţii
Testul McNemar
Tabela de contingenţă 2times2
Scale de tip nominal (dicotomiale tabela de contingenţă de 2times2) sau ordinal (tabela de contingenţă de
rtimesc)
Frecvenţa absolută (numărul de evenimente per categorie)
Tabela de contingenţă de 2times2 4 categorii
AP = adevărat pozitiv
FP = fals pozitiv
FN = fals negativ
AN = adevărat negativ
Ulcer deschis Ulcer vindecat Total
Recurenţă + AP = 1 FP = 5 = 1+5 = 6
Recurenţă - FN = 7 AN = 16 = 7+16 = 23
Total =1+7=8 =5+16=21 29
Riscuri şi raţii Mărimi ale asocierii
Denumire Formula Definiţie
Rata falşilor pozitivi =FP(FP+AN) Probabilitatea unui test fals + (α)
Rata falşilor negativi =FN(FN+AP) Probabilitatea unui test fals ndash (β)
Sensibilitate =AP(AP+FN) Probabilitatea unui test real + (1- β)
Specificitate =AN(AN+FP) Probabilitatea unui test real ndash (1- α)
Acurateţe =(AP+AN)n Probabilitatea generală a unei decizii corecte
Valoarea predictivă pozitivă =AP(AP+FP) Probabilitatea ca un test pozitiv să fie corect
Valoarea predictivă negativă =AN(AN+FN) Probabilitatea ca un test negativ să fie corect
Riscul relativ =AP(FP+AN)FN(AP+FP)
Rata şansei =(AP∙AN)(FN∙FP)
Riscul atribuabil =AP(AP+FP)-FN(FN+AN)
24
Denumire Formula
Rata falşilor pozitivi = 5(5+1) = 08334
Rata falşilor negativi = 7(7+16) = 03043
Sensibilitate = 1(1+7) = 01250
Specificitate = 16(16+5) = 07619
Acurateţe = (1+16)29 = 05862
Valoarea predictivă pozitivă = 1(1+5) = 01667
Valoarea predictivă negativă = 16(16+7) = 06957
Riscul relativ = 1(5+16)7(1+5) = 2142 = 050
Rata şansei = (1∙16)(7∙5) = 04571
Riscul atribuabil = 1(1+5)-7(7+16) = 01667-03043=-01376
Testarea asocierii icircn tabela de contingenţă
Testul χ2
Nu trebuie utilizat pentru eşantioane de volum mic
Testul este valid doar dacă valoarea expectată (aşteptată) pentru fiecare celulă este cel puţin
egală cu 1 şi frecvenţa absolută observată este de minim 5
Dacă aceste condiţii nu sunt icircndeplinite se aplică testul exact al lui Fisher (Fisherrsquos Exact Test)
Indică dacă cele două variabile sunt sau nu independente DAR NU cuantifică puterea asocierii
dintre ele
Problema S-a investigat icircntr-un studiu asocierea dintre obezitatea (ca factor de risc) şi bolile
cardio-vasculare la persoanele icircn etate (gt 60 ani) Din totalul de 620 persoane investigate s-au
identificat 150 persoane cu obezitate şi boală cardio-vasculară 230 persoane fără obezitate şi
fără boală cardio-vasculară şi 60 persoane fără obezitate dar cu boală cardio-vasculară Există
o asociere icircntre obezitate şi boala cardio-vasculară (df=1 α=005 χ2critic = 384)
Testul χ2 exemplu
H025
Nu există asociere icircntre obezitate şi bolile cardio-vasculare
Obezitatea şi bolile cardio-vasculare sunt independente
H1
Există asociere icircntre obezitate şi bolile cardio-vasculare
Obezitatea şi bolile cardio-vasculare sunt asociate
a = 005 pragul de semnificaţie al testului
urmează o lege cu (r-1)(c-1) grade de libertate
χ2 = parametrul testului χ2
fio = frecvenţa observată
fit = frecvenţa teoretică
Regiunea critică este [χα2 yen)
Pentru α = 005 χα2 = 384
OBSERVAT BCV+ BCV- Total
Obezitate + AP = 150 FP = 180 330
Obezitate - FN = 60 AN = 230 290
Total 210 410 620
TEORETIC BCV+ BCV- Total
Obezitate + = 330times210620 = 330times410620 330
Obezitate - = 290times210620 = 290times410620 290
Total 210 410 620
TEORETIC BCV+ BCV- Total
Obezitate + = 330times210620 = 330times410620 330
26
Obezitate - = 290times210620 = 290times410620 290
Total 210 410 620
TEORETIC BCV+ BCV-
Obezitate + = 112 = 218
Obezitate - = 98 = 192
Deoarece 4177Icirc[384 yen) se respinge H0 cu un risc de eroare de 5
Există asociere icircntre obezitate şi bolile cardio-vasculare
Testul Fisher
Corecţie a testului χ2
Valoarea p asociată parametrului ne dă probabilitatea ca valoarea observată de independenţă să fie
atribuită doar şansei
O valoare p mică indică că există alte cauze decacirct şansa influenţează rezultatul şi astfel cele două
variabile investigate nu sunt independente
Testul Fisher = dispersia corectată a factorului x dispersia corectată a factorilor reziduali
Icircn acest context regula adunării dispersiilor se poate scrie unde
este variaţia lui y pe seama variaţiei variabilei x
este variaţia lui y pe seama influenţei factorilor reziduali (neicircnregistraţi)
este variaţia totală a caracteristicii y
Testul Fisher empiric se calculează după formula
27
se compară cu Ftab pentru nx şi nz grade de libertate la un anumit prag de semnificaţie stabilit
Dacă Fc gt Ftab rezultă că variaţia factorului de grupare x este semnificativă pentru variaţia caracteristicii y
Testul z pentru proporţii
1 Compararea unei frecvenţe observate cu o frecvenţă teoretică
2 Testarea egalităţii a două frecvenţe
Testul z Compararea unei frecvenţe observate cu o frecvenţă teoretică
Scop Investigarea semnificaţiei diferenţei icircntre o frecvenţă teoretică p (icircntr-o populaţie) şi o frecvenţă
observată f pe un eşantion reprezentativ (variabilă calitativă (binare))
Condiţii de aplicare Testul este corect aplicat dacă numărul n al observaţiilor eşantionului este
suficient de mare (n∙p n∙(1-p)gt10
Parametrul
n = volumul eşantionului
Suntem interesaţi de investigarea prevalenţei hepatitei B la personalul care lucrează icircn laboratoarele
clinicilor de boli infecţioase din Transilvania Se ştie din studii anterioare că prevalenţa hepatitei B icircn
populaţia generală din Transilvania este de 9 S-a luat icircn studiu un eşantion de 100 persoane şi s-a
obţinut o prevalenţă a hepatitei B de 6 Există diferenţă semnificativă icircntre frecvenţa hepatitei B la
personalul care lucrează icircn laboratoarele spitalelor de boli infecţioase din Transilvania faţă de
populaţia generală
f = 006 p = 009 n = 100
Ipoteza nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat
faţă de frecvenţa hepatitei B icircn populaţia generală
Ipoteza alternativă test bilateral Există diferenţă semnificativă icircntre frecvenţa hepatitei B la
nivelul eşantionului şi prevalenţa hepatitei B icircn populaţia generală
f = 006 p = 009 n = 100
Pragul de semnificaţie a = 005
Regiunea critică test bilateral (-yen -196 ]Egrave[196 yen)
28
Concluzia testului
Deoarece parametrul statistic calculat al testului nu aparţine regiunii critice se acceptă ipoteza
nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat faţă de
frecvenţa hepatitei B icircn populaţia generală
Testul McNemar
Evaluarea dependenţei variabilelor calitative perechi (dorim să determinăm dacă o anumită
caracteristică este sau nu asociată cu o anumită patologie)
Identificăm n pacienţi care prezintă patologia de interes (eg Cancer bronho-pulmonar) şi n
pacienţi cu aceleaşi caracteristici ca şi primul grup dar care nu o prezintă
Martor = da Martor = nu
Caz = da a b
Caz = nu c d
Testul McNemar - exemplu fumat vs cancer
Martor = da Martor = nu
Cancer = da a = 2 b = 5
Cancer = nu c = 0 d = 3
29
χ2critic(α=005) = 384
32 lt 384 rarr acceptăm ipoteza nulă
Fumatul nu este icircn relaţie cu apariţia cancerului bronho-pulmonar
Inferenţa statistică pe date cantitative
Variabile cantitative continue
Testul z şi Student (t) (o medie sau medii perechi)
Testul z şi Student (t) (testarea a două medii)
ANOVA (ge 3 medii)
Ranguri (variabile cantitative discrete sau cantitative care nu icircndeplinesc condiţia de
normalitate)
Testul sumei rangurilor Wilcoxon
Kruskal-Wallis (ge 3 eşantioane independente)
Friedman (ge 3 eşantioane dependente)
Teste de normalitate variabile cantitative continue
Shapiro-Wilk
Kolmogorov-Smirnov
Shapiro-Wilk
Chi-Square Goodness-of-Fit
Dacă datele urmează o distribuţie normală aplicăm un test parametric
Dacă datele nu urmează o distribuţie normală aplicăm un test de comparare al rangurilor
30
Testul Z de comparare a mediei unui eşantion cu media unei populaţii
Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ
extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie
s2 care se cunoaşte
Condiţii de aplicare
1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru
compararea mediei unui eşantion cu media unei populaţii)
2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal
distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă
3 Talia eşantionului este mare ( ge 30)
Ipoteze
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media
eşantionului şi media populaţiei
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
(-yen -196 ] Egrave [196 yen)
Parametrul testului
n = volumul eşantionului
= media eşantionului
s = deviaţia standard a populaţiei
Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)
Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard
cunoscută
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi
media standard
Condiţii de aplicare
Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se
realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această
condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea
31
Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai
puternic
Numărul de grade de libertate (df) df = n-1
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
Parametrul testului
n = volumul eşantionului
micro0 = media standard
= media eşantionului
s = deviaţia standard a eşantionului
Testul ANOVA compararea mediilor a mai multe eşantioane
H0 = toate mediile sunt egale
H1 = nu toate mediile sunt egale
Condiţii de aplicare
1 Datele sunt independente unele faţă de celelalte
2 Datele fiecărui grup sunt normal distribuite
3 Deviaţia standard este aceeaşi pentru toate grupurile
Id Medicament
A B C D E F
1 5 6 7 10 5 9
2 6 8 8 11 8 8
3 7 7 9 13 6 7
4 8 9 11 12 4 5
32
5 9 10 10 9 7 6
Suma 35 40 45 55 30 35
Media 7 8 9 11 6 7
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =
= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)
Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2
F = (suma pătratelor(icircntre))(suma pătratelor(icircn))
Suma pătratelor (icircntre) = 16times5 = 80
Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60
Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn
interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare
SP df Media pătratelor F = MPicircntreMPicircn
Icircntre 80 5 = 805 = 16 = 1625 = 64
Icircn 60 24 = 6024 = 25
Total 140 29 -
Testul sumei rangurilor Wilcoxon
Aplicat pentru
Un set de observaţii provenite dintr-o valoare ipotetică comună
Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)
Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero
Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace
Suma rangurilor pentru diferenţele negative = 2+3+1 = 6
Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30
33
Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului
egal cu 8 = 0109
Icircnainte După Diferenţa Rang
64 66 -2 2
66 58 8 5
67 68 -1 3
71 65 6 4
72 75 -3 1
76 67 9 6
78 59 19 8
89 74 15 7
Testul Kruskal-Wallis (ge 3 eşantioane independente)
Test de ranguri aplicate pe mai mult de 3 eşantioane
H = parametrul testului
n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)
Tk = suma rangurilor
Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie
pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni
34
df = k-1 (k = numărul de eşantioane)
df = 3-1 = 2
Hcritic(α=005) = 599
H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie
pozitivă şi respectiv biopsie negativă
Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie
a tipului de studiu pe eşantioane perechi)
1 Definirea numărului de tratamente k
2 Obţinerea rangurilor pentru fiecare tratament
3 Sumarea rangurilor fiecărui tratament
4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)
5 Dacă Fr gt Frcritic rarr respingem H0
Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost
măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi
n = 9 k = 3 T12 = 225 T2
2 = 38025 T32 = 38025
Frcritic = 599
Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de
prostată
35
De reţinut
Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei
Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-
of-Fit
Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z
Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t
Compararea mediilor a 3 sau mai multe eşantioane ANOVA
Compararea mediilor a două populaţii (σ) testul Z
Compararea mediilor a două eşantioane (s) testul t
Compararea mediilor a două eşantioane perechi (s) testul t
ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi
cu cel pentru compararea a două eşantioane perechi
Ranguri
Distribuţia datelor nu are importanţă
Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)
Trei sau mai multe eşantioane Kruskal-Wallis
Trei sau mai multe eşantioane perechi Friedman
Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia
Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a
datelor)
Variabile nominale
Un singur eşantion sau eşantioane perechi
Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte
Eşantioane perechi testul Mc Nemar
Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2
Icircn analiza proporţiilor există teste diferite pentru
Compararea unei frecvenţe cu o frecvenţă cunoscută
Compararea a două frecvenţe
Semnificaţia statistică
Valoarea p (p value)
Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor
două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E
posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării
aleatorii
36
Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală
urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii
Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este
probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un
experiment de dimensiunea acestuia
Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că
diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii
diferite
Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca
fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă
ar fi fost adevărată
Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă
1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe
baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De
fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001
2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie
3 Se aplică testul statistic aferent pentru a calcula valoarea p
4 Se compară valoarea p cu valoarea ndash prag
5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe
semnificativă dpdv statisticrdquo
6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e
semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să
conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă
Teste de semnificaţie
Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului
populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)
Testarea ipotezelor implică posibile erori
Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile
sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui
grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul
icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005
ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există
37
nici o diferenţă
Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ
statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de
ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost
ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau
dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă
cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă
semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe
ipotetice variate icircn cazul icircn care ele există
Măsuri ale frecvenţei
Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)
Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate
Generic formula pe care se bazează toate cele trei este
unde x şi y sunt cantităţile de comparat
Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea
unei frecvenţe pe grupe de sex vacircrstă etc
Proporţia implică icircn mod necesar ca x să fie inclus icircn y
Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară
frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp
Pentru calcularea unei rate trebuie ţinut cont de trei aspecte
bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin
bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp
bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo
Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un
tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei
populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei
aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)
38
Indicatori
Rata de incidenţă
Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă
icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii
Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o
perioadă de timp
Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de
timp x
Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei
susceptibili de a dezvolta icircmbolnăvirea studiată
Numitorul poate fi
bull Numărul mediu al populaţiei icircn perioada de timp studiată
bull Mărimea populaţiei icircn mijlocul perioadei de studiu
bull Mărimea populaţiei la icircnceputul studiului
Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă
Este obligatorie menţionarea perioadei de timp
Prevalenţa
Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la
un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă
schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa
momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)
39
Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include
numai cazuri noi respectiv include cazuri noi şi vechi
Rata de atac
Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este
folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp
raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori
Rata persoană-timp
Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din
momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte
migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost
observate
Riscul relativ (RR)
Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment
legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele
prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două
grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la
bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la
bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai
mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo
Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2
Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn
cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă
(Tabelul 1)
Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR
Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la
neexpuşi
40
Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de
culegere a datelor
Odds ratio (OR)
Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin
raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general
studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)
Tabelul 2 Tabelul 2 x 2 pentru calcularea OR
Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală
Rate de mortalitate
Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp
specificată Există mai multe tipuri de rate de mortalitate
o Mortalitate specifică pe sex
o Mortalitate specifică pe rasă
o Mortalitate specifică pe boală
o Mortalitate neonatală
o Mortalitate postneonatală
o Mortalitate infantilă
o Mortalitate maternă
Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP
41
Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de
viaţă şi vacircrsta la care survine decesul dacă este prematur
Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu
Ani de viaţă pierduţi datorat dizabilităţii
Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt
utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru
cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite
grupuri
Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de
risc şi o boală se folosesc riscul relativ şi odds ratio
35 Analiza şi interpretarea datelor
După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date
trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul
Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor
colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului
studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu
plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde
prezenţa biostatisticianului este necesară
Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu
elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat
iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului
iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate
depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori
testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere
clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza
Interpretarea rezultatelor statistice
Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne
motive (număr mic de date) acceptarea ei să fie falsă
Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine
gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia
ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument
de decizie Intervalul de confidenţă
42
Interpretarea statistica ne interpretarea clinică
Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă
Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice
obţinute pe eşantionul studiat
Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare
Ce interpretăm Rezultatele
personale obţinute icircn urma studiului
care au fost prezentate icircn secţiunea bdquoRezultaterdquo
Explicăm rezultatele obţinute
Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale
Interpretarea trebuie să se realizeze icircn
lumina limitelor studiului
contextul cultural social şi educaţional al locului unde s-a realizat cercetarea
contextul a ceea ce se cunoaşte din literatura de specialitate
Interpretăm doar rezultatele personale obţinute icircn urma studiului
Interpretarea statistică nu este tot una cu interpretarea clinică
Interpretarea statistică este importantă
Interpretarea clinică este foarte importantă
Intervalul de confidenţă
Media calculată pe baza unui eşantion nu va echivala media populaţiei
Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului
Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a
populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a
populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)
pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru
orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare
dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de
confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de
date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de
5
Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel
Dacă valoarea p este mică
Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare
aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o
medie diferită Diferenţa este semnificativă dpdv statistic
43
Icircn continuare
Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa
reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică
pentru a fi interesante din punct de vedere ştiinţific
Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC
oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care
este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a
obţine o concluzie clară
Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o
diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că
datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din
punct de vedere ştiinţific
Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul
detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat
Erorile studiilor medicale
Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura
anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară
caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea
asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri
legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias
Erorile potenţiale icircn studiile epidemiologice
1 Erori icircntacircmplătoare
2 Erori sistematice
3 Confuzia
4 Validitatea
1 Erori icircntacircmplătoare
Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a
parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel
de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot
fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii
(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor
de măsură (eroarea de măsurare)
44
2 Erori sistematice
Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate
care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu
acurateţe mare Acurateţea nu este afectată de mărimea eşantionului
Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de
experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea
dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus
şi greu de cuantificat (consum de alcool personalitate etc)
Principalele tipuri de erori din această categorie sunt
bull Biasul de selecţie
bull Biasul de informaţie
Biasul de selecţie
Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul
trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion
inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale
persoanelor incluse
Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se
ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia
Biasul de informaţie
Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de
instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze
expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere
nesemnificativă sau chiar să nu şi-o amintească de loc
3 Confuzia
Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune
prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este
cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă
de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte
important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor
protector
4 Validitatea
Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă
Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte
estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional
Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă
45
conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se
demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)
Validitatea externă se poate realiza numai dacă studiul este valid intern
Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii
studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de
studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt
laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi
validă din punct de vedere intern)
3 6 Prezentarea rezultatelor
După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite
Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor
icircntr-o formă bdquodigerabilărdquo este necesară
Scopul prezentării datelor
1 Transmiterea concluziilor studiului
a Datele corecte şi importante merită comunicate
b Datele trebuie să confirme sau să infirme ipoteza studiului
c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală
2 Acordarea posibilităţii altor cercetători să aprecieze studiul
a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti
b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor
prezentate
Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru
fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie
statistică
Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de
valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras
(Tabel 3)
Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)
46
Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct
numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor
precum şi prezentarea acestora sub formă inteligibilă
Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care
convin cercetătorului
Prezentarea datelor se poate face
1 Figuri şi tabele icircn articole scrise
2 Figuri şi tabele icircn prezentări orale
3 Figuri şi tabele icircn postere
4 Text scris sau incluse icircn text
5 Site-uri de WEB
Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor
Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie
Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele
exprimacircnd exact ceea ce acestea exprimă
Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate
anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel
să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se
acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca
mai sus sugestive sunt formatele simple şi puţin icircncărcate
Dacă nu există reguli impuse se respectă
1 Mesaj simplu fără falsificarea datelor
2 De obicei este necesar atacirct tabelul cacirct şi graficul
3 Să fie simplu şi clar
Tabele
Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile
coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică
elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de
1 Se folosesc doar linii orizontale
2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn
evidenţi prin linie de separare (Tabelul 4)
Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland
Noua Zeelandă)
(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)
47
3 Numerele sunt aliniate icircn funcţie de virgulă
4 Indicii statistici sunt explicaţi sub tabel
5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană
6 Abrevierile pot fi folosite
7 Numărul de zecimale trebuie limitat la maxim două
8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel
9 Plasarea legendei este obligatorie sub tabel
10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)
Icircn cazul prezentărilor orale sau a posterelor este indicat ca
1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării
2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte
3 Folosirea de simboluri este permisă
Clasificarea tabelelor
Tabelele se clasifică după
i) conţinut
bull cu distribuţii de frecvenţe
bull de clase de frecvenţe
bull de contingenţă
ii) structura
bull cu doua coloane
bull cu subclasificări
bull ldquomasterrdquo
Tabele ce conţin distribuţii de frecvenţe
O modalitate comodă de a prezenta o mulţime de date brute este
1 Se ordonează datele in ordine crescătoare
2 Se determine frecvenţa fiecărei valori
3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane
(Tabelul 5)
Tabelul 5 Distribuţii de frecvenţă absolută
48
Tabelul claselor de frecvenţe
1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă
2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)
Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)
Tabele de contingenţă
1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a
tabelelor de contingenţă
2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a
combinaţiilor de perechi ordonate de valori
3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre
a factor de risc si
b starea sănătăţii
4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)
5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)
Tabelul 7 Tabel de contingenţă 2 x 2
49
Grafice
Există două categorii de moduri grafice sub care se pot prezenta datele
1 Ilustraţii şi fotografii
2 Grafice
1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă
pentru lucrare
2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit
Putem vorbi despre mai multe tipuri de grafice
bull Grafice pentru reprezentarea datelor cantitative
1048707 Grafic cartezian (X Y)
1048707 Histograma
1048707 Poligonul de frecvenţe
1048707 Diagrama bdquoscatterrdquo
bull Grafice pentru reprezentarea datelor calitative
1048707 Grafic cu bare
1048707 Diagrama tip bdquoboxplotrdquo
1048707 Diagrama bdquopierdquo
1048707 Cartograma
Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi
dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)
Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)
Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie
Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)
Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)
50
Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir
de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele
două variabile studiate (Figura 6)
Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2
(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2
rămacircne aproximativ constantă)
Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea
comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea
comparativă a mai multor variabile
Figura 7 Grafic calitativ cu bare
51
Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo
Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două
posibilităţi reprezentate grafic este mai frecventă (Figura 8)
Figura 8 Reprezentare tip bdquopierdquo
Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli
sau a oricărui element comparativ Se foloseşte de epidemiologi
Rezultate
Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare
Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o
manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu
explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția
bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la
ilustraţii tabele grafice
Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi
nici rezultatele care invalidează eventual ipoteza
Discuţii
Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd
cultura ştiinţifică şi inteligenţa autorilor
Acest capitol răspunde la trei obiective
Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia
calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de
selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează
rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv
52
este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn
care a fost abordată problema fără a face o revistă a literaturii
Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea
rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul
Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor
afirmaţii nesusţinute de conţinutul lucrării
Concluzii
Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate
să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie
Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de
concluzii va scădea valoarea lucrării
Bibliografia (lista referinţelor citarea icircn text)
Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn
lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente
Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli
- să conţină cele mai importante şi recente lucrări
- să includă numai lucrări publicate
- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate
Bibliografie
Elisabeta Jaba ndash Statistică Ed Economică 1998
Mihai Ţarcă ndash Statistică volI Ed UAIC 1979
Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale
Ed University Press 2009
Sorana Daniela Bolboacă ndash Metodologia cercetării curs
53
bull Pretestarea instrumentului
bull Aprecierea validităţii interne şi externe a datelor culese
Instrumente de cercetare
Formularea clară a temei de cercetare necesită o foarte bună definire a factorilor studiaţi şi a criteriilor de
judecată Acestea din urmă sunt ultimele care vor trebui definite icircn cadrul protocolului de studiu
Alegerea unui instrument de măsură
Nu există un instrument de măsură perfect sau universal corect Alegerea sa dintre cele existente şi cele deja
utilizate depind de trei factori
bull Obiectivul studiului
bull Boala studiată
bull Populaţia icircn studiu
De aceste trei elemente trebuie ţinut cont icircn fiecare etapă a dezvoltării instrumentului
Definirea obiectivului
Studiu transversal Dacă se doreşte studierea unui simptom sau a unei caracteristici ale populaţiei se poate
icircmpărţi populaţia de studiu icircn mai multe grupuri Este practic vorba de a determina diferenţele dintre subiecţi
icircn cea ce priveşte o variabilă necesară studiată printr-un studiu transversal (utilizarea dozării de Ac HBS
pentru a evalua progresele bolnavilor de hepatită tip B)
Studiu longitudinal Icircn acest caz nu se poate icircmpărţii populaţia de studiu icircn mai multe grupuri datele obţinute
fiind de la acelaşi subiect colectate după un interval de timp
Icircn funcţie de boală şi populaţie se aleg şi instrumentele de măsură cele mai adecvate
Instrumentele cercetării reprezintă un mecanism specific sau o strategie pe care cercetătorul o utilizează pentru
colectarea prelucrarea şi inferenţa datelor Aceste instrumente sunt
1 Studiul icircn bibliotecă
2 Computerul
3 Determinările experimentale
4 Statistica
5 Mintea umană
6 Facilităţi de limbaj şi comunicare
Determinările experimentale
Măsurarea constă icircn aprecierea şi cuantificarea fenomenelor calitativ sau cantitativ Interpretarea
datelor se referă la transformarea lor icircn unităţi de descoperire a unor fenomene mai puţin cercetate
Standardele acceptate se referă la norme medii distribuţii etc Tot icircn cadrul interpretării datelor datele
obţinute sunt caracterizate pe scale de valori nominal ordinal de interval sau de raport
Validarea şi reproductibilitatea măsurătorilor sunt aspecte importante şi foarte necesare pentru o
cercetare corect fundamentată care doreşte obţinerea unor concluzii pertinente
15
Statistica Este implicată icircn condensarea şi procesarea unui volum mai mare de date astfel icircncacirct să se poată
interpreta corect valorile obţinute şi să se permită comparările Utilizarea unor teste statistice specifice permite
determinarea semnificaţiei (diferenţei) statistice astfel icircncacirct estimatorii să poată fi aplicaţi la populaţia
generală Furnizează informaţii şi privind corelarea sau relaţionarea icircntre date
Mintea umană este cea care reuşeşte să integreze şi să icircnţeleagă rezultatele obţinute Semnificaţia ştiinţifică
este stabilită icircn funcţie de rezultatele statisticii de mintea umană conform afirmaţiei bdquosemnificaţia ştiinţifică
nu este egală cu semnificaţia statisticărdquo Metodele aplicate pentru a putea ajunge la o concluzie pertinentă sunt
logica deductivă raţionamentul inductiv şi gacircndirea critică
Limbaj şi comunicare Exprimarea orală sau icircn scris permite nuanţarea unor aspecte seci cifrice ale unor
studii Icircn acest mod devine mai evidentă semnificaţia ştiinţifică a unor rezultate statistice
34 Prelucrarea datelor
Instrumentele de prelucrare
Statistica este o ştiinţă ramură a matematicii care studiază evoluţia fenomenelor şi proceselor
colective pe baza observării lor ştiinţifice a culegerii şi prelucrării detaliate a informaţiilor statistice cu scopul
de a formula şi explica legile legităţile şi regularităţile ce le guvernează
Statistica permite deci aprecierea unor parametrii populaţionali prin studiul unui număr redus de
elemente ale populaţiei icircn studiu (ţintă) O populaţie poate fi definită printr-un şir de valori care pot fi grupate
icircn funcţie de parametrul studiat (glicemie colesterol TAD TAS etc) Pentru fiecare astfel de şir se defineşte
o variabilă (care va purta nume propriu glicemie colesterol etc) Practic variabila este considerată o funcţie
ia valori posibil diferite de la un element la altul icircn funcţie de caracteristicile proprii acestora Sunt clasificate
icircn două grupe variabile cantitative (caracteristică măsurabilă) şi calitative (caracteristică ce nu poate fi
măsurată)
La racircndul lor variabilele calitative pot fi
bull Nominale ndash grupuri de elemente ce nu pot fi ordonate (culoarea părului)
bull Nominale ordonate ndash concluziile pot fi grupate (eficienţa unui tratament slabă bună foarte bună)
bull Binare ndash apar numai două posibilităţi (bolnav sănătos)
Variabilele cantitative pot fi
bull Continue ndash o variabilă măsurabilă care poate lua o infinitate de valori
bull Discrete ndash variabile care nu pot lua decacirct valori icircntregi
Statistica descriptivă
Există două ramuri ale statisticii statistica descriptivă şi statistica inferenţială
Statistica descriptivă (după cum rezultă din denumire) se ocupă cu descrierea unor valori obţinute ale unei
variabile studiate
16
Valorile pe care variabila le ia se constituie icircntr-o serie statistică Indicatorii care definesc o variabilă (serie)
sunt
1 Ale tendinţei centrale
Media aritmetică - notată de regulă cu
Mediana - este acea valoare din şirul de date care icircmparte icircn două părţi egale şirul ordonat de valori (atenţie
şirul este ordonat crescător) situacircndu-se la mijlocul seriei statistice
Dacă numărul de valori n este un număr impar atunci mediana este valoarea unde
Dacă n este par deci avem un număr par de valori mediana este definitatilde ca fiind
unde k = n2
Modul - constituie valoarea care apare cel mai des deci valoarea cu numărul cel mai mare de apariţii
2 De dispersie
Amplitudinea - este diferenţa dintre valoarea maximă şi cea minimă
A = Amax - Amin
Amplitudinea relativă - notată A este raportul dintre amplitudinea absolută şi media aritmetică a seriei de
date
Varianţa notată este un indicator de icircmprăştiere a datelor Formula de calcul este
Abaterea standard (S) sau deviaţia standard reprezintă rădăcina pătrată din varianţă (dispersie)
Coeficientul de variaţie se calculează ca un raport procentual icircntre abaterea standard şi valoarea medie a şirului
de valori
Eroarea standard intervine icircn estimarea intervalelor de confidenţă Se calculează astfel
17
3 De asimetrie (skewness) indică distribuţia datelor dacă sunt sau nu distribuite normal
4 De boltire (kurtosis) estimează boltirea sau aplatizarea curbei de distribuţie
Prezentarea descriptivă a datelor se face prin icircnregistrarea datelor culese icircn tabele care să reprezinte icircn mod
sintetic valorile măsurate
Icircn concluzie statistica descriptivă permite
bull Stabilirea comparabilităţii icircntre grupurile de studiu şi aprecierea prezenţei erorilor sau confuziei
bull Reprezentarea datelor icircn tabele permite evaluarea fiecărui pacient şi dacă a existat pierderi din studiu
Statistica inferenţială
Statistica inferenţială (inductivă) este partea de analiză a datelor care permite extrapolarea unei
concluzii trase pe baza unui eşantion spre populaţia ţintă pentru care a fost efectuat studiul
Scopul analizei statistice este de a evidenţia efectul unui tratament sau al unui factor de risc prin date obţinute
din eşantionul studiat spre populaţia ţintă Aceasta implică testarea ipotezelor statistice sau altfel spus testarea
semnificaţiei statistice Este una dintre cele mai importante momente ale studiului Cum rezultatele sunt
obţinute prin studiul unui eşantion există posibilitatea ca acestea să fie datorate icircntacircmplării Testele
statistice ne ajută să apreciem icircn ce măsură rezultatele sunt icircntacircmplătoare şi mai ales icircn ce măsură şi dacă se
pot aplica populaţiei generale Icircn acest scop se impune o valoare limită alfa 005 care reprezintă limita
superioară a probabilităţii ca rezultatul obţinut să fie greşit (datorat icircntacircmplării) Astfel icircn funcţie de tipul
variabilelor şi indicatorii descriptivi aplicaţi şi evaluaţi se aplică teste de semnificaţie statistică (Tabelul 1)
Tabelul 1 Alegerea testelor de semnificaţie statistică
Tipul datelor
18
Diferenţierea variabilelor din punctul de vedere a distribuţiei se face folosind testul de normalitate
Kolmogorov ndash Smirnov
Testul statistic reprezintă metoda de comparaţie a două sau mai multe populaţii prin intermediul unor
variabile observate ale lor
Scopul unui test statistic este de a defini realitatea
Definirea icircntrebării de cercetare (ipoteza clinică)
Tratamentul cu Nebivolol este la fel de eficient ca şi cel cu Valsartan icircn tratamentul
hipertensiunii arteriale
Transpunerea icircntrebării de cercetare icircn termeni statistici (ipoteza statistică)
Media tensiunii arteriale a pacienţilor trataţi cu Valsartan nu diferă semnificativ de media
tensiunii arteriale a pacienţilor trataţi cu Nebivolol
Etapele unui test statistic
1 Formularea problemei icircn termenii ipotezelor statistice
2 Alegerea şi calcularea parametrului statistic al testului
3 Regiunea critică
4 Concluzia testului
1 Formularea problemei icircn termenii ipotezelor statistice
Ipoteza nulă ipoteza care trebuie testată testul efectuacircndu-se sub prezumţia că ipoteza nulă ar
fi adevărată
Ipoteza alternativă acea ipoteză care icircntr-un sens sau altul contrazice ipoteza nulă Această
ipoteză se mai numeşte şi ipoteza de lucru
Ipoteza nulă tipuri
O coadă (ldquoone-tailedrdquo sau ldquoone-siderdquo)
Media este mai mare
Media este mai mică
Două cozi (ldquoone-tailedrdquo sau ldquoone-siderdquo)
Media este egală
2 Alegerea şi calcularea parametrului statistic al testului
Parametrul statistic al testului exprimă icircntr-o anumită formă diferenţa dintre elementele comparate
Ţinacircnd seama de faptul că eşantionul sau eşantioanele utilizate sunt aleator extrase din populaţiile care
fac obiectul testului parametrul statistic este o variabilă aleatoare de selecţie care urmează o anumită
lege de probabilitate
Un parametru statistic al testului bun trebuie să icircndeplinească două condiţii
19
Trebuie să se comporte diferit atunci cacircnd ipoteza nulă H0 este adevărată faţă de situaţia icircn
care ipoteza alternativă H1 este adevărată
Distribuţia de probabilitate a parametrului statistic al testului sub prezumţia că H0 este
adevărată este cunoscută
3 Regiunea critică
- Trebuie să fim capabili să decidem icircn funcţie de valoarea parametrului statistic calculat care dintre
ipoteze cea nulă sau cea alternativă este adevărată
- Dacă valoarea parametrului statistic aparţine regiunii critice ipoteza nulă H0 va fi respinsă şi va fi
acceptată ipoteza alternativă H1
- Dacă valoarea parametrului statistic nu aparţine regiunii critice ipoteza nulă H0 va fi acceptată
- Decidem mărimea regiunii critice
Pentru aceasta trebuie să specificăm mărimea riscului de eroare pe care icircl acceptăm
Pe scurt definim nivelul de semnificaţie notat cu a sau mărimea riscului pe care
suntem dispuşi să ni-l asumăm icircn respingerea ipotezei nule H0 icircn cazul icircn care aceasta
este adevărată De obicei se alege un nivel de semnificaţie icircntre 1 şi 5
Probabilitatea unei erori de tipul I
probabilitatea de respingere a ipotezei nule H0 icircn favoarea ipotezei alternative H1 icircn
condiţiile icircn care H0 este adevărată
probabilitatea unei erori de tipul I se notează cu a şi se mai numeşte nivel de
semnificaţie al testului
Probabilitatea unei erori de tipul II
probabilitatea acceptării ipotezei nule icircn condiţiile icircn care ipoteza alternativă H1 este
adevărată
această probabilitate se notează cu b
- Unilaterală la dreapta ndash valoarea parametrului statistic al testului este mai mare sau egală cu
valoarea din dreapta a intervalului critic
- Unilaterală la stacircnga ndash valoarea parametrului statistic al testului este mai mică sau egală cu
valoarea din stacircnga a intervalului critic
- Bilaterală ndash valoarea parametrului statistic al testului este mai mică sau egală cu valoarea extremă
din stacircnga regiunii critice sau mai mare sau egală cu valoarea extremă din dreapta regiunii critice
valorile extreme ale regiunii critice avacircnd nivele egale de semnificaţie
4 Concluzia testului
- Ipoteza nulă H0 este respinsă dacă valoarea parametrului statistic aparţine regiunii critice
20
- Regiunea critică trebuie astfel aleasă icircncacirct dacă ipoteza alternativă H1 este adevărată
probabilitatea de respingere a ipotezei nule H0 este mai mare decacirct icircn cazul icircn care ipoteza nulă H0
ar fi adevărată
- Acceptarea ipotezei nule H0 atunci cacircnd ipoteza alternativă H1 este adevărată este cunoscută ca şi
eroarea de tipul II
a probabilitatea ei se notează cu b
b măsoară bdquonivelul de eroarerdquo
- Icircn testarea oricărei ipoteze statistice există patru situaţii care determină dacă decizia noastră este
corectă sau nu
Cazuri
H0 este adevărată H0 este falsă
Concluzie H0 se acceptă decizie corectă eroare de tipul
II
H0 se
respinge
eroare de tipul I decizie corectă
Luarea deciziei pe baza valorii probabilităţii p de semnificaţie a testului
Icircn momentul icircn care prelucrăm statistic o serie de date dorim să ştim dacă rezultatele obţinute sunt sau
nu semnificative statistic
Răspunsul la această icircntrebare este dat de valoarea lui p calculată de orice program statistic la
prelucrarea unor date
Icircn cazul testelor statistice ipoteza nulă este respinsă dacă nivelul de semnificaţie este mai mic decacirct
005 iar programele de prelucrare statistică a datelor vor afişa o steluţă () icircn tabelul rezultatelor
21
Dacă p le 005 respingem ipoteza nulă şi acceptăm ipoteza alternativă (am obţinut semnificaţia
statistică)
Dacă p gt 005 acceptăm ipoteza nulă (nu am obţinut semnificaţia statistică)
p = 013
NU respingem ipoteza nulă
Risc de eroare de tip II
α = 005
p = 002
Respingem ipoteza nulă
Risc de eroare de tip I
Semnificaţia lui p
Criteriu de luare a deciziei cu privire la o ipoteză statistică nulă
Cuantifică şansa ca o decizie de respingere a ipotezei nule să fie greşită
Măsură a semnificaţiei statistice şi NU CLINICĂ
22
Semnificaţia lui p (reguli empirice)
001 le p lt 005 rezultatul e semnificativ statistic
0001 le p lt 001 rezultatul e icircnalt semnificativ statistic
p lt 0001 rezultatul e foarte icircnalt semnificativ statistic
p ge 005 rezultatul e considerat nesemnificativ statistic
Limite ale valorii p
Valoarea p NU ne dă informaţii despre
Şansa de beneficiu a unui pacient individual
Procentul de pacienţi care vor avea un beneficiu icircn urma instituirii procedurii medicale
Gradul de beneficiu expectat pentru un anumit pacient
Puterea unui test statistic
Este capacitatea de a detecta o diferenţă acolo unde există
Creşterea volumului eşantionului determină creşterea puterii testului statistic aplicat
Valoarea este icircn relaţie directă cu eroarea de tip II
Puterea = 1 ndash β
Cea mai utilizată modalitate de creştere a puterii unui test statistic este de a creşte volumul
eşantionului
Tipul scalei de măsură ndash testul statistic
Denumire test Interval Nominal Observaţii
Corelaţie Pearson 2 0 Există o relaţie liniară
χ2 0 2
Student 1 1 Doar 2 grupuri
ANOVA 1 1 2 sau mai multe grupuri
Student perechi 1 1 Eşantioane perechi
Măsurători repetate (ANOVA) 1 1 Mai mult de 2 grupuri date
perechi
Inferenţa statistică pe date calitativ e
Tabela de contingenţă 2times2
Riscuri şi raţii
Testul χ2 (testarea asocierii icircn tabela de contingenţă)
Testul Fisher
23
Testul z pentru proporţii
Testul McNemar
Tabela de contingenţă 2times2
Scale de tip nominal (dicotomiale tabela de contingenţă de 2times2) sau ordinal (tabela de contingenţă de
rtimesc)
Frecvenţa absolută (numărul de evenimente per categorie)
Tabela de contingenţă de 2times2 4 categorii
AP = adevărat pozitiv
FP = fals pozitiv
FN = fals negativ
AN = adevărat negativ
Ulcer deschis Ulcer vindecat Total
Recurenţă + AP = 1 FP = 5 = 1+5 = 6
Recurenţă - FN = 7 AN = 16 = 7+16 = 23
Total =1+7=8 =5+16=21 29
Riscuri şi raţii Mărimi ale asocierii
Denumire Formula Definiţie
Rata falşilor pozitivi =FP(FP+AN) Probabilitatea unui test fals + (α)
Rata falşilor negativi =FN(FN+AP) Probabilitatea unui test fals ndash (β)
Sensibilitate =AP(AP+FN) Probabilitatea unui test real + (1- β)
Specificitate =AN(AN+FP) Probabilitatea unui test real ndash (1- α)
Acurateţe =(AP+AN)n Probabilitatea generală a unei decizii corecte
Valoarea predictivă pozitivă =AP(AP+FP) Probabilitatea ca un test pozitiv să fie corect
Valoarea predictivă negativă =AN(AN+FN) Probabilitatea ca un test negativ să fie corect
Riscul relativ =AP(FP+AN)FN(AP+FP)
Rata şansei =(AP∙AN)(FN∙FP)
Riscul atribuabil =AP(AP+FP)-FN(FN+AN)
24
Denumire Formula
Rata falşilor pozitivi = 5(5+1) = 08334
Rata falşilor negativi = 7(7+16) = 03043
Sensibilitate = 1(1+7) = 01250
Specificitate = 16(16+5) = 07619
Acurateţe = (1+16)29 = 05862
Valoarea predictivă pozitivă = 1(1+5) = 01667
Valoarea predictivă negativă = 16(16+7) = 06957
Riscul relativ = 1(5+16)7(1+5) = 2142 = 050
Rata şansei = (1∙16)(7∙5) = 04571
Riscul atribuabil = 1(1+5)-7(7+16) = 01667-03043=-01376
Testarea asocierii icircn tabela de contingenţă
Testul χ2
Nu trebuie utilizat pentru eşantioane de volum mic
Testul este valid doar dacă valoarea expectată (aşteptată) pentru fiecare celulă este cel puţin
egală cu 1 şi frecvenţa absolută observată este de minim 5
Dacă aceste condiţii nu sunt icircndeplinite se aplică testul exact al lui Fisher (Fisherrsquos Exact Test)
Indică dacă cele două variabile sunt sau nu independente DAR NU cuantifică puterea asocierii
dintre ele
Problema S-a investigat icircntr-un studiu asocierea dintre obezitatea (ca factor de risc) şi bolile
cardio-vasculare la persoanele icircn etate (gt 60 ani) Din totalul de 620 persoane investigate s-au
identificat 150 persoane cu obezitate şi boală cardio-vasculară 230 persoane fără obezitate şi
fără boală cardio-vasculară şi 60 persoane fără obezitate dar cu boală cardio-vasculară Există
o asociere icircntre obezitate şi boala cardio-vasculară (df=1 α=005 χ2critic = 384)
Testul χ2 exemplu
H025
Nu există asociere icircntre obezitate şi bolile cardio-vasculare
Obezitatea şi bolile cardio-vasculare sunt independente
H1
Există asociere icircntre obezitate şi bolile cardio-vasculare
Obezitatea şi bolile cardio-vasculare sunt asociate
a = 005 pragul de semnificaţie al testului
urmează o lege cu (r-1)(c-1) grade de libertate
χ2 = parametrul testului χ2
fio = frecvenţa observată
fit = frecvenţa teoretică
Regiunea critică este [χα2 yen)
Pentru α = 005 χα2 = 384
OBSERVAT BCV+ BCV- Total
Obezitate + AP = 150 FP = 180 330
Obezitate - FN = 60 AN = 230 290
Total 210 410 620
TEORETIC BCV+ BCV- Total
Obezitate + = 330times210620 = 330times410620 330
Obezitate - = 290times210620 = 290times410620 290
Total 210 410 620
TEORETIC BCV+ BCV- Total
Obezitate + = 330times210620 = 330times410620 330
26
Obezitate - = 290times210620 = 290times410620 290
Total 210 410 620
TEORETIC BCV+ BCV-
Obezitate + = 112 = 218
Obezitate - = 98 = 192
Deoarece 4177Icirc[384 yen) se respinge H0 cu un risc de eroare de 5
Există asociere icircntre obezitate şi bolile cardio-vasculare
Testul Fisher
Corecţie a testului χ2
Valoarea p asociată parametrului ne dă probabilitatea ca valoarea observată de independenţă să fie
atribuită doar şansei
O valoare p mică indică că există alte cauze decacirct şansa influenţează rezultatul şi astfel cele două
variabile investigate nu sunt independente
Testul Fisher = dispersia corectată a factorului x dispersia corectată a factorilor reziduali
Icircn acest context regula adunării dispersiilor se poate scrie unde
este variaţia lui y pe seama variaţiei variabilei x
este variaţia lui y pe seama influenţei factorilor reziduali (neicircnregistraţi)
este variaţia totală a caracteristicii y
Testul Fisher empiric se calculează după formula
27
se compară cu Ftab pentru nx şi nz grade de libertate la un anumit prag de semnificaţie stabilit
Dacă Fc gt Ftab rezultă că variaţia factorului de grupare x este semnificativă pentru variaţia caracteristicii y
Testul z pentru proporţii
1 Compararea unei frecvenţe observate cu o frecvenţă teoretică
2 Testarea egalităţii a două frecvenţe
Testul z Compararea unei frecvenţe observate cu o frecvenţă teoretică
Scop Investigarea semnificaţiei diferenţei icircntre o frecvenţă teoretică p (icircntr-o populaţie) şi o frecvenţă
observată f pe un eşantion reprezentativ (variabilă calitativă (binare))
Condiţii de aplicare Testul este corect aplicat dacă numărul n al observaţiilor eşantionului este
suficient de mare (n∙p n∙(1-p)gt10
Parametrul
n = volumul eşantionului
Suntem interesaţi de investigarea prevalenţei hepatitei B la personalul care lucrează icircn laboratoarele
clinicilor de boli infecţioase din Transilvania Se ştie din studii anterioare că prevalenţa hepatitei B icircn
populaţia generală din Transilvania este de 9 S-a luat icircn studiu un eşantion de 100 persoane şi s-a
obţinut o prevalenţă a hepatitei B de 6 Există diferenţă semnificativă icircntre frecvenţa hepatitei B la
personalul care lucrează icircn laboratoarele spitalelor de boli infecţioase din Transilvania faţă de
populaţia generală
f = 006 p = 009 n = 100
Ipoteza nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat
faţă de frecvenţa hepatitei B icircn populaţia generală
Ipoteza alternativă test bilateral Există diferenţă semnificativă icircntre frecvenţa hepatitei B la
nivelul eşantionului şi prevalenţa hepatitei B icircn populaţia generală
f = 006 p = 009 n = 100
Pragul de semnificaţie a = 005
Regiunea critică test bilateral (-yen -196 ]Egrave[196 yen)
28
Concluzia testului
Deoarece parametrul statistic calculat al testului nu aparţine regiunii critice se acceptă ipoteza
nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat faţă de
frecvenţa hepatitei B icircn populaţia generală
Testul McNemar
Evaluarea dependenţei variabilelor calitative perechi (dorim să determinăm dacă o anumită
caracteristică este sau nu asociată cu o anumită patologie)
Identificăm n pacienţi care prezintă patologia de interes (eg Cancer bronho-pulmonar) şi n
pacienţi cu aceleaşi caracteristici ca şi primul grup dar care nu o prezintă
Martor = da Martor = nu
Caz = da a b
Caz = nu c d
Testul McNemar - exemplu fumat vs cancer
Martor = da Martor = nu
Cancer = da a = 2 b = 5
Cancer = nu c = 0 d = 3
29
χ2critic(α=005) = 384
32 lt 384 rarr acceptăm ipoteza nulă
Fumatul nu este icircn relaţie cu apariţia cancerului bronho-pulmonar
Inferenţa statistică pe date cantitative
Variabile cantitative continue
Testul z şi Student (t) (o medie sau medii perechi)
Testul z şi Student (t) (testarea a două medii)
ANOVA (ge 3 medii)
Ranguri (variabile cantitative discrete sau cantitative care nu icircndeplinesc condiţia de
normalitate)
Testul sumei rangurilor Wilcoxon
Kruskal-Wallis (ge 3 eşantioane independente)
Friedman (ge 3 eşantioane dependente)
Teste de normalitate variabile cantitative continue
Shapiro-Wilk
Kolmogorov-Smirnov
Shapiro-Wilk
Chi-Square Goodness-of-Fit
Dacă datele urmează o distribuţie normală aplicăm un test parametric
Dacă datele nu urmează o distribuţie normală aplicăm un test de comparare al rangurilor
30
Testul Z de comparare a mediei unui eşantion cu media unei populaţii
Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ
extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie
s2 care se cunoaşte
Condiţii de aplicare
1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru
compararea mediei unui eşantion cu media unei populaţii)
2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal
distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă
3 Talia eşantionului este mare ( ge 30)
Ipoteze
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media
eşantionului şi media populaţiei
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
(-yen -196 ] Egrave [196 yen)
Parametrul testului
n = volumul eşantionului
= media eşantionului
s = deviaţia standard a populaţiei
Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)
Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard
cunoscută
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi
media standard
Condiţii de aplicare
Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se
realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această
condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea
31
Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai
puternic
Numărul de grade de libertate (df) df = n-1
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
Parametrul testului
n = volumul eşantionului
micro0 = media standard
= media eşantionului
s = deviaţia standard a eşantionului
Testul ANOVA compararea mediilor a mai multe eşantioane
H0 = toate mediile sunt egale
H1 = nu toate mediile sunt egale
Condiţii de aplicare
1 Datele sunt independente unele faţă de celelalte
2 Datele fiecărui grup sunt normal distribuite
3 Deviaţia standard este aceeaşi pentru toate grupurile
Id Medicament
A B C D E F
1 5 6 7 10 5 9
2 6 8 8 11 8 8
3 7 7 9 13 6 7
4 8 9 11 12 4 5
32
5 9 10 10 9 7 6
Suma 35 40 45 55 30 35
Media 7 8 9 11 6 7
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =
= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)
Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2
F = (suma pătratelor(icircntre))(suma pătratelor(icircn))
Suma pătratelor (icircntre) = 16times5 = 80
Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60
Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn
interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare
SP df Media pătratelor F = MPicircntreMPicircn
Icircntre 80 5 = 805 = 16 = 1625 = 64
Icircn 60 24 = 6024 = 25
Total 140 29 -
Testul sumei rangurilor Wilcoxon
Aplicat pentru
Un set de observaţii provenite dintr-o valoare ipotetică comună
Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)
Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero
Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace
Suma rangurilor pentru diferenţele negative = 2+3+1 = 6
Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30
33
Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului
egal cu 8 = 0109
Icircnainte După Diferenţa Rang
64 66 -2 2
66 58 8 5
67 68 -1 3
71 65 6 4
72 75 -3 1
76 67 9 6
78 59 19 8
89 74 15 7
Testul Kruskal-Wallis (ge 3 eşantioane independente)
Test de ranguri aplicate pe mai mult de 3 eşantioane
H = parametrul testului
n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)
Tk = suma rangurilor
Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie
pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni
34
df = k-1 (k = numărul de eşantioane)
df = 3-1 = 2
Hcritic(α=005) = 599
H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie
pozitivă şi respectiv biopsie negativă
Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie
a tipului de studiu pe eşantioane perechi)
1 Definirea numărului de tratamente k
2 Obţinerea rangurilor pentru fiecare tratament
3 Sumarea rangurilor fiecărui tratament
4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)
5 Dacă Fr gt Frcritic rarr respingem H0
Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost
măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi
n = 9 k = 3 T12 = 225 T2
2 = 38025 T32 = 38025
Frcritic = 599
Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de
prostată
35
De reţinut
Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei
Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-
of-Fit
Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z
Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t
Compararea mediilor a 3 sau mai multe eşantioane ANOVA
Compararea mediilor a două populaţii (σ) testul Z
Compararea mediilor a două eşantioane (s) testul t
Compararea mediilor a două eşantioane perechi (s) testul t
ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi
cu cel pentru compararea a două eşantioane perechi
Ranguri
Distribuţia datelor nu are importanţă
Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)
Trei sau mai multe eşantioane Kruskal-Wallis
Trei sau mai multe eşantioane perechi Friedman
Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia
Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a
datelor)
Variabile nominale
Un singur eşantion sau eşantioane perechi
Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte
Eşantioane perechi testul Mc Nemar
Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2
Icircn analiza proporţiilor există teste diferite pentru
Compararea unei frecvenţe cu o frecvenţă cunoscută
Compararea a două frecvenţe
Semnificaţia statistică
Valoarea p (p value)
Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor
două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E
posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării
aleatorii
36
Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală
urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii
Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este
probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un
experiment de dimensiunea acestuia
Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că
diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii
diferite
Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca
fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă
ar fi fost adevărată
Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă
1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe
baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De
fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001
2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie
3 Se aplică testul statistic aferent pentru a calcula valoarea p
4 Se compară valoarea p cu valoarea ndash prag
5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe
semnificativă dpdv statisticrdquo
6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e
semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să
conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă
Teste de semnificaţie
Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului
populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)
Testarea ipotezelor implică posibile erori
Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile
sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui
grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul
icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005
ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există
37
nici o diferenţă
Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ
statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de
ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost
ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau
dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă
cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă
semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe
ipotetice variate icircn cazul icircn care ele există
Măsuri ale frecvenţei
Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)
Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate
Generic formula pe care se bazează toate cele trei este
unde x şi y sunt cantităţile de comparat
Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea
unei frecvenţe pe grupe de sex vacircrstă etc
Proporţia implică icircn mod necesar ca x să fie inclus icircn y
Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară
frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp
Pentru calcularea unei rate trebuie ţinut cont de trei aspecte
bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin
bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp
bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo
Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un
tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei
populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei
aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)
38
Indicatori
Rata de incidenţă
Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă
icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii
Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o
perioadă de timp
Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de
timp x
Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei
susceptibili de a dezvolta icircmbolnăvirea studiată
Numitorul poate fi
bull Numărul mediu al populaţiei icircn perioada de timp studiată
bull Mărimea populaţiei icircn mijlocul perioadei de studiu
bull Mărimea populaţiei la icircnceputul studiului
Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă
Este obligatorie menţionarea perioadei de timp
Prevalenţa
Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la
un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă
schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa
momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)
39
Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include
numai cazuri noi respectiv include cazuri noi şi vechi
Rata de atac
Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este
folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp
raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori
Rata persoană-timp
Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din
momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte
migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost
observate
Riscul relativ (RR)
Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment
legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele
prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două
grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la
bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la
bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai
mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo
Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2
Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn
cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă
(Tabelul 1)
Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR
Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la
neexpuşi
40
Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de
culegere a datelor
Odds ratio (OR)
Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin
raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general
studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)
Tabelul 2 Tabelul 2 x 2 pentru calcularea OR
Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală
Rate de mortalitate
Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp
specificată Există mai multe tipuri de rate de mortalitate
o Mortalitate specifică pe sex
o Mortalitate specifică pe rasă
o Mortalitate specifică pe boală
o Mortalitate neonatală
o Mortalitate postneonatală
o Mortalitate infantilă
o Mortalitate maternă
Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP
41
Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de
viaţă şi vacircrsta la care survine decesul dacă este prematur
Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu
Ani de viaţă pierduţi datorat dizabilităţii
Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt
utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru
cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite
grupuri
Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de
risc şi o boală se folosesc riscul relativ şi odds ratio
35 Analiza şi interpretarea datelor
După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date
trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul
Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor
colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului
studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu
plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde
prezenţa biostatisticianului este necesară
Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu
elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat
iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului
iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate
depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori
testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere
clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza
Interpretarea rezultatelor statistice
Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne
motive (număr mic de date) acceptarea ei să fie falsă
Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine
gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia
ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument
de decizie Intervalul de confidenţă
42
Interpretarea statistica ne interpretarea clinică
Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă
Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice
obţinute pe eşantionul studiat
Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare
Ce interpretăm Rezultatele
personale obţinute icircn urma studiului
care au fost prezentate icircn secţiunea bdquoRezultaterdquo
Explicăm rezultatele obţinute
Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale
Interpretarea trebuie să se realizeze icircn
lumina limitelor studiului
contextul cultural social şi educaţional al locului unde s-a realizat cercetarea
contextul a ceea ce se cunoaşte din literatura de specialitate
Interpretăm doar rezultatele personale obţinute icircn urma studiului
Interpretarea statistică nu este tot una cu interpretarea clinică
Interpretarea statistică este importantă
Interpretarea clinică este foarte importantă
Intervalul de confidenţă
Media calculată pe baza unui eşantion nu va echivala media populaţiei
Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului
Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a
populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a
populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)
pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru
orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare
dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de
confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de
date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de
5
Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel
Dacă valoarea p este mică
Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare
aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o
medie diferită Diferenţa este semnificativă dpdv statistic
43
Icircn continuare
Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa
reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică
pentru a fi interesante din punct de vedere ştiinţific
Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC
oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care
este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a
obţine o concluzie clară
Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o
diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că
datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din
punct de vedere ştiinţific
Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul
detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat
Erorile studiilor medicale
Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura
anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară
caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea
asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri
legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias
Erorile potenţiale icircn studiile epidemiologice
1 Erori icircntacircmplătoare
2 Erori sistematice
3 Confuzia
4 Validitatea
1 Erori icircntacircmplătoare
Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a
parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel
de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot
fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii
(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor
de măsură (eroarea de măsurare)
44
2 Erori sistematice
Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate
care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu
acurateţe mare Acurateţea nu este afectată de mărimea eşantionului
Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de
experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea
dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus
şi greu de cuantificat (consum de alcool personalitate etc)
Principalele tipuri de erori din această categorie sunt
bull Biasul de selecţie
bull Biasul de informaţie
Biasul de selecţie
Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul
trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion
inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale
persoanelor incluse
Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se
ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia
Biasul de informaţie
Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de
instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze
expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere
nesemnificativă sau chiar să nu şi-o amintească de loc
3 Confuzia
Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune
prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este
cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă
de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte
important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor
protector
4 Validitatea
Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă
Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte
estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional
Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă
45
conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se
demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)
Validitatea externă se poate realiza numai dacă studiul este valid intern
Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii
studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de
studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt
laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi
validă din punct de vedere intern)
3 6 Prezentarea rezultatelor
După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite
Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor
icircntr-o formă bdquodigerabilărdquo este necesară
Scopul prezentării datelor
1 Transmiterea concluziilor studiului
a Datele corecte şi importante merită comunicate
b Datele trebuie să confirme sau să infirme ipoteza studiului
c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală
2 Acordarea posibilităţii altor cercetători să aprecieze studiul
a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti
b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor
prezentate
Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru
fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie
statistică
Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de
valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras
(Tabel 3)
Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)
46
Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct
numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor
precum şi prezentarea acestora sub formă inteligibilă
Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care
convin cercetătorului
Prezentarea datelor se poate face
1 Figuri şi tabele icircn articole scrise
2 Figuri şi tabele icircn prezentări orale
3 Figuri şi tabele icircn postere
4 Text scris sau incluse icircn text
5 Site-uri de WEB
Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor
Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie
Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele
exprimacircnd exact ceea ce acestea exprimă
Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate
anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel
să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se
acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca
mai sus sugestive sunt formatele simple şi puţin icircncărcate
Dacă nu există reguli impuse se respectă
1 Mesaj simplu fără falsificarea datelor
2 De obicei este necesar atacirct tabelul cacirct şi graficul
3 Să fie simplu şi clar
Tabele
Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile
coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică
elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de
1 Se folosesc doar linii orizontale
2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn
evidenţi prin linie de separare (Tabelul 4)
Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland
Noua Zeelandă)
(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)
47
3 Numerele sunt aliniate icircn funcţie de virgulă
4 Indicii statistici sunt explicaţi sub tabel
5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană
6 Abrevierile pot fi folosite
7 Numărul de zecimale trebuie limitat la maxim două
8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel
9 Plasarea legendei este obligatorie sub tabel
10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)
Icircn cazul prezentărilor orale sau a posterelor este indicat ca
1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării
2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte
3 Folosirea de simboluri este permisă
Clasificarea tabelelor
Tabelele se clasifică după
i) conţinut
bull cu distribuţii de frecvenţe
bull de clase de frecvenţe
bull de contingenţă
ii) structura
bull cu doua coloane
bull cu subclasificări
bull ldquomasterrdquo
Tabele ce conţin distribuţii de frecvenţe
O modalitate comodă de a prezenta o mulţime de date brute este
1 Se ordonează datele in ordine crescătoare
2 Se determine frecvenţa fiecărei valori
3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane
(Tabelul 5)
Tabelul 5 Distribuţii de frecvenţă absolută
48
Tabelul claselor de frecvenţe
1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă
2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)
Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)
Tabele de contingenţă
1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a
tabelelor de contingenţă
2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a
combinaţiilor de perechi ordonate de valori
3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre
a factor de risc si
b starea sănătăţii
4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)
5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)
Tabelul 7 Tabel de contingenţă 2 x 2
49
Grafice
Există două categorii de moduri grafice sub care se pot prezenta datele
1 Ilustraţii şi fotografii
2 Grafice
1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă
pentru lucrare
2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit
Putem vorbi despre mai multe tipuri de grafice
bull Grafice pentru reprezentarea datelor cantitative
1048707 Grafic cartezian (X Y)
1048707 Histograma
1048707 Poligonul de frecvenţe
1048707 Diagrama bdquoscatterrdquo
bull Grafice pentru reprezentarea datelor calitative
1048707 Grafic cu bare
1048707 Diagrama tip bdquoboxplotrdquo
1048707 Diagrama bdquopierdquo
1048707 Cartograma
Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi
dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)
Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)
Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie
Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)
Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)
50
Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir
de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele
două variabile studiate (Figura 6)
Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2
(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2
rămacircne aproximativ constantă)
Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea
comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea
comparativă a mai multor variabile
Figura 7 Grafic calitativ cu bare
51
Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo
Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două
posibilităţi reprezentate grafic este mai frecventă (Figura 8)
Figura 8 Reprezentare tip bdquopierdquo
Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli
sau a oricărui element comparativ Se foloseşte de epidemiologi
Rezultate
Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare
Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o
manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu
explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția
bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la
ilustraţii tabele grafice
Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi
nici rezultatele care invalidează eventual ipoteza
Discuţii
Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd
cultura ştiinţifică şi inteligenţa autorilor
Acest capitol răspunde la trei obiective
Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia
calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de
selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează
rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv
52
este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn
care a fost abordată problema fără a face o revistă a literaturii
Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea
rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul
Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor
afirmaţii nesusţinute de conţinutul lucrării
Concluzii
Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate
să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie
Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de
concluzii va scădea valoarea lucrării
Bibliografia (lista referinţelor citarea icircn text)
Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn
lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente
Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli
- să conţină cele mai importante şi recente lucrări
- să includă numai lucrări publicate
- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate
Bibliografie
Elisabeta Jaba ndash Statistică Ed Economică 1998
Mihai Ţarcă ndash Statistică volI Ed UAIC 1979
Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale
Ed University Press 2009
Sorana Daniela Bolboacă ndash Metodologia cercetării curs
53
Statistica Este implicată icircn condensarea şi procesarea unui volum mai mare de date astfel icircncacirct să se poată
interpreta corect valorile obţinute şi să se permită comparările Utilizarea unor teste statistice specifice permite
determinarea semnificaţiei (diferenţei) statistice astfel icircncacirct estimatorii să poată fi aplicaţi la populaţia
generală Furnizează informaţii şi privind corelarea sau relaţionarea icircntre date
Mintea umană este cea care reuşeşte să integreze şi să icircnţeleagă rezultatele obţinute Semnificaţia ştiinţifică
este stabilită icircn funcţie de rezultatele statisticii de mintea umană conform afirmaţiei bdquosemnificaţia ştiinţifică
nu este egală cu semnificaţia statisticărdquo Metodele aplicate pentru a putea ajunge la o concluzie pertinentă sunt
logica deductivă raţionamentul inductiv şi gacircndirea critică
Limbaj şi comunicare Exprimarea orală sau icircn scris permite nuanţarea unor aspecte seci cifrice ale unor
studii Icircn acest mod devine mai evidentă semnificaţia ştiinţifică a unor rezultate statistice
34 Prelucrarea datelor
Instrumentele de prelucrare
Statistica este o ştiinţă ramură a matematicii care studiază evoluţia fenomenelor şi proceselor
colective pe baza observării lor ştiinţifice a culegerii şi prelucrării detaliate a informaţiilor statistice cu scopul
de a formula şi explica legile legităţile şi regularităţile ce le guvernează
Statistica permite deci aprecierea unor parametrii populaţionali prin studiul unui număr redus de
elemente ale populaţiei icircn studiu (ţintă) O populaţie poate fi definită printr-un şir de valori care pot fi grupate
icircn funcţie de parametrul studiat (glicemie colesterol TAD TAS etc) Pentru fiecare astfel de şir se defineşte
o variabilă (care va purta nume propriu glicemie colesterol etc) Practic variabila este considerată o funcţie
ia valori posibil diferite de la un element la altul icircn funcţie de caracteristicile proprii acestora Sunt clasificate
icircn două grupe variabile cantitative (caracteristică măsurabilă) şi calitative (caracteristică ce nu poate fi
măsurată)
La racircndul lor variabilele calitative pot fi
bull Nominale ndash grupuri de elemente ce nu pot fi ordonate (culoarea părului)
bull Nominale ordonate ndash concluziile pot fi grupate (eficienţa unui tratament slabă bună foarte bună)
bull Binare ndash apar numai două posibilităţi (bolnav sănătos)
Variabilele cantitative pot fi
bull Continue ndash o variabilă măsurabilă care poate lua o infinitate de valori
bull Discrete ndash variabile care nu pot lua decacirct valori icircntregi
Statistica descriptivă
Există două ramuri ale statisticii statistica descriptivă şi statistica inferenţială
Statistica descriptivă (după cum rezultă din denumire) se ocupă cu descrierea unor valori obţinute ale unei
variabile studiate
16
Valorile pe care variabila le ia se constituie icircntr-o serie statistică Indicatorii care definesc o variabilă (serie)
sunt
1 Ale tendinţei centrale
Media aritmetică - notată de regulă cu
Mediana - este acea valoare din şirul de date care icircmparte icircn două părţi egale şirul ordonat de valori (atenţie
şirul este ordonat crescător) situacircndu-se la mijlocul seriei statistice
Dacă numărul de valori n este un număr impar atunci mediana este valoarea unde
Dacă n este par deci avem un număr par de valori mediana este definitatilde ca fiind
unde k = n2
Modul - constituie valoarea care apare cel mai des deci valoarea cu numărul cel mai mare de apariţii
2 De dispersie
Amplitudinea - este diferenţa dintre valoarea maximă şi cea minimă
A = Amax - Amin
Amplitudinea relativă - notată A este raportul dintre amplitudinea absolută şi media aritmetică a seriei de
date
Varianţa notată este un indicator de icircmprăştiere a datelor Formula de calcul este
Abaterea standard (S) sau deviaţia standard reprezintă rădăcina pătrată din varianţă (dispersie)
Coeficientul de variaţie se calculează ca un raport procentual icircntre abaterea standard şi valoarea medie a şirului
de valori
Eroarea standard intervine icircn estimarea intervalelor de confidenţă Se calculează astfel
17
3 De asimetrie (skewness) indică distribuţia datelor dacă sunt sau nu distribuite normal
4 De boltire (kurtosis) estimează boltirea sau aplatizarea curbei de distribuţie
Prezentarea descriptivă a datelor se face prin icircnregistrarea datelor culese icircn tabele care să reprezinte icircn mod
sintetic valorile măsurate
Icircn concluzie statistica descriptivă permite
bull Stabilirea comparabilităţii icircntre grupurile de studiu şi aprecierea prezenţei erorilor sau confuziei
bull Reprezentarea datelor icircn tabele permite evaluarea fiecărui pacient şi dacă a existat pierderi din studiu
Statistica inferenţială
Statistica inferenţială (inductivă) este partea de analiză a datelor care permite extrapolarea unei
concluzii trase pe baza unui eşantion spre populaţia ţintă pentru care a fost efectuat studiul
Scopul analizei statistice este de a evidenţia efectul unui tratament sau al unui factor de risc prin date obţinute
din eşantionul studiat spre populaţia ţintă Aceasta implică testarea ipotezelor statistice sau altfel spus testarea
semnificaţiei statistice Este una dintre cele mai importante momente ale studiului Cum rezultatele sunt
obţinute prin studiul unui eşantion există posibilitatea ca acestea să fie datorate icircntacircmplării Testele
statistice ne ajută să apreciem icircn ce măsură rezultatele sunt icircntacircmplătoare şi mai ales icircn ce măsură şi dacă se
pot aplica populaţiei generale Icircn acest scop se impune o valoare limită alfa 005 care reprezintă limita
superioară a probabilităţii ca rezultatul obţinut să fie greşit (datorat icircntacircmplării) Astfel icircn funcţie de tipul
variabilelor şi indicatorii descriptivi aplicaţi şi evaluaţi se aplică teste de semnificaţie statistică (Tabelul 1)
Tabelul 1 Alegerea testelor de semnificaţie statistică
Tipul datelor
18
Diferenţierea variabilelor din punctul de vedere a distribuţiei se face folosind testul de normalitate
Kolmogorov ndash Smirnov
Testul statistic reprezintă metoda de comparaţie a două sau mai multe populaţii prin intermediul unor
variabile observate ale lor
Scopul unui test statistic este de a defini realitatea
Definirea icircntrebării de cercetare (ipoteza clinică)
Tratamentul cu Nebivolol este la fel de eficient ca şi cel cu Valsartan icircn tratamentul
hipertensiunii arteriale
Transpunerea icircntrebării de cercetare icircn termeni statistici (ipoteza statistică)
Media tensiunii arteriale a pacienţilor trataţi cu Valsartan nu diferă semnificativ de media
tensiunii arteriale a pacienţilor trataţi cu Nebivolol
Etapele unui test statistic
1 Formularea problemei icircn termenii ipotezelor statistice
2 Alegerea şi calcularea parametrului statistic al testului
3 Regiunea critică
4 Concluzia testului
1 Formularea problemei icircn termenii ipotezelor statistice
Ipoteza nulă ipoteza care trebuie testată testul efectuacircndu-se sub prezumţia că ipoteza nulă ar
fi adevărată
Ipoteza alternativă acea ipoteză care icircntr-un sens sau altul contrazice ipoteza nulă Această
ipoteză se mai numeşte şi ipoteza de lucru
Ipoteza nulă tipuri
O coadă (ldquoone-tailedrdquo sau ldquoone-siderdquo)
Media este mai mare
Media este mai mică
Două cozi (ldquoone-tailedrdquo sau ldquoone-siderdquo)
Media este egală
2 Alegerea şi calcularea parametrului statistic al testului
Parametrul statistic al testului exprimă icircntr-o anumită formă diferenţa dintre elementele comparate
Ţinacircnd seama de faptul că eşantionul sau eşantioanele utilizate sunt aleator extrase din populaţiile care
fac obiectul testului parametrul statistic este o variabilă aleatoare de selecţie care urmează o anumită
lege de probabilitate
Un parametru statistic al testului bun trebuie să icircndeplinească două condiţii
19
Trebuie să se comporte diferit atunci cacircnd ipoteza nulă H0 este adevărată faţă de situaţia icircn
care ipoteza alternativă H1 este adevărată
Distribuţia de probabilitate a parametrului statistic al testului sub prezumţia că H0 este
adevărată este cunoscută
3 Regiunea critică
- Trebuie să fim capabili să decidem icircn funcţie de valoarea parametrului statistic calculat care dintre
ipoteze cea nulă sau cea alternativă este adevărată
- Dacă valoarea parametrului statistic aparţine regiunii critice ipoteza nulă H0 va fi respinsă şi va fi
acceptată ipoteza alternativă H1
- Dacă valoarea parametrului statistic nu aparţine regiunii critice ipoteza nulă H0 va fi acceptată
- Decidem mărimea regiunii critice
Pentru aceasta trebuie să specificăm mărimea riscului de eroare pe care icircl acceptăm
Pe scurt definim nivelul de semnificaţie notat cu a sau mărimea riscului pe care
suntem dispuşi să ni-l asumăm icircn respingerea ipotezei nule H0 icircn cazul icircn care aceasta
este adevărată De obicei se alege un nivel de semnificaţie icircntre 1 şi 5
Probabilitatea unei erori de tipul I
probabilitatea de respingere a ipotezei nule H0 icircn favoarea ipotezei alternative H1 icircn
condiţiile icircn care H0 este adevărată
probabilitatea unei erori de tipul I se notează cu a şi se mai numeşte nivel de
semnificaţie al testului
Probabilitatea unei erori de tipul II
probabilitatea acceptării ipotezei nule icircn condiţiile icircn care ipoteza alternativă H1 este
adevărată
această probabilitate se notează cu b
- Unilaterală la dreapta ndash valoarea parametrului statistic al testului este mai mare sau egală cu
valoarea din dreapta a intervalului critic
- Unilaterală la stacircnga ndash valoarea parametrului statistic al testului este mai mică sau egală cu
valoarea din stacircnga a intervalului critic
- Bilaterală ndash valoarea parametrului statistic al testului este mai mică sau egală cu valoarea extremă
din stacircnga regiunii critice sau mai mare sau egală cu valoarea extremă din dreapta regiunii critice
valorile extreme ale regiunii critice avacircnd nivele egale de semnificaţie
4 Concluzia testului
- Ipoteza nulă H0 este respinsă dacă valoarea parametrului statistic aparţine regiunii critice
20
- Regiunea critică trebuie astfel aleasă icircncacirct dacă ipoteza alternativă H1 este adevărată
probabilitatea de respingere a ipotezei nule H0 este mai mare decacirct icircn cazul icircn care ipoteza nulă H0
ar fi adevărată
- Acceptarea ipotezei nule H0 atunci cacircnd ipoteza alternativă H1 este adevărată este cunoscută ca şi
eroarea de tipul II
a probabilitatea ei se notează cu b
b măsoară bdquonivelul de eroarerdquo
- Icircn testarea oricărei ipoteze statistice există patru situaţii care determină dacă decizia noastră este
corectă sau nu
Cazuri
H0 este adevărată H0 este falsă
Concluzie H0 se acceptă decizie corectă eroare de tipul
II
H0 se
respinge
eroare de tipul I decizie corectă
Luarea deciziei pe baza valorii probabilităţii p de semnificaţie a testului
Icircn momentul icircn care prelucrăm statistic o serie de date dorim să ştim dacă rezultatele obţinute sunt sau
nu semnificative statistic
Răspunsul la această icircntrebare este dat de valoarea lui p calculată de orice program statistic la
prelucrarea unor date
Icircn cazul testelor statistice ipoteza nulă este respinsă dacă nivelul de semnificaţie este mai mic decacirct
005 iar programele de prelucrare statistică a datelor vor afişa o steluţă () icircn tabelul rezultatelor
21
Dacă p le 005 respingem ipoteza nulă şi acceptăm ipoteza alternativă (am obţinut semnificaţia
statistică)
Dacă p gt 005 acceptăm ipoteza nulă (nu am obţinut semnificaţia statistică)
p = 013
NU respingem ipoteza nulă
Risc de eroare de tip II
α = 005
p = 002
Respingem ipoteza nulă
Risc de eroare de tip I
Semnificaţia lui p
Criteriu de luare a deciziei cu privire la o ipoteză statistică nulă
Cuantifică şansa ca o decizie de respingere a ipotezei nule să fie greşită
Măsură a semnificaţiei statistice şi NU CLINICĂ
22
Semnificaţia lui p (reguli empirice)
001 le p lt 005 rezultatul e semnificativ statistic
0001 le p lt 001 rezultatul e icircnalt semnificativ statistic
p lt 0001 rezultatul e foarte icircnalt semnificativ statistic
p ge 005 rezultatul e considerat nesemnificativ statistic
Limite ale valorii p
Valoarea p NU ne dă informaţii despre
Şansa de beneficiu a unui pacient individual
Procentul de pacienţi care vor avea un beneficiu icircn urma instituirii procedurii medicale
Gradul de beneficiu expectat pentru un anumit pacient
Puterea unui test statistic
Este capacitatea de a detecta o diferenţă acolo unde există
Creşterea volumului eşantionului determină creşterea puterii testului statistic aplicat
Valoarea este icircn relaţie directă cu eroarea de tip II
Puterea = 1 ndash β
Cea mai utilizată modalitate de creştere a puterii unui test statistic este de a creşte volumul
eşantionului
Tipul scalei de măsură ndash testul statistic
Denumire test Interval Nominal Observaţii
Corelaţie Pearson 2 0 Există o relaţie liniară
χ2 0 2
Student 1 1 Doar 2 grupuri
ANOVA 1 1 2 sau mai multe grupuri
Student perechi 1 1 Eşantioane perechi
Măsurători repetate (ANOVA) 1 1 Mai mult de 2 grupuri date
perechi
Inferenţa statistică pe date calitativ e
Tabela de contingenţă 2times2
Riscuri şi raţii
Testul χ2 (testarea asocierii icircn tabela de contingenţă)
Testul Fisher
23
Testul z pentru proporţii
Testul McNemar
Tabela de contingenţă 2times2
Scale de tip nominal (dicotomiale tabela de contingenţă de 2times2) sau ordinal (tabela de contingenţă de
rtimesc)
Frecvenţa absolută (numărul de evenimente per categorie)
Tabela de contingenţă de 2times2 4 categorii
AP = adevărat pozitiv
FP = fals pozitiv
FN = fals negativ
AN = adevărat negativ
Ulcer deschis Ulcer vindecat Total
Recurenţă + AP = 1 FP = 5 = 1+5 = 6
Recurenţă - FN = 7 AN = 16 = 7+16 = 23
Total =1+7=8 =5+16=21 29
Riscuri şi raţii Mărimi ale asocierii
Denumire Formula Definiţie
Rata falşilor pozitivi =FP(FP+AN) Probabilitatea unui test fals + (α)
Rata falşilor negativi =FN(FN+AP) Probabilitatea unui test fals ndash (β)
Sensibilitate =AP(AP+FN) Probabilitatea unui test real + (1- β)
Specificitate =AN(AN+FP) Probabilitatea unui test real ndash (1- α)
Acurateţe =(AP+AN)n Probabilitatea generală a unei decizii corecte
Valoarea predictivă pozitivă =AP(AP+FP) Probabilitatea ca un test pozitiv să fie corect
Valoarea predictivă negativă =AN(AN+FN) Probabilitatea ca un test negativ să fie corect
Riscul relativ =AP(FP+AN)FN(AP+FP)
Rata şansei =(AP∙AN)(FN∙FP)
Riscul atribuabil =AP(AP+FP)-FN(FN+AN)
24
Denumire Formula
Rata falşilor pozitivi = 5(5+1) = 08334
Rata falşilor negativi = 7(7+16) = 03043
Sensibilitate = 1(1+7) = 01250
Specificitate = 16(16+5) = 07619
Acurateţe = (1+16)29 = 05862
Valoarea predictivă pozitivă = 1(1+5) = 01667
Valoarea predictivă negativă = 16(16+7) = 06957
Riscul relativ = 1(5+16)7(1+5) = 2142 = 050
Rata şansei = (1∙16)(7∙5) = 04571
Riscul atribuabil = 1(1+5)-7(7+16) = 01667-03043=-01376
Testarea asocierii icircn tabela de contingenţă
Testul χ2
Nu trebuie utilizat pentru eşantioane de volum mic
Testul este valid doar dacă valoarea expectată (aşteptată) pentru fiecare celulă este cel puţin
egală cu 1 şi frecvenţa absolută observată este de minim 5
Dacă aceste condiţii nu sunt icircndeplinite se aplică testul exact al lui Fisher (Fisherrsquos Exact Test)
Indică dacă cele două variabile sunt sau nu independente DAR NU cuantifică puterea asocierii
dintre ele
Problema S-a investigat icircntr-un studiu asocierea dintre obezitatea (ca factor de risc) şi bolile
cardio-vasculare la persoanele icircn etate (gt 60 ani) Din totalul de 620 persoane investigate s-au
identificat 150 persoane cu obezitate şi boală cardio-vasculară 230 persoane fără obezitate şi
fără boală cardio-vasculară şi 60 persoane fără obezitate dar cu boală cardio-vasculară Există
o asociere icircntre obezitate şi boala cardio-vasculară (df=1 α=005 χ2critic = 384)
Testul χ2 exemplu
H025
Nu există asociere icircntre obezitate şi bolile cardio-vasculare
Obezitatea şi bolile cardio-vasculare sunt independente
H1
Există asociere icircntre obezitate şi bolile cardio-vasculare
Obezitatea şi bolile cardio-vasculare sunt asociate
a = 005 pragul de semnificaţie al testului
urmează o lege cu (r-1)(c-1) grade de libertate
χ2 = parametrul testului χ2
fio = frecvenţa observată
fit = frecvenţa teoretică
Regiunea critică este [χα2 yen)
Pentru α = 005 χα2 = 384
OBSERVAT BCV+ BCV- Total
Obezitate + AP = 150 FP = 180 330
Obezitate - FN = 60 AN = 230 290
Total 210 410 620
TEORETIC BCV+ BCV- Total
Obezitate + = 330times210620 = 330times410620 330
Obezitate - = 290times210620 = 290times410620 290
Total 210 410 620
TEORETIC BCV+ BCV- Total
Obezitate + = 330times210620 = 330times410620 330
26
Obezitate - = 290times210620 = 290times410620 290
Total 210 410 620
TEORETIC BCV+ BCV-
Obezitate + = 112 = 218
Obezitate - = 98 = 192
Deoarece 4177Icirc[384 yen) se respinge H0 cu un risc de eroare de 5
Există asociere icircntre obezitate şi bolile cardio-vasculare
Testul Fisher
Corecţie a testului χ2
Valoarea p asociată parametrului ne dă probabilitatea ca valoarea observată de independenţă să fie
atribuită doar şansei
O valoare p mică indică că există alte cauze decacirct şansa influenţează rezultatul şi astfel cele două
variabile investigate nu sunt independente
Testul Fisher = dispersia corectată a factorului x dispersia corectată a factorilor reziduali
Icircn acest context regula adunării dispersiilor se poate scrie unde
este variaţia lui y pe seama variaţiei variabilei x
este variaţia lui y pe seama influenţei factorilor reziduali (neicircnregistraţi)
este variaţia totală a caracteristicii y
Testul Fisher empiric se calculează după formula
27
se compară cu Ftab pentru nx şi nz grade de libertate la un anumit prag de semnificaţie stabilit
Dacă Fc gt Ftab rezultă că variaţia factorului de grupare x este semnificativă pentru variaţia caracteristicii y
Testul z pentru proporţii
1 Compararea unei frecvenţe observate cu o frecvenţă teoretică
2 Testarea egalităţii a două frecvenţe
Testul z Compararea unei frecvenţe observate cu o frecvenţă teoretică
Scop Investigarea semnificaţiei diferenţei icircntre o frecvenţă teoretică p (icircntr-o populaţie) şi o frecvenţă
observată f pe un eşantion reprezentativ (variabilă calitativă (binare))
Condiţii de aplicare Testul este corect aplicat dacă numărul n al observaţiilor eşantionului este
suficient de mare (n∙p n∙(1-p)gt10
Parametrul
n = volumul eşantionului
Suntem interesaţi de investigarea prevalenţei hepatitei B la personalul care lucrează icircn laboratoarele
clinicilor de boli infecţioase din Transilvania Se ştie din studii anterioare că prevalenţa hepatitei B icircn
populaţia generală din Transilvania este de 9 S-a luat icircn studiu un eşantion de 100 persoane şi s-a
obţinut o prevalenţă a hepatitei B de 6 Există diferenţă semnificativă icircntre frecvenţa hepatitei B la
personalul care lucrează icircn laboratoarele spitalelor de boli infecţioase din Transilvania faţă de
populaţia generală
f = 006 p = 009 n = 100
Ipoteza nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat
faţă de frecvenţa hepatitei B icircn populaţia generală
Ipoteza alternativă test bilateral Există diferenţă semnificativă icircntre frecvenţa hepatitei B la
nivelul eşantionului şi prevalenţa hepatitei B icircn populaţia generală
f = 006 p = 009 n = 100
Pragul de semnificaţie a = 005
Regiunea critică test bilateral (-yen -196 ]Egrave[196 yen)
28
Concluzia testului
Deoarece parametrul statistic calculat al testului nu aparţine regiunii critice se acceptă ipoteza
nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat faţă de
frecvenţa hepatitei B icircn populaţia generală
Testul McNemar
Evaluarea dependenţei variabilelor calitative perechi (dorim să determinăm dacă o anumită
caracteristică este sau nu asociată cu o anumită patologie)
Identificăm n pacienţi care prezintă patologia de interes (eg Cancer bronho-pulmonar) şi n
pacienţi cu aceleaşi caracteristici ca şi primul grup dar care nu o prezintă
Martor = da Martor = nu
Caz = da a b
Caz = nu c d
Testul McNemar - exemplu fumat vs cancer
Martor = da Martor = nu
Cancer = da a = 2 b = 5
Cancer = nu c = 0 d = 3
29
χ2critic(α=005) = 384
32 lt 384 rarr acceptăm ipoteza nulă
Fumatul nu este icircn relaţie cu apariţia cancerului bronho-pulmonar
Inferenţa statistică pe date cantitative
Variabile cantitative continue
Testul z şi Student (t) (o medie sau medii perechi)
Testul z şi Student (t) (testarea a două medii)
ANOVA (ge 3 medii)
Ranguri (variabile cantitative discrete sau cantitative care nu icircndeplinesc condiţia de
normalitate)
Testul sumei rangurilor Wilcoxon
Kruskal-Wallis (ge 3 eşantioane independente)
Friedman (ge 3 eşantioane dependente)
Teste de normalitate variabile cantitative continue
Shapiro-Wilk
Kolmogorov-Smirnov
Shapiro-Wilk
Chi-Square Goodness-of-Fit
Dacă datele urmează o distribuţie normală aplicăm un test parametric
Dacă datele nu urmează o distribuţie normală aplicăm un test de comparare al rangurilor
30
Testul Z de comparare a mediei unui eşantion cu media unei populaţii
Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ
extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie
s2 care se cunoaşte
Condiţii de aplicare
1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru
compararea mediei unui eşantion cu media unei populaţii)
2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal
distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă
3 Talia eşantionului este mare ( ge 30)
Ipoteze
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media
eşantionului şi media populaţiei
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
(-yen -196 ] Egrave [196 yen)
Parametrul testului
n = volumul eşantionului
= media eşantionului
s = deviaţia standard a populaţiei
Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)
Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard
cunoscută
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi
media standard
Condiţii de aplicare
Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se
realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această
condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea
31
Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai
puternic
Numărul de grade de libertate (df) df = n-1
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
Parametrul testului
n = volumul eşantionului
micro0 = media standard
= media eşantionului
s = deviaţia standard a eşantionului
Testul ANOVA compararea mediilor a mai multe eşantioane
H0 = toate mediile sunt egale
H1 = nu toate mediile sunt egale
Condiţii de aplicare
1 Datele sunt independente unele faţă de celelalte
2 Datele fiecărui grup sunt normal distribuite
3 Deviaţia standard este aceeaşi pentru toate grupurile
Id Medicament
A B C D E F
1 5 6 7 10 5 9
2 6 8 8 11 8 8
3 7 7 9 13 6 7
4 8 9 11 12 4 5
32
5 9 10 10 9 7 6
Suma 35 40 45 55 30 35
Media 7 8 9 11 6 7
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =
= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)
Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2
F = (suma pătratelor(icircntre))(suma pătratelor(icircn))
Suma pătratelor (icircntre) = 16times5 = 80
Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60
Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn
interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare
SP df Media pătratelor F = MPicircntreMPicircn
Icircntre 80 5 = 805 = 16 = 1625 = 64
Icircn 60 24 = 6024 = 25
Total 140 29 -
Testul sumei rangurilor Wilcoxon
Aplicat pentru
Un set de observaţii provenite dintr-o valoare ipotetică comună
Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)
Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero
Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace
Suma rangurilor pentru diferenţele negative = 2+3+1 = 6
Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30
33
Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului
egal cu 8 = 0109
Icircnainte După Diferenţa Rang
64 66 -2 2
66 58 8 5
67 68 -1 3
71 65 6 4
72 75 -3 1
76 67 9 6
78 59 19 8
89 74 15 7
Testul Kruskal-Wallis (ge 3 eşantioane independente)
Test de ranguri aplicate pe mai mult de 3 eşantioane
H = parametrul testului
n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)
Tk = suma rangurilor
Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie
pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni
34
df = k-1 (k = numărul de eşantioane)
df = 3-1 = 2
Hcritic(α=005) = 599
H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie
pozitivă şi respectiv biopsie negativă
Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie
a tipului de studiu pe eşantioane perechi)
1 Definirea numărului de tratamente k
2 Obţinerea rangurilor pentru fiecare tratament
3 Sumarea rangurilor fiecărui tratament
4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)
5 Dacă Fr gt Frcritic rarr respingem H0
Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost
măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi
n = 9 k = 3 T12 = 225 T2
2 = 38025 T32 = 38025
Frcritic = 599
Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de
prostată
35
De reţinut
Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei
Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-
of-Fit
Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z
Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t
Compararea mediilor a 3 sau mai multe eşantioane ANOVA
Compararea mediilor a două populaţii (σ) testul Z
Compararea mediilor a două eşantioane (s) testul t
Compararea mediilor a două eşantioane perechi (s) testul t
ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi
cu cel pentru compararea a două eşantioane perechi
Ranguri
Distribuţia datelor nu are importanţă
Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)
Trei sau mai multe eşantioane Kruskal-Wallis
Trei sau mai multe eşantioane perechi Friedman
Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia
Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a
datelor)
Variabile nominale
Un singur eşantion sau eşantioane perechi
Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte
Eşantioane perechi testul Mc Nemar
Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2
Icircn analiza proporţiilor există teste diferite pentru
Compararea unei frecvenţe cu o frecvenţă cunoscută
Compararea a două frecvenţe
Semnificaţia statistică
Valoarea p (p value)
Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor
două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E
posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării
aleatorii
36
Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală
urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii
Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este
probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un
experiment de dimensiunea acestuia
Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că
diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii
diferite
Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca
fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă
ar fi fost adevărată
Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă
1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe
baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De
fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001
2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie
3 Se aplică testul statistic aferent pentru a calcula valoarea p
4 Se compară valoarea p cu valoarea ndash prag
5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe
semnificativă dpdv statisticrdquo
6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e
semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să
conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă
Teste de semnificaţie
Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului
populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)
Testarea ipotezelor implică posibile erori
Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile
sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui
grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul
icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005
ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există
37
nici o diferenţă
Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ
statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de
ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost
ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau
dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă
cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă
semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe
ipotetice variate icircn cazul icircn care ele există
Măsuri ale frecvenţei
Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)
Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate
Generic formula pe care se bazează toate cele trei este
unde x şi y sunt cantităţile de comparat
Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea
unei frecvenţe pe grupe de sex vacircrstă etc
Proporţia implică icircn mod necesar ca x să fie inclus icircn y
Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară
frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp
Pentru calcularea unei rate trebuie ţinut cont de trei aspecte
bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin
bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp
bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo
Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un
tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei
populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei
aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)
38
Indicatori
Rata de incidenţă
Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă
icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii
Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o
perioadă de timp
Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de
timp x
Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei
susceptibili de a dezvolta icircmbolnăvirea studiată
Numitorul poate fi
bull Numărul mediu al populaţiei icircn perioada de timp studiată
bull Mărimea populaţiei icircn mijlocul perioadei de studiu
bull Mărimea populaţiei la icircnceputul studiului
Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă
Este obligatorie menţionarea perioadei de timp
Prevalenţa
Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la
un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă
schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa
momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)
39
Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include
numai cazuri noi respectiv include cazuri noi şi vechi
Rata de atac
Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este
folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp
raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori
Rata persoană-timp
Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din
momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte
migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost
observate
Riscul relativ (RR)
Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment
legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele
prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două
grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la
bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la
bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai
mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo
Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2
Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn
cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă
(Tabelul 1)
Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR
Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la
neexpuşi
40
Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de
culegere a datelor
Odds ratio (OR)
Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin
raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general
studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)
Tabelul 2 Tabelul 2 x 2 pentru calcularea OR
Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală
Rate de mortalitate
Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp
specificată Există mai multe tipuri de rate de mortalitate
o Mortalitate specifică pe sex
o Mortalitate specifică pe rasă
o Mortalitate specifică pe boală
o Mortalitate neonatală
o Mortalitate postneonatală
o Mortalitate infantilă
o Mortalitate maternă
Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP
41
Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de
viaţă şi vacircrsta la care survine decesul dacă este prematur
Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu
Ani de viaţă pierduţi datorat dizabilităţii
Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt
utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru
cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite
grupuri
Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de
risc şi o boală se folosesc riscul relativ şi odds ratio
35 Analiza şi interpretarea datelor
După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date
trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul
Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor
colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului
studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu
plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde
prezenţa biostatisticianului este necesară
Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu
elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat
iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului
iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate
depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori
testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere
clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza
Interpretarea rezultatelor statistice
Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne
motive (număr mic de date) acceptarea ei să fie falsă
Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine
gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia
ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument
de decizie Intervalul de confidenţă
42
Interpretarea statistica ne interpretarea clinică
Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă
Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice
obţinute pe eşantionul studiat
Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare
Ce interpretăm Rezultatele
personale obţinute icircn urma studiului
care au fost prezentate icircn secţiunea bdquoRezultaterdquo
Explicăm rezultatele obţinute
Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale
Interpretarea trebuie să se realizeze icircn
lumina limitelor studiului
contextul cultural social şi educaţional al locului unde s-a realizat cercetarea
contextul a ceea ce se cunoaşte din literatura de specialitate
Interpretăm doar rezultatele personale obţinute icircn urma studiului
Interpretarea statistică nu este tot una cu interpretarea clinică
Interpretarea statistică este importantă
Interpretarea clinică este foarte importantă
Intervalul de confidenţă
Media calculată pe baza unui eşantion nu va echivala media populaţiei
Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului
Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a
populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a
populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)
pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru
orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare
dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de
confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de
date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de
5
Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel
Dacă valoarea p este mică
Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare
aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o
medie diferită Diferenţa este semnificativă dpdv statistic
43
Icircn continuare
Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa
reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică
pentru a fi interesante din punct de vedere ştiinţific
Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC
oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care
este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a
obţine o concluzie clară
Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o
diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că
datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din
punct de vedere ştiinţific
Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul
detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat
Erorile studiilor medicale
Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura
anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară
caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea
asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri
legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias
Erorile potenţiale icircn studiile epidemiologice
1 Erori icircntacircmplătoare
2 Erori sistematice
3 Confuzia
4 Validitatea
1 Erori icircntacircmplătoare
Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a
parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel
de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot
fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii
(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor
de măsură (eroarea de măsurare)
44
2 Erori sistematice
Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate
care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu
acurateţe mare Acurateţea nu este afectată de mărimea eşantionului
Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de
experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea
dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus
şi greu de cuantificat (consum de alcool personalitate etc)
Principalele tipuri de erori din această categorie sunt
bull Biasul de selecţie
bull Biasul de informaţie
Biasul de selecţie
Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul
trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion
inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale
persoanelor incluse
Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se
ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia
Biasul de informaţie
Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de
instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze
expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere
nesemnificativă sau chiar să nu şi-o amintească de loc
3 Confuzia
Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune
prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este
cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă
de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte
important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor
protector
4 Validitatea
Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă
Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte
estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional
Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă
45
conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se
demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)
Validitatea externă se poate realiza numai dacă studiul este valid intern
Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii
studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de
studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt
laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi
validă din punct de vedere intern)
3 6 Prezentarea rezultatelor
După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite
Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor
icircntr-o formă bdquodigerabilărdquo este necesară
Scopul prezentării datelor
1 Transmiterea concluziilor studiului
a Datele corecte şi importante merită comunicate
b Datele trebuie să confirme sau să infirme ipoteza studiului
c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală
2 Acordarea posibilităţii altor cercetători să aprecieze studiul
a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti
b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor
prezentate
Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru
fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie
statistică
Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de
valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras
(Tabel 3)
Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)
46
Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct
numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor
precum şi prezentarea acestora sub formă inteligibilă
Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care
convin cercetătorului
Prezentarea datelor se poate face
1 Figuri şi tabele icircn articole scrise
2 Figuri şi tabele icircn prezentări orale
3 Figuri şi tabele icircn postere
4 Text scris sau incluse icircn text
5 Site-uri de WEB
Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor
Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie
Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele
exprimacircnd exact ceea ce acestea exprimă
Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate
anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel
să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se
acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca
mai sus sugestive sunt formatele simple şi puţin icircncărcate
Dacă nu există reguli impuse se respectă
1 Mesaj simplu fără falsificarea datelor
2 De obicei este necesar atacirct tabelul cacirct şi graficul
3 Să fie simplu şi clar
Tabele
Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile
coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică
elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de
1 Se folosesc doar linii orizontale
2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn
evidenţi prin linie de separare (Tabelul 4)
Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland
Noua Zeelandă)
(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)
47
3 Numerele sunt aliniate icircn funcţie de virgulă
4 Indicii statistici sunt explicaţi sub tabel
5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană
6 Abrevierile pot fi folosite
7 Numărul de zecimale trebuie limitat la maxim două
8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel
9 Plasarea legendei este obligatorie sub tabel
10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)
Icircn cazul prezentărilor orale sau a posterelor este indicat ca
1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării
2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte
3 Folosirea de simboluri este permisă
Clasificarea tabelelor
Tabelele se clasifică după
i) conţinut
bull cu distribuţii de frecvenţe
bull de clase de frecvenţe
bull de contingenţă
ii) structura
bull cu doua coloane
bull cu subclasificări
bull ldquomasterrdquo
Tabele ce conţin distribuţii de frecvenţe
O modalitate comodă de a prezenta o mulţime de date brute este
1 Se ordonează datele in ordine crescătoare
2 Se determine frecvenţa fiecărei valori
3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane
(Tabelul 5)
Tabelul 5 Distribuţii de frecvenţă absolută
48
Tabelul claselor de frecvenţe
1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă
2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)
Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)
Tabele de contingenţă
1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a
tabelelor de contingenţă
2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a
combinaţiilor de perechi ordonate de valori
3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre
a factor de risc si
b starea sănătăţii
4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)
5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)
Tabelul 7 Tabel de contingenţă 2 x 2
49
Grafice
Există două categorii de moduri grafice sub care se pot prezenta datele
1 Ilustraţii şi fotografii
2 Grafice
1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă
pentru lucrare
2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit
Putem vorbi despre mai multe tipuri de grafice
bull Grafice pentru reprezentarea datelor cantitative
1048707 Grafic cartezian (X Y)
1048707 Histograma
1048707 Poligonul de frecvenţe
1048707 Diagrama bdquoscatterrdquo
bull Grafice pentru reprezentarea datelor calitative
1048707 Grafic cu bare
1048707 Diagrama tip bdquoboxplotrdquo
1048707 Diagrama bdquopierdquo
1048707 Cartograma
Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi
dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)
Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)
Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie
Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)
Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)
50
Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir
de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele
două variabile studiate (Figura 6)
Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2
(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2
rămacircne aproximativ constantă)
Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea
comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea
comparativă a mai multor variabile
Figura 7 Grafic calitativ cu bare
51
Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo
Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două
posibilităţi reprezentate grafic este mai frecventă (Figura 8)
Figura 8 Reprezentare tip bdquopierdquo
Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli
sau a oricărui element comparativ Se foloseşte de epidemiologi
Rezultate
Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare
Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o
manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu
explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția
bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la
ilustraţii tabele grafice
Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi
nici rezultatele care invalidează eventual ipoteza
Discuţii
Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd
cultura ştiinţifică şi inteligenţa autorilor
Acest capitol răspunde la trei obiective
Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia
calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de
selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează
rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv
52
este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn
care a fost abordată problema fără a face o revistă a literaturii
Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea
rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul
Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor
afirmaţii nesusţinute de conţinutul lucrării
Concluzii
Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate
să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie
Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de
concluzii va scădea valoarea lucrării
Bibliografia (lista referinţelor citarea icircn text)
Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn
lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente
Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli
- să conţină cele mai importante şi recente lucrări
- să includă numai lucrări publicate
- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate
Bibliografie
Elisabeta Jaba ndash Statistică Ed Economică 1998
Mihai Ţarcă ndash Statistică volI Ed UAIC 1979
Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale
Ed University Press 2009
Sorana Daniela Bolboacă ndash Metodologia cercetării curs
53
Valorile pe care variabila le ia se constituie icircntr-o serie statistică Indicatorii care definesc o variabilă (serie)
sunt
1 Ale tendinţei centrale
Media aritmetică - notată de regulă cu
Mediana - este acea valoare din şirul de date care icircmparte icircn două părţi egale şirul ordonat de valori (atenţie
şirul este ordonat crescător) situacircndu-se la mijlocul seriei statistice
Dacă numărul de valori n este un număr impar atunci mediana este valoarea unde
Dacă n este par deci avem un număr par de valori mediana este definitatilde ca fiind
unde k = n2
Modul - constituie valoarea care apare cel mai des deci valoarea cu numărul cel mai mare de apariţii
2 De dispersie
Amplitudinea - este diferenţa dintre valoarea maximă şi cea minimă
A = Amax - Amin
Amplitudinea relativă - notată A este raportul dintre amplitudinea absolută şi media aritmetică a seriei de
date
Varianţa notată este un indicator de icircmprăştiere a datelor Formula de calcul este
Abaterea standard (S) sau deviaţia standard reprezintă rădăcina pătrată din varianţă (dispersie)
Coeficientul de variaţie se calculează ca un raport procentual icircntre abaterea standard şi valoarea medie a şirului
de valori
Eroarea standard intervine icircn estimarea intervalelor de confidenţă Se calculează astfel
17
3 De asimetrie (skewness) indică distribuţia datelor dacă sunt sau nu distribuite normal
4 De boltire (kurtosis) estimează boltirea sau aplatizarea curbei de distribuţie
Prezentarea descriptivă a datelor se face prin icircnregistrarea datelor culese icircn tabele care să reprezinte icircn mod
sintetic valorile măsurate
Icircn concluzie statistica descriptivă permite
bull Stabilirea comparabilităţii icircntre grupurile de studiu şi aprecierea prezenţei erorilor sau confuziei
bull Reprezentarea datelor icircn tabele permite evaluarea fiecărui pacient şi dacă a existat pierderi din studiu
Statistica inferenţială
Statistica inferenţială (inductivă) este partea de analiză a datelor care permite extrapolarea unei
concluzii trase pe baza unui eşantion spre populaţia ţintă pentru care a fost efectuat studiul
Scopul analizei statistice este de a evidenţia efectul unui tratament sau al unui factor de risc prin date obţinute
din eşantionul studiat spre populaţia ţintă Aceasta implică testarea ipotezelor statistice sau altfel spus testarea
semnificaţiei statistice Este una dintre cele mai importante momente ale studiului Cum rezultatele sunt
obţinute prin studiul unui eşantion există posibilitatea ca acestea să fie datorate icircntacircmplării Testele
statistice ne ajută să apreciem icircn ce măsură rezultatele sunt icircntacircmplătoare şi mai ales icircn ce măsură şi dacă se
pot aplica populaţiei generale Icircn acest scop se impune o valoare limită alfa 005 care reprezintă limita
superioară a probabilităţii ca rezultatul obţinut să fie greşit (datorat icircntacircmplării) Astfel icircn funcţie de tipul
variabilelor şi indicatorii descriptivi aplicaţi şi evaluaţi se aplică teste de semnificaţie statistică (Tabelul 1)
Tabelul 1 Alegerea testelor de semnificaţie statistică
Tipul datelor
18
Diferenţierea variabilelor din punctul de vedere a distribuţiei se face folosind testul de normalitate
Kolmogorov ndash Smirnov
Testul statistic reprezintă metoda de comparaţie a două sau mai multe populaţii prin intermediul unor
variabile observate ale lor
Scopul unui test statistic este de a defini realitatea
Definirea icircntrebării de cercetare (ipoteza clinică)
Tratamentul cu Nebivolol este la fel de eficient ca şi cel cu Valsartan icircn tratamentul
hipertensiunii arteriale
Transpunerea icircntrebării de cercetare icircn termeni statistici (ipoteza statistică)
Media tensiunii arteriale a pacienţilor trataţi cu Valsartan nu diferă semnificativ de media
tensiunii arteriale a pacienţilor trataţi cu Nebivolol
Etapele unui test statistic
1 Formularea problemei icircn termenii ipotezelor statistice
2 Alegerea şi calcularea parametrului statistic al testului
3 Regiunea critică
4 Concluzia testului
1 Formularea problemei icircn termenii ipotezelor statistice
Ipoteza nulă ipoteza care trebuie testată testul efectuacircndu-se sub prezumţia că ipoteza nulă ar
fi adevărată
Ipoteza alternativă acea ipoteză care icircntr-un sens sau altul contrazice ipoteza nulă Această
ipoteză se mai numeşte şi ipoteza de lucru
Ipoteza nulă tipuri
O coadă (ldquoone-tailedrdquo sau ldquoone-siderdquo)
Media este mai mare
Media este mai mică
Două cozi (ldquoone-tailedrdquo sau ldquoone-siderdquo)
Media este egală
2 Alegerea şi calcularea parametrului statistic al testului
Parametrul statistic al testului exprimă icircntr-o anumită formă diferenţa dintre elementele comparate
Ţinacircnd seama de faptul că eşantionul sau eşantioanele utilizate sunt aleator extrase din populaţiile care
fac obiectul testului parametrul statistic este o variabilă aleatoare de selecţie care urmează o anumită
lege de probabilitate
Un parametru statistic al testului bun trebuie să icircndeplinească două condiţii
19
Trebuie să se comporte diferit atunci cacircnd ipoteza nulă H0 este adevărată faţă de situaţia icircn
care ipoteza alternativă H1 este adevărată
Distribuţia de probabilitate a parametrului statistic al testului sub prezumţia că H0 este
adevărată este cunoscută
3 Regiunea critică
- Trebuie să fim capabili să decidem icircn funcţie de valoarea parametrului statistic calculat care dintre
ipoteze cea nulă sau cea alternativă este adevărată
- Dacă valoarea parametrului statistic aparţine regiunii critice ipoteza nulă H0 va fi respinsă şi va fi
acceptată ipoteza alternativă H1
- Dacă valoarea parametrului statistic nu aparţine regiunii critice ipoteza nulă H0 va fi acceptată
- Decidem mărimea regiunii critice
Pentru aceasta trebuie să specificăm mărimea riscului de eroare pe care icircl acceptăm
Pe scurt definim nivelul de semnificaţie notat cu a sau mărimea riscului pe care
suntem dispuşi să ni-l asumăm icircn respingerea ipotezei nule H0 icircn cazul icircn care aceasta
este adevărată De obicei se alege un nivel de semnificaţie icircntre 1 şi 5
Probabilitatea unei erori de tipul I
probabilitatea de respingere a ipotezei nule H0 icircn favoarea ipotezei alternative H1 icircn
condiţiile icircn care H0 este adevărată
probabilitatea unei erori de tipul I se notează cu a şi se mai numeşte nivel de
semnificaţie al testului
Probabilitatea unei erori de tipul II
probabilitatea acceptării ipotezei nule icircn condiţiile icircn care ipoteza alternativă H1 este
adevărată
această probabilitate se notează cu b
- Unilaterală la dreapta ndash valoarea parametrului statistic al testului este mai mare sau egală cu
valoarea din dreapta a intervalului critic
- Unilaterală la stacircnga ndash valoarea parametrului statistic al testului este mai mică sau egală cu
valoarea din stacircnga a intervalului critic
- Bilaterală ndash valoarea parametrului statistic al testului este mai mică sau egală cu valoarea extremă
din stacircnga regiunii critice sau mai mare sau egală cu valoarea extremă din dreapta regiunii critice
valorile extreme ale regiunii critice avacircnd nivele egale de semnificaţie
4 Concluzia testului
- Ipoteza nulă H0 este respinsă dacă valoarea parametrului statistic aparţine regiunii critice
20
- Regiunea critică trebuie astfel aleasă icircncacirct dacă ipoteza alternativă H1 este adevărată
probabilitatea de respingere a ipotezei nule H0 este mai mare decacirct icircn cazul icircn care ipoteza nulă H0
ar fi adevărată
- Acceptarea ipotezei nule H0 atunci cacircnd ipoteza alternativă H1 este adevărată este cunoscută ca şi
eroarea de tipul II
a probabilitatea ei se notează cu b
b măsoară bdquonivelul de eroarerdquo
- Icircn testarea oricărei ipoteze statistice există patru situaţii care determină dacă decizia noastră este
corectă sau nu
Cazuri
H0 este adevărată H0 este falsă
Concluzie H0 se acceptă decizie corectă eroare de tipul
II
H0 se
respinge
eroare de tipul I decizie corectă
Luarea deciziei pe baza valorii probabilităţii p de semnificaţie a testului
Icircn momentul icircn care prelucrăm statistic o serie de date dorim să ştim dacă rezultatele obţinute sunt sau
nu semnificative statistic
Răspunsul la această icircntrebare este dat de valoarea lui p calculată de orice program statistic la
prelucrarea unor date
Icircn cazul testelor statistice ipoteza nulă este respinsă dacă nivelul de semnificaţie este mai mic decacirct
005 iar programele de prelucrare statistică a datelor vor afişa o steluţă () icircn tabelul rezultatelor
21
Dacă p le 005 respingem ipoteza nulă şi acceptăm ipoteza alternativă (am obţinut semnificaţia
statistică)
Dacă p gt 005 acceptăm ipoteza nulă (nu am obţinut semnificaţia statistică)
p = 013
NU respingem ipoteza nulă
Risc de eroare de tip II
α = 005
p = 002
Respingem ipoteza nulă
Risc de eroare de tip I
Semnificaţia lui p
Criteriu de luare a deciziei cu privire la o ipoteză statistică nulă
Cuantifică şansa ca o decizie de respingere a ipotezei nule să fie greşită
Măsură a semnificaţiei statistice şi NU CLINICĂ
22
Semnificaţia lui p (reguli empirice)
001 le p lt 005 rezultatul e semnificativ statistic
0001 le p lt 001 rezultatul e icircnalt semnificativ statistic
p lt 0001 rezultatul e foarte icircnalt semnificativ statistic
p ge 005 rezultatul e considerat nesemnificativ statistic
Limite ale valorii p
Valoarea p NU ne dă informaţii despre
Şansa de beneficiu a unui pacient individual
Procentul de pacienţi care vor avea un beneficiu icircn urma instituirii procedurii medicale
Gradul de beneficiu expectat pentru un anumit pacient
Puterea unui test statistic
Este capacitatea de a detecta o diferenţă acolo unde există
Creşterea volumului eşantionului determină creşterea puterii testului statistic aplicat
Valoarea este icircn relaţie directă cu eroarea de tip II
Puterea = 1 ndash β
Cea mai utilizată modalitate de creştere a puterii unui test statistic este de a creşte volumul
eşantionului
Tipul scalei de măsură ndash testul statistic
Denumire test Interval Nominal Observaţii
Corelaţie Pearson 2 0 Există o relaţie liniară
χ2 0 2
Student 1 1 Doar 2 grupuri
ANOVA 1 1 2 sau mai multe grupuri
Student perechi 1 1 Eşantioane perechi
Măsurători repetate (ANOVA) 1 1 Mai mult de 2 grupuri date
perechi
Inferenţa statistică pe date calitativ e
Tabela de contingenţă 2times2
Riscuri şi raţii
Testul χ2 (testarea asocierii icircn tabela de contingenţă)
Testul Fisher
23
Testul z pentru proporţii
Testul McNemar
Tabela de contingenţă 2times2
Scale de tip nominal (dicotomiale tabela de contingenţă de 2times2) sau ordinal (tabela de contingenţă de
rtimesc)
Frecvenţa absolută (numărul de evenimente per categorie)
Tabela de contingenţă de 2times2 4 categorii
AP = adevărat pozitiv
FP = fals pozitiv
FN = fals negativ
AN = adevărat negativ
Ulcer deschis Ulcer vindecat Total
Recurenţă + AP = 1 FP = 5 = 1+5 = 6
Recurenţă - FN = 7 AN = 16 = 7+16 = 23
Total =1+7=8 =5+16=21 29
Riscuri şi raţii Mărimi ale asocierii
Denumire Formula Definiţie
Rata falşilor pozitivi =FP(FP+AN) Probabilitatea unui test fals + (α)
Rata falşilor negativi =FN(FN+AP) Probabilitatea unui test fals ndash (β)
Sensibilitate =AP(AP+FN) Probabilitatea unui test real + (1- β)
Specificitate =AN(AN+FP) Probabilitatea unui test real ndash (1- α)
Acurateţe =(AP+AN)n Probabilitatea generală a unei decizii corecte
Valoarea predictivă pozitivă =AP(AP+FP) Probabilitatea ca un test pozitiv să fie corect
Valoarea predictivă negativă =AN(AN+FN) Probabilitatea ca un test negativ să fie corect
Riscul relativ =AP(FP+AN)FN(AP+FP)
Rata şansei =(AP∙AN)(FN∙FP)
Riscul atribuabil =AP(AP+FP)-FN(FN+AN)
24
Denumire Formula
Rata falşilor pozitivi = 5(5+1) = 08334
Rata falşilor negativi = 7(7+16) = 03043
Sensibilitate = 1(1+7) = 01250
Specificitate = 16(16+5) = 07619
Acurateţe = (1+16)29 = 05862
Valoarea predictivă pozitivă = 1(1+5) = 01667
Valoarea predictivă negativă = 16(16+7) = 06957
Riscul relativ = 1(5+16)7(1+5) = 2142 = 050
Rata şansei = (1∙16)(7∙5) = 04571
Riscul atribuabil = 1(1+5)-7(7+16) = 01667-03043=-01376
Testarea asocierii icircn tabela de contingenţă
Testul χ2
Nu trebuie utilizat pentru eşantioane de volum mic
Testul este valid doar dacă valoarea expectată (aşteptată) pentru fiecare celulă este cel puţin
egală cu 1 şi frecvenţa absolută observată este de minim 5
Dacă aceste condiţii nu sunt icircndeplinite se aplică testul exact al lui Fisher (Fisherrsquos Exact Test)
Indică dacă cele două variabile sunt sau nu independente DAR NU cuantifică puterea asocierii
dintre ele
Problema S-a investigat icircntr-un studiu asocierea dintre obezitatea (ca factor de risc) şi bolile
cardio-vasculare la persoanele icircn etate (gt 60 ani) Din totalul de 620 persoane investigate s-au
identificat 150 persoane cu obezitate şi boală cardio-vasculară 230 persoane fără obezitate şi
fără boală cardio-vasculară şi 60 persoane fără obezitate dar cu boală cardio-vasculară Există
o asociere icircntre obezitate şi boala cardio-vasculară (df=1 α=005 χ2critic = 384)
Testul χ2 exemplu
H025
Nu există asociere icircntre obezitate şi bolile cardio-vasculare
Obezitatea şi bolile cardio-vasculare sunt independente
H1
Există asociere icircntre obezitate şi bolile cardio-vasculare
Obezitatea şi bolile cardio-vasculare sunt asociate
a = 005 pragul de semnificaţie al testului
urmează o lege cu (r-1)(c-1) grade de libertate
χ2 = parametrul testului χ2
fio = frecvenţa observată
fit = frecvenţa teoretică
Regiunea critică este [χα2 yen)
Pentru α = 005 χα2 = 384
OBSERVAT BCV+ BCV- Total
Obezitate + AP = 150 FP = 180 330
Obezitate - FN = 60 AN = 230 290
Total 210 410 620
TEORETIC BCV+ BCV- Total
Obezitate + = 330times210620 = 330times410620 330
Obezitate - = 290times210620 = 290times410620 290
Total 210 410 620
TEORETIC BCV+ BCV- Total
Obezitate + = 330times210620 = 330times410620 330
26
Obezitate - = 290times210620 = 290times410620 290
Total 210 410 620
TEORETIC BCV+ BCV-
Obezitate + = 112 = 218
Obezitate - = 98 = 192
Deoarece 4177Icirc[384 yen) se respinge H0 cu un risc de eroare de 5
Există asociere icircntre obezitate şi bolile cardio-vasculare
Testul Fisher
Corecţie a testului χ2
Valoarea p asociată parametrului ne dă probabilitatea ca valoarea observată de independenţă să fie
atribuită doar şansei
O valoare p mică indică că există alte cauze decacirct şansa influenţează rezultatul şi astfel cele două
variabile investigate nu sunt independente
Testul Fisher = dispersia corectată a factorului x dispersia corectată a factorilor reziduali
Icircn acest context regula adunării dispersiilor se poate scrie unde
este variaţia lui y pe seama variaţiei variabilei x
este variaţia lui y pe seama influenţei factorilor reziduali (neicircnregistraţi)
este variaţia totală a caracteristicii y
Testul Fisher empiric se calculează după formula
27
se compară cu Ftab pentru nx şi nz grade de libertate la un anumit prag de semnificaţie stabilit
Dacă Fc gt Ftab rezultă că variaţia factorului de grupare x este semnificativă pentru variaţia caracteristicii y
Testul z pentru proporţii
1 Compararea unei frecvenţe observate cu o frecvenţă teoretică
2 Testarea egalităţii a două frecvenţe
Testul z Compararea unei frecvenţe observate cu o frecvenţă teoretică
Scop Investigarea semnificaţiei diferenţei icircntre o frecvenţă teoretică p (icircntr-o populaţie) şi o frecvenţă
observată f pe un eşantion reprezentativ (variabilă calitativă (binare))
Condiţii de aplicare Testul este corect aplicat dacă numărul n al observaţiilor eşantionului este
suficient de mare (n∙p n∙(1-p)gt10
Parametrul
n = volumul eşantionului
Suntem interesaţi de investigarea prevalenţei hepatitei B la personalul care lucrează icircn laboratoarele
clinicilor de boli infecţioase din Transilvania Se ştie din studii anterioare că prevalenţa hepatitei B icircn
populaţia generală din Transilvania este de 9 S-a luat icircn studiu un eşantion de 100 persoane şi s-a
obţinut o prevalenţă a hepatitei B de 6 Există diferenţă semnificativă icircntre frecvenţa hepatitei B la
personalul care lucrează icircn laboratoarele spitalelor de boli infecţioase din Transilvania faţă de
populaţia generală
f = 006 p = 009 n = 100
Ipoteza nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat
faţă de frecvenţa hepatitei B icircn populaţia generală
Ipoteza alternativă test bilateral Există diferenţă semnificativă icircntre frecvenţa hepatitei B la
nivelul eşantionului şi prevalenţa hepatitei B icircn populaţia generală
f = 006 p = 009 n = 100
Pragul de semnificaţie a = 005
Regiunea critică test bilateral (-yen -196 ]Egrave[196 yen)
28
Concluzia testului
Deoarece parametrul statistic calculat al testului nu aparţine regiunii critice se acceptă ipoteza
nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat faţă de
frecvenţa hepatitei B icircn populaţia generală
Testul McNemar
Evaluarea dependenţei variabilelor calitative perechi (dorim să determinăm dacă o anumită
caracteristică este sau nu asociată cu o anumită patologie)
Identificăm n pacienţi care prezintă patologia de interes (eg Cancer bronho-pulmonar) şi n
pacienţi cu aceleaşi caracteristici ca şi primul grup dar care nu o prezintă
Martor = da Martor = nu
Caz = da a b
Caz = nu c d
Testul McNemar - exemplu fumat vs cancer
Martor = da Martor = nu
Cancer = da a = 2 b = 5
Cancer = nu c = 0 d = 3
29
χ2critic(α=005) = 384
32 lt 384 rarr acceptăm ipoteza nulă
Fumatul nu este icircn relaţie cu apariţia cancerului bronho-pulmonar
Inferenţa statistică pe date cantitative
Variabile cantitative continue
Testul z şi Student (t) (o medie sau medii perechi)
Testul z şi Student (t) (testarea a două medii)
ANOVA (ge 3 medii)
Ranguri (variabile cantitative discrete sau cantitative care nu icircndeplinesc condiţia de
normalitate)
Testul sumei rangurilor Wilcoxon
Kruskal-Wallis (ge 3 eşantioane independente)
Friedman (ge 3 eşantioane dependente)
Teste de normalitate variabile cantitative continue
Shapiro-Wilk
Kolmogorov-Smirnov
Shapiro-Wilk
Chi-Square Goodness-of-Fit
Dacă datele urmează o distribuţie normală aplicăm un test parametric
Dacă datele nu urmează o distribuţie normală aplicăm un test de comparare al rangurilor
30
Testul Z de comparare a mediei unui eşantion cu media unei populaţii
Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ
extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie
s2 care se cunoaşte
Condiţii de aplicare
1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru
compararea mediei unui eşantion cu media unei populaţii)
2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal
distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă
3 Talia eşantionului este mare ( ge 30)
Ipoteze
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media
eşantionului şi media populaţiei
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
(-yen -196 ] Egrave [196 yen)
Parametrul testului
n = volumul eşantionului
= media eşantionului
s = deviaţia standard a populaţiei
Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)
Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard
cunoscută
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi
media standard
Condiţii de aplicare
Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se
realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această
condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea
31
Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai
puternic
Numărul de grade de libertate (df) df = n-1
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
Parametrul testului
n = volumul eşantionului
micro0 = media standard
= media eşantionului
s = deviaţia standard a eşantionului
Testul ANOVA compararea mediilor a mai multe eşantioane
H0 = toate mediile sunt egale
H1 = nu toate mediile sunt egale
Condiţii de aplicare
1 Datele sunt independente unele faţă de celelalte
2 Datele fiecărui grup sunt normal distribuite
3 Deviaţia standard este aceeaşi pentru toate grupurile
Id Medicament
A B C D E F
1 5 6 7 10 5 9
2 6 8 8 11 8 8
3 7 7 9 13 6 7
4 8 9 11 12 4 5
32
5 9 10 10 9 7 6
Suma 35 40 45 55 30 35
Media 7 8 9 11 6 7
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =
= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)
Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2
F = (suma pătratelor(icircntre))(suma pătratelor(icircn))
Suma pătratelor (icircntre) = 16times5 = 80
Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60
Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn
interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare
SP df Media pătratelor F = MPicircntreMPicircn
Icircntre 80 5 = 805 = 16 = 1625 = 64
Icircn 60 24 = 6024 = 25
Total 140 29 -
Testul sumei rangurilor Wilcoxon
Aplicat pentru
Un set de observaţii provenite dintr-o valoare ipotetică comună
Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)
Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero
Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace
Suma rangurilor pentru diferenţele negative = 2+3+1 = 6
Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30
33
Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului
egal cu 8 = 0109
Icircnainte După Diferenţa Rang
64 66 -2 2
66 58 8 5
67 68 -1 3
71 65 6 4
72 75 -3 1
76 67 9 6
78 59 19 8
89 74 15 7
Testul Kruskal-Wallis (ge 3 eşantioane independente)
Test de ranguri aplicate pe mai mult de 3 eşantioane
H = parametrul testului
n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)
Tk = suma rangurilor
Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie
pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni
34
df = k-1 (k = numărul de eşantioane)
df = 3-1 = 2
Hcritic(α=005) = 599
H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie
pozitivă şi respectiv biopsie negativă
Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie
a tipului de studiu pe eşantioane perechi)
1 Definirea numărului de tratamente k
2 Obţinerea rangurilor pentru fiecare tratament
3 Sumarea rangurilor fiecărui tratament
4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)
5 Dacă Fr gt Frcritic rarr respingem H0
Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost
măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi
n = 9 k = 3 T12 = 225 T2
2 = 38025 T32 = 38025
Frcritic = 599
Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de
prostată
35
De reţinut
Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei
Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-
of-Fit
Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z
Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t
Compararea mediilor a 3 sau mai multe eşantioane ANOVA
Compararea mediilor a două populaţii (σ) testul Z
Compararea mediilor a două eşantioane (s) testul t
Compararea mediilor a două eşantioane perechi (s) testul t
ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi
cu cel pentru compararea a două eşantioane perechi
Ranguri
Distribuţia datelor nu are importanţă
Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)
Trei sau mai multe eşantioane Kruskal-Wallis
Trei sau mai multe eşantioane perechi Friedman
Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia
Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a
datelor)
Variabile nominale
Un singur eşantion sau eşantioane perechi
Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte
Eşantioane perechi testul Mc Nemar
Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2
Icircn analiza proporţiilor există teste diferite pentru
Compararea unei frecvenţe cu o frecvenţă cunoscută
Compararea a două frecvenţe
Semnificaţia statistică
Valoarea p (p value)
Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor
două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E
posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării
aleatorii
36
Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală
urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii
Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este
probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un
experiment de dimensiunea acestuia
Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că
diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii
diferite
Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca
fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă
ar fi fost adevărată
Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă
1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe
baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De
fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001
2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie
3 Se aplică testul statistic aferent pentru a calcula valoarea p
4 Se compară valoarea p cu valoarea ndash prag
5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe
semnificativă dpdv statisticrdquo
6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e
semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să
conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă
Teste de semnificaţie
Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului
populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)
Testarea ipotezelor implică posibile erori
Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile
sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui
grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul
icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005
ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există
37
nici o diferenţă
Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ
statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de
ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost
ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau
dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă
cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă
semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe
ipotetice variate icircn cazul icircn care ele există
Măsuri ale frecvenţei
Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)
Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate
Generic formula pe care se bazează toate cele trei este
unde x şi y sunt cantităţile de comparat
Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea
unei frecvenţe pe grupe de sex vacircrstă etc
Proporţia implică icircn mod necesar ca x să fie inclus icircn y
Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară
frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp
Pentru calcularea unei rate trebuie ţinut cont de trei aspecte
bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin
bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp
bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo
Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un
tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei
populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei
aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)
38
Indicatori
Rata de incidenţă
Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă
icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii
Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o
perioadă de timp
Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de
timp x
Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei
susceptibili de a dezvolta icircmbolnăvirea studiată
Numitorul poate fi
bull Numărul mediu al populaţiei icircn perioada de timp studiată
bull Mărimea populaţiei icircn mijlocul perioadei de studiu
bull Mărimea populaţiei la icircnceputul studiului
Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă
Este obligatorie menţionarea perioadei de timp
Prevalenţa
Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la
un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă
schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa
momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)
39
Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include
numai cazuri noi respectiv include cazuri noi şi vechi
Rata de atac
Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este
folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp
raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori
Rata persoană-timp
Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din
momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte
migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost
observate
Riscul relativ (RR)
Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment
legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele
prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două
grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la
bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la
bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai
mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo
Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2
Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn
cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă
(Tabelul 1)
Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR
Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la
neexpuşi
40
Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de
culegere a datelor
Odds ratio (OR)
Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin
raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general
studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)
Tabelul 2 Tabelul 2 x 2 pentru calcularea OR
Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală
Rate de mortalitate
Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp
specificată Există mai multe tipuri de rate de mortalitate
o Mortalitate specifică pe sex
o Mortalitate specifică pe rasă
o Mortalitate specifică pe boală
o Mortalitate neonatală
o Mortalitate postneonatală
o Mortalitate infantilă
o Mortalitate maternă
Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP
41
Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de
viaţă şi vacircrsta la care survine decesul dacă este prematur
Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu
Ani de viaţă pierduţi datorat dizabilităţii
Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt
utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru
cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite
grupuri
Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de
risc şi o boală se folosesc riscul relativ şi odds ratio
35 Analiza şi interpretarea datelor
După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date
trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul
Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor
colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului
studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu
plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde
prezenţa biostatisticianului este necesară
Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu
elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat
iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului
iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate
depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori
testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere
clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza
Interpretarea rezultatelor statistice
Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne
motive (număr mic de date) acceptarea ei să fie falsă
Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine
gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia
ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument
de decizie Intervalul de confidenţă
42
Interpretarea statistica ne interpretarea clinică
Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă
Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice
obţinute pe eşantionul studiat
Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare
Ce interpretăm Rezultatele
personale obţinute icircn urma studiului
care au fost prezentate icircn secţiunea bdquoRezultaterdquo
Explicăm rezultatele obţinute
Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale
Interpretarea trebuie să se realizeze icircn
lumina limitelor studiului
contextul cultural social şi educaţional al locului unde s-a realizat cercetarea
contextul a ceea ce se cunoaşte din literatura de specialitate
Interpretăm doar rezultatele personale obţinute icircn urma studiului
Interpretarea statistică nu este tot una cu interpretarea clinică
Interpretarea statistică este importantă
Interpretarea clinică este foarte importantă
Intervalul de confidenţă
Media calculată pe baza unui eşantion nu va echivala media populaţiei
Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului
Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a
populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a
populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)
pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru
orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare
dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de
confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de
date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de
5
Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel
Dacă valoarea p este mică
Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare
aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o
medie diferită Diferenţa este semnificativă dpdv statistic
43
Icircn continuare
Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa
reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică
pentru a fi interesante din punct de vedere ştiinţific
Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC
oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care
este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a
obţine o concluzie clară
Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o
diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că
datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din
punct de vedere ştiinţific
Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul
detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat
Erorile studiilor medicale
Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura
anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară
caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea
asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri
legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias
Erorile potenţiale icircn studiile epidemiologice
1 Erori icircntacircmplătoare
2 Erori sistematice
3 Confuzia
4 Validitatea
1 Erori icircntacircmplătoare
Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a
parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel
de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot
fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii
(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor
de măsură (eroarea de măsurare)
44
2 Erori sistematice
Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate
care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu
acurateţe mare Acurateţea nu este afectată de mărimea eşantionului
Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de
experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea
dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus
şi greu de cuantificat (consum de alcool personalitate etc)
Principalele tipuri de erori din această categorie sunt
bull Biasul de selecţie
bull Biasul de informaţie
Biasul de selecţie
Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul
trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion
inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale
persoanelor incluse
Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se
ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia
Biasul de informaţie
Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de
instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze
expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere
nesemnificativă sau chiar să nu şi-o amintească de loc
3 Confuzia
Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune
prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este
cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă
de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte
important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor
protector
4 Validitatea
Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă
Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte
estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional
Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă
45
conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se
demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)
Validitatea externă se poate realiza numai dacă studiul este valid intern
Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii
studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de
studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt
laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi
validă din punct de vedere intern)
3 6 Prezentarea rezultatelor
După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite
Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor
icircntr-o formă bdquodigerabilărdquo este necesară
Scopul prezentării datelor
1 Transmiterea concluziilor studiului
a Datele corecte şi importante merită comunicate
b Datele trebuie să confirme sau să infirme ipoteza studiului
c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală
2 Acordarea posibilităţii altor cercetători să aprecieze studiul
a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti
b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor
prezentate
Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru
fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie
statistică
Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de
valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras
(Tabel 3)
Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)
46
Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct
numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor
precum şi prezentarea acestora sub formă inteligibilă
Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care
convin cercetătorului
Prezentarea datelor se poate face
1 Figuri şi tabele icircn articole scrise
2 Figuri şi tabele icircn prezentări orale
3 Figuri şi tabele icircn postere
4 Text scris sau incluse icircn text
5 Site-uri de WEB
Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor
Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie
Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele
exprimacircnd exact ceea ce acestea exprimă
Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate
anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel
să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se
acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca
mai sus sugestive sunt formatele simple şi puţin icircncărcate
Dacă nu există reguli impuse se respectă
1 Mesaj simplu fără falsificarea datelor
2 De obicei este necesar atacirct tabelul cacirct şi graficul
3 Să fie simplu şi clar
Tabele
Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile
coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică
elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de
1 Se folosesc doar linii orizontale
2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn
evidenţi prin linie de separare (Tabelul 4)
Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland
Noua Zeelandă)
(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)
47
3 Numerele sunt aliniate icircn funcţie de virgulă
4 Indicii statistici sunt explicaţi sub tabel
5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană
6 Abrevierile pot fi folosite
7 Numărul de zecimale trebuie limitat la maxim două
8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel
9 Plasarea legendei este obligatorie sub tabel
10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)
Icircn cazul prezentărilor orale sau a posterelor este indicat ca
1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării
2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte
3 Folosirea de simboluri este permisă
Clasificarea tabelelor
Tabelele se clasifică după
i) conţinut
bull cu distribuţii de frecvenţe
bull de clase de frecvenţe
bull de contingenţă
ii) structura
bull cu doua coloane
bull cu subclasificări
bull ldquomasterrdquo
Tabele ce conţin distribuţii de frecvenţe
O modalitate comodă de a prezenta o mulţime de date brute este
1 Se ordonează datele in ordine crescătoare
2 Se determine frecvenţa fiecărei valori
3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane
(Tabelul 5)
Tabelul 5 Distribuţii de frecvenţă absolută
48
Tabelul claselor de frecvenţe
1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă
2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)
Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)
Tabele de contingenţă
1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a
tabelelor de contingenţă
2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a
combinaţiilor de perechi ordonate de valori
3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre
a factor de risc si
b starea sănătăţii
4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)
5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)
Tabelul 7 Tabel de contingenţă 2 x 2
49
Grafice
Există două categorii de moduri grafice sub care se pot prezenta datele
1 Ilustraţii şi fotografii
2 Grafice
1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă
pentru lucrare
2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit
Putem vorbi despre mai multe tipuri de grafice
bull Grafice pentru reprezentarea datelor cantitative
1048707 Grafic cartezian (X Y)
1048707 Histograma
1048707 Poligonul de frecvenţe
1048707 Diagrama bdquoscatterrdquo
bull Grafice pentru reprezentarea datelor calitative
1048707 Grafic cu bare
1048707 Diagrama tip bdquoboxplotrdquo
1048707 Diagrama bdquopierdquo
1048707 Cartograma
Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi
dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)
Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)
Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie
Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)
Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)
50
Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir
de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele
două variabile studiate (Figura 6)
Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2
(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2
rămacircne aproximativ constantă)
Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea
comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea
comparativă a mai multor variabile
Figura 7 Grafic calitativ cu bare
51
Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo
Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două
posibilităţi reprezentate grafic este mai frecventă (Figura 8)
Figura 8 Reprezentare tip bdquopierdquo
Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli
sau a oricărui element comparativ Se foloseşte de epidemiologi
Rezultate
Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare
Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o
manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu
explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția
bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la
ilustraţii tabele grafice
Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi
nici rezultatele care invalidează eventual ipoteza
Discuţii
Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd
cultura ştiinţifică şi inteligenţa autorilor
Acest capitol răspunde la trei obiective
Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia
calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de
selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează
rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv
52
este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn
care a fost abordată problema fără a face o revistă a literaturii
Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea
rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul
Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor
afirmaţii nesusţinute de conţinutul lucrării
Concluzii
Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate
să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie
Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de
concluzii va scădea valoarea lucrării
Bibliografia (lista referinţelor citarea icircn text)
Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn
lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente
Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli
- să conţină cele mai importante şi recente lucrări
- să includă numai lucrări publicate
- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate
Bibliografie
Elisabeta Jaba ndash Statistică Ed Economică 1998
Mihai Ţarcă ndash Statistică volI Ed UAIC 1979
Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale
Ed University Press 2009
Sorana Daniela Bolboacă ndash Metodologia cercetării curs
53
3 De asimetrie (skewness) indică distribuţia datelor dacă sunt sau nu distribuite normal
4 De boltire (kurtosis) estimează boltirea sau aplatizarea curbei de distribuţie
Prezentarea descriptivă a datelor se face prin icircnregistrarea datelor culese icircn tabele care să reprezinte icircn mod
sintetic valorile măsurate
Icircn concluzie statistica descriptivă permite
bull Stabilirea comparabilităţii icircntre grupurile de studiu şi aprecierea prezenţei erorilor sau confuziei
bull Reprezentarea datelor icircn tabele permite evaluarea fiecărui pacient şi dacă a existat pierderi din studiu
Statistica inferenţială
Statistica inferenţială (inductivă) este partea de analiză a datelor care permite extrapolarea unei
concluzii trase pe baza unui eşantion spre populaţia ţintă pentru care a fost efectuat studiul
Scopul analizei statistice este de a evidenţia efectul unui tratament sau al unui factor de risc prin date obţinute
din eşantionul studiat spre populaţia ţintă Aceasta implică testarea ipotezelor statistice sau altfel spus testarea
semnificaţiei statistice Este una dintre cele mai importante momente ale studiului Cum rezultatele sunt
obţinute prin studiul unui eşantion există posibilitatea ca acestea să fie datorate icircntacircmplării Testele
statistice ne ajută să apreciem icircn ce măsură rezultatele sunt icircntacircmplătoare şi mai ales icircn ce măsură şi dacă se
pot aplica populaţiei generale Icircn acest scop se impune o valoare limită alfa 005 care reprezintă limita
superioară a probabilităţii ca rezultatul obţinut să fie greşit (datorat icircntacircmplării) Astfel icircn funcţie de tipul
variabilelor şi indicatorii descriptivi aplicaţi şi evaluaţi se aplică teste de semnificaţie statistică (Tabelul 1)
Tabelul 1 Alegerea testelor de semnificaţie statistică
Tipul datelor
18
Diferenţierea variabilelor din punctul de vedere a distribuţiei se face folosind testul de normalitate
Kolmogorov ndash Smirnov
Testul statistic reprezintă metoda de comparaţie a două sau mai multe populaţii prin intermediul unor
variabile observate ale lor
Scopul unui test statistic este de a defini realitatea
Definirea icircntrebării de cercetare (ipoteza clinică)
Tratamentul cu Nebivolol este la fel de eficient ca şi cel cu Valsartan icircn tratamentul
hipertensiunii arteriale
Transpunerea icircntrebării de cercetare icircn termeni statistici (ipoteza statistică)
Media tensiunii arteriale a pacienţilor trataţi cu Valsartan nu diferă semnificativ de media
tensiunii arteriale a pacienţilor trataţi cu Nebivolol
Etapele unui test statistic
1 Formularea problemei icircn termenii ipotezelor statistice
2 Alegerea şi calcularea parametrului statistic al testului
3 Regiunea critică
4 Concluzia testului
1 Formularea problemei icircn termenii ipotezelor statistice
Ipoteza nulă ipoteza care trebuie testată testul efectuacircndu-se sub prezumţia că ipoteza nulă ar
fi adevărată
Ipoteza alternativă acea ipoteză care icircntr-un sens sau altul contrazice ipoteza nulă Această
ipoteză se mai numeşte şi ipoteza de lucru
Ipoteza nulă tipuri
O coadă (ldquoone-tailedrdquo sau ldquoone-siderdquo)
Media este mai mare
Media este mai mică
Două cozi (ldquoone-tailedrdquo sau ldquoone-siderdquo)
Media este egală
2 Alegerea şi calcularea parametrului statistic al testului
Parametrul statistic al testului exprimă icircntr-o anumită formă diferenţa dintre elementele comparate
Ţinacircnd seama de faptul că eşantionul sau eşantioanele utilizate sunt aleator extrase din populaţiile care
fac obiectul testului parametrul statistic este o variabilă aleatoare de selecţie care urmează o anumită
lege de probabilitate
Un parametru statistic al testului bun trebuie să icircndeplinească două condiţii
19
Trebuie să se comporte diferit atunci cacircnd ipoteza nulă H0 este adevărată faţă de situaţia icircn
care ipoteza alternativă H1 este adevărată
Distribuţia de probabilitate a parametrului statistic al testului sub prezumţia că H0 este
adevărată este cunoscută
3 Regiunea critică
- Trebuie să fim capabili să decidem icircn funcţie de valoarea parametrului statistic calculat care dintre
ipoteze cea nulă sau cea alternativă este adevărată
- Dacă valoarea parametrului statistic aparţine regiunii critice ipoteza nulă H0 va fi respinsă şi va fi
acceptată ipoteza alternativă H1
- Dacă valoarea parametrului statistic nu aparţine regiunii critice ipoteza nulă H0 va fi acceptată
- Decidem mărimea regiunii critice
Pentru aceasta trebuie să specificăm mărimea riscului de eroare pe care icircl acceptăm
Pe scurt definim nivelul de semnificaţie notat cu a sau mărimea riscului pe care
suntem dispuşi să ni-l asumăm icircn respingerea ipotezei nule H0 icircn cazul icircn care aceasta
este adevărată De obicei se alege un nivel de semnificaţie icircntre 1 şi 5
Probabilitatea unei erori de tipul I
probabilitatea de respingere a ipotezei nule H0 icircn favoarea ipotezei alternative H1 icircn
condiţiile icircn care H0 este adevărată
probabilitatea unei erori de tipul I se notează cu a şi se mai numeşte nivel de
semnificaţie al testului
Probabilitatea unei erori de tipul II
probabilitatea acceptării ipotezei nule icircn condiţiile icircn care ipoteza alternativă H1 este
adevărată
această probabilitate se notează cu b
- Unilaterală la dreapta ndash valoarea parametrului statistic al testului este mai mare sau egală cu
valoarea din dreapta a intervalului critic
- Unilaterală la stacircnga ndash valoarea parametrului statistic al testului este mai mică sau egală cu
valoarea din stacircnga a intervalului critic
- Bilaterală ndash valoarea parametrului statistic al testului este mai mică sau egală cu valoarea extremă
din stacircnga regiunii critice sau mai mare sau egală cu valoarea extremă din dreapta regiunii critice
valorile extreme ale regiunii critice avacircnd nivele egale de semnificaţie
4 Concluzia testului
- Ipoteza nulă H0 este respinsă dacă valoarea parametrului statistic aparţine regiunii critice
20
- Regiunea critică trebuie astfel aleasă icircncacirct dacă ipoteza alternativă H1 este adevărată
probabilitatea de respingere a ipotezei nule H0 este mai mare decacirct icircn cazul icircn care ipoteza nulă H0
ar fi adevărată
- Acceptarea ipotezei nule H0 atunci cacircnd ipoteza alternativă H1 este adevărată este cunoscută ca şi
eroarea de tipul II
a probabilitatea ei se notează cu b
b măsoară bdquonivelul de eroarerdquo
- Icircn testarea oricărei ipoteze statistice există patru situaţii care determină dacă decizia noastră este
corectă sau nu
Cazuri
H0 este adevărată H0 este falsă
Concluzie H0 se acceptă decizie corectă eroare de tipul
II
H0 se
respinge
eroare de tipul I decizie corectă
Luarea deciziei pe baza valorii probabilităţii p de semnificaţie a testului
Icircn momentul icircn care prelucrăm statistic o serie de date dorim să ştim dacă rezultatele obţinute sunt sau
nu semnificative statistic
Răspunsul la această icircntrebare este dat de valoarea lui p calculată de orice program statistic la
prelucrarea unor date
Icircn cazul testelor statistice ipoteza nulă este respinsă dacă nivelul de semnificaţie este mai mic decacirct
005 iar programele de prelucrare statistică a datelor vor afişa o steluţă () icircn tabelul rezultatelor
21
Dacă p le 005 respingem ipoteza nulă şi acceptăm ipoteza alternativă (am obţinut semnificaţia
statistică)
Dacă p gt 005 acceptăm ipoteza nulă (nu am obţinut semnificaţia statistică)
p = 013
NU respingem ipoteza nulă
Risc de eroare de tip II
α = 005
p = 002
Respingem ipoteza nulă
Risc de eroare de tip I
Semnificaţia lui p
Criteriu de luare a deciziei cu privire la o ipoteză statistică nulă
Cuantifică şansa ca o decizie de respingere a ipotezei nule să fie greşită
Măsură a semnificaţiei statistice şi NU CLINICĂ
22
Semnificaţia lui p (reguli empirice)
001 le p lt 005 rezultatul e semnificativ statistic
0001 le p lt 001 rezultatul e icircnalt semnificativ statistic
p lt 0001 rezultatul e foarte icircnalt semnificativ statistic
p ge 005 rezultatul e considerat nesemnificativ statistic
Limite ale valorii p
Valoarea p NU ne dă informaţii despre
Şansa de beneficiu a unui pacient individual
Procentul de pacienţi care vor avea un beneficiu icircn urma instituirii procedurii medicale
Gradul de beneficiu expectat pentru un anumit pacient
Puterea unui test statistic
Este capacitatea de a detecta o diferenţă acolo unde există
Creşterea volumului eşantionului determină creşterea puterii testului statistic aplicat
Valoarea este icircn relaţie directă cu eroarea de tip II
Puterea = 1 ndash β
Cea mai utilizată modalitate de creştere a puterii unui test statistic este de a creşte volumul
eşantionului
Tipul scalei de măsură ndash testul statistic
Denumire test Interval Nominal Observaţii
Corelaţie Pearson 2 0 Există o relaţie liniară
χ2 0 2
Student 1 1 Doar 2 grupuri
ANOVA 1 1 2 sau mai multe grupuri
Student perechi 1 1 Eşantioane perechi
Măsurători repetate (ANOVA) 1 1 Mai mult de 2 grupuri date
perechi
Inferenţa statistică pe date calitativ e
Tabela de contingenţă 2times2
Riscuri şi raţii
Testul χ2 (testarea asocierii icircn tabela de contingenţă)
Testul Fisher
23
Testul z pentru proporţii
Testul McNemar
Tabela de contingenţă 2times2
Scale de tip nominal (dicotomiale tabela de contingenţă de 2times2) sau ordinal (tabela de contingenţă de
rtimesc)
Frecvenţa absolută (numărul de evenimente per categorie)
Tabela de contingenţă de 2times2 4 categorii
AP = adevărat pozitiv
FP = fals pozitiv
FN = fals negativ
AN = adevărat negativ
Ulcer deschis Ulcer vindecat Total
Recurenţă + AP = 1 FP = 5 = 1+5 = 6
Recurenţă - FN = 7 AN = 16 = 7+16 = 23
Total =1+7=8 =5+16=21 29
Riscuri şi raţii Mărimi ale asocierii
Denumire Formula Definiţie
Rata falşilor pozitivi =FP(FP+AN) Probabilitatea unui test fals + (α)
Rata falşilor negativi =FN(FN+AP) Probabilitatea unui test fals ndash (β)
Sensibilitate =AP(AP+FN) Probabilitatea unui test real + (1- β)
Specificitate =AN(AN+FP) Probabilitatea unui test real ndash (1- α)
Acurateţe =(AP+AN)n Probabilitatea generală a unei decizii corecte
Valoarea predictivă pozitivă =AP(AP+FP) Probabilitatea ca un test pozitiv să fie corect
Valoarea predictivă negativă =AN(AN+FN) Probabilitatea ca un test negativ să fie corect
Riscul relativ =AP(FP+AN)FN(AP+FP)
Rata şansei =(AP∙AN)(FN∙FP)
Riscul atribuabil =AP(AP+FP)-FN(FN+AN)
24
Denumire Formula
Rata falşilor pozitivi = 5(5+1) = 08334
Rata falşilor negativi = 7(7+16) = 03043
Sensibilitate = 1(1+7) = 01250
Specificitate = 16(16+5) = 07619
Acurateţe = (1+16)29 = 05862
Valoarea predictivă pozitivă = 1(1+5) = 01667
Valoarea predictivă negativă = 16(16+7) = 06957
Riscul relativ = 1(5+16)7(1+5) = 2142 = 050
Rata şansei = (1∙16)(7∙5) = 04571
Riscul atribuabil = 1(1+5)-7(7+16) = 01667-03043=-01376
Testarea asocierii icircn tabela de contingenţă
Testul χ2
Nu trebuie utilizat pentru eşantioane de volum mic
Testul este valid doar dacă valoarea expectată (aşteptată) pentru fiecare celulă este cel puţin
egală cu 1 şi frecvenţa absolută observată este de minim 5
Dacă aceste condiţii nu sunt icircndeplinite se aplică testul exact al lui Fisher (Fisherrsquos Exact Test)
Indică dacă cele două variabile sunt sau nu independente DAR NU cuantifică puterea asocierii
dintre ele
Problema S-a investigat icircntr-un studiu asocierea dintre obezitatea (ca factor de risc) şi bolile
cardio-vasculare la persoanele icircn etate (gt 60 ani) Din totalul de 620 persoane investigate s-au
identificat 150 persoane cu obezitate şi boală cardio-vasculară 230 persoane fără obezitate şi
fără boală cardio-vasculară şi 60 persoane fără obezitate dar cu boală cardio-vasculară Există
o asociere icircntre obezitate şi boala cardio-vasculară (df=1 α=005 χ2critic = 384)
Testul χ2 exemplu
H025
Nu există asociere icircntre obezitate şi bolile cardio-vasculare
Obezitatea şi bolile cardio-vasculare sunt independente
H1
Există asociere icircntre obezitate şi bolile cardio-vasculare
Obezitatea şi bolile cardio-vasculare sunt asociate
a = 005 pragul de semnificaţie al testului
urmează o lege cu (r-1)(c-1) grade de libertate
χ2 = parametrul testului χ2
fio = frecvenţa observată
fit = frecvenţa teoretică
Regiunea critică este [χα2 yen)
Pentru α = 005 χα2 = 384
OBSERVAT BCV+ BCV- Total
Obezitate + AP = 150 FP = 180 330
Obezitate - FN = 60 AN = 230 290
Total 210 410 620
TEORETIC BCV+ BCV- Total
Obezitate + = 330times210620 = 330times410620 330
Obezitate - = 290times210620 = 290times410620 290
Total 210 410 620
TEORETIC BCV+ BCV- Total
Obezitate + = 330times210620 = 330times410620 330
26
Obezitate - = 290times210620 = 290times410620 290
Total 210 410 620
TEORETIC BCV+ BCV-
Obezitate + = 112 = 218
Obezitate - = 98 = 192
Deoarece 4177Icirc[384 yen) se respinge H0 cu un risc de eroare de 5
Există asociere icircntre obezitate şi bolile cardio-vasculare
Testul Fisher
Corecţie a testului χ2
Valoarea p asociată parametrului ne dă probabilitatea ca valoarea observată de independenţă să fie
atribuită doar şansei
O valoare p mică indică că există alte cauze decacirct şansa influenţează rezultatul şi astfel cele două
variabile investigate nu sunt independente
Testul Fisher = dispersia corectată a factorului x dispersia corectată a factorilor reziduali
Icircn acest context regula adunării dispersiilor se poate scrie unde
este variaţia lui y pe seama variaţiei variabilei x
este variaţia lui y pe seama influenţei factorilor reziduali (neicircnregistraţi)
este variaţia totală a caracteristicii y
Testul Fisher empiric se calculează după formula
27
se compară cu Ftab pentru nx şi nz grade de libertate la un anumit prag de semnificaţie stabilit
Dacă Fc gt Ftab rezultă că variaţia factorului de grupare x este semnificativă pentru variaţia caracteristicii y
Testul z pentru proporţii
1 Compararea unei frecvenţe observate cu o frecvenţă teoretică
2 Testarea egalităţii a două frecvenţe
Testul z Compararea unei frecvenţe observate cu o frecvenţă teoretică
Scop Investigarea semnificaţiei diferenţei icircntre o frecvenţă teoretică p (icircntr-o populaţie) şi o frecvenţă
observată f pe un eşantion reprezentativ (variabilă calitativă (binare))
Condiţii de aplicare Testul este corect aplicat dacă numărul n al observaţiilor eşantionului este
suficient de mare (n∙p n∙(1-p)gt10
Parametrul
n = volumul eşantionului
Suntem interesaţi de investigarea prevalenţei hepatitei B la personalul care lucrează icircn laboratoarele
clinicilor de boli infecţioase din Transilvania Se ştie din studii anterioare că prevalenţa hepatitei B icircn
populaţia generală din Transilvania este de 9 S-a luat icircn studiu un eşantion de 100 persoane şi s-a
obţinut o prevalenţă a hepatitei B de 6 Există diferenţă semnificativă icircntre frecvenţa hepatitei B la
personalul care lucrează icircn laboratoarele spitalelor de boli infecţioase din Transilvania faţă de
populaţia generală
f = 006 p = 009 n = 100
Ipoteza nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat
faţă de frecvenţa hepatitei B icircn populaţia generală
Ipoteza alternativă test bilateral Există diferenţă semnificativă icircntre frecvenţa hepatitei B la
nivelul eşantionului şi prevalenţa hepatitei B icircn populaţia generală
f = 006 p = 009 n = 100
Pragul de semnificaţie a = 005
Regiunea critică test bilateral (-yen -196 ]Egrave[196 yen)
28
Concluzia testului
Deoarece parametrul statistic calculat al testului nu aparţine regiunii critice se acceptă ipoteza
nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat faţă de
frecvenţa hepatitei B icircn populaţia generală
Testul McNemar
Evaluarea dependenţei variabilelor calitative perechi (dorim să determinăm dacă o anumită
caracteristică este sau nu asociată cu o anumită patologie)
Identificăm n pacienţi care prezintă patologia de interes (eg Cancer bronho-pulmonar) şi n
pacienţi cu aceleaşi caracteristici ca şi primul grup dar care nu o prezintă
Martor = da Martor = nu
Caz = da a b
Caz = nu c d
Testul McNemar - exemplu fumat vs cancer
Martor = da Martor = nu
Cancer = da a = 2 b = 5
Cancer = nu c = 0 d = 3
29
χ2critic(α=005) = 384
32 lt 384 rarr acceptăm ipoteza nulă
Fumatul nu este icircn relaţie cu apariţia cancerului bronho-pulmonar
Inferenţa statistică pe date cantitative
Variabile cantitative continue
Testul z şi Student (t) (o medie sau medii perechi)
Testul z şi Student (t) (testarea a două medii)
ANOVA (ge 3 medii)
Ranguri (variabile cantitative discrete sau cantitative care nu icircndeplinesc condiţia de
normalitate)
Testul sumei rangurilor Wilcoxon
Kruskal-Wallis (ge 3 eşantioane independente)
Friedman (ge 3 eşantioane dependente)
Teste de normalitate variabile cantitative continue
Shapiro-Wilk
Kolmogorov-Smirnov
Shapiro-Wilk
Chi-Square Goodness-of-Fit
Dacă datele urmează o distribuţie normală aplicăm un test parametric
Dacă datele nu urmează o distribuţie normală aplicăm un test de comparare al rangurilor
30
Testul Z de comparare a mediei unui eşantion cu media unei populaţii
Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ
extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie
s2 care se cunoaşte
Condiţii de aplicare
1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru
compararea mediei unui eşantion cu media unei populaţii)
2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal
distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă
3 Talia eşantionului este mare ( ge 30)
Ipoteze
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media
eşantionului şi media populaţiei
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
(-yen -196 ] Egrave [196 yen)
Parametrul testului
n = volumul eşantionului
= media eşantionului
s = deviaţia standard a populaţiei
Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)
Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard
cunoscută
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi
media standard
Condiţii de aplicare
Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se
realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această
condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea
31
Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai
puternic
Numărul de grade de libertate (df) df = n-1
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
Parametrul testului
n = volumul eşantionului
micro0 = media standard
= media eşantionului
s = deviaţia standard a eşantionului
Testul ANOVA compararea mediilor a mai multe eşantioane
H0 = toate mediile sunt egale
H1 = nu toate mediile sunt egale
Condiţii de aplicare
1 Datele sunt independente unele faţă de celelalte
2 Datele fiecărui grup sunt normal distribuite
3 Deviaţia standard este aceeaşi pentru toate grupurile
Id Medicament
A B C D E F
1 5 6 7 10 5 9
2 6 8 8 11 8 8
3 7 7 9 13 6 7
4 8 9 11 12 4 5
32
5 9 10 10 9 7 6
Suma 35 40 45 55 30 35
Media 7 8 9 11 6 7
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =
= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)
Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2
F = (suma pătratelor(icircntre))(suma pătratelor(icircn))
Suma pătratelor (icircntre) = 16times5 = 80
Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60
Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn
interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare
SP df Media pătratelor F = MPicircntreMPicircn
Icircntre 80 5 = 805 = 16 = 1625 = 64
Icircn 60 24 = 6024 = 25
Total 140 29 -
Testul sumei rangurilor Wilcoxon
Aplicat pentru
Un set de observaţii provenite dintr-o valoare ipotetică comună
Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)
Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero
Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace
Suma rangurilor pentru diferenţele negative = 2+3+1 = 6
Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30
33
Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului
egal cu 8 = 0109
Icircnainte După Diferenţa Rang
64 66 -2 2
66 58 8 5
67 68 -1 3
71 65 6 4
72 75 -3 1
76 67 9 6
78 59 19 8
89 74 15 7
Testul Kruskal-Wallis (ge 3 eşantioane independente)
Test de ranguri aplicate pe mai mult de 3 eşantioane
H = parametrul testului
n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)
Tk = suma rangurilor
Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie
pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni
34
df = k-1 (k = numărul de eşantioane)
df = 3-1 = 2
Hcritic(α=005) = 599
H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie
pozitivă şi respectiv biopsie negativă
Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie
a tipului de studiu pe eşantioane perechi)
1 Definirea numărului de tratamente k
2 Obţinerea rangurilor pentru fiecare tratament
3 Sumarea rangurilor fiecărui tratament
4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)
5 Dacă Fr gt Frcritic rarr respingem H0
Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost
măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi
n = 9 k = 3 T12 = 225 T2
2 = 38025 T32 = 38025
Frcritic = 599
Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de
prostată
35
De reţinut
Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei
Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-
of-Fit
Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z
Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t
Compararea mediilor a 3 sau mai multe eşantioane ANOVA
Compararea mediilor a două populaţii (σ) testul Z
Compararea mediilor a două eşantioane (s) testul t
Compararea mediilor a două eşantioane perechi (s) testul t
ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi
cu cel pentru compararea a două eşantioane perechi
Ranguri
Distribuţia datelor nu are importanţă
Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)
Trei sau mai multe eşantioane Kruskal-Wallis
Trei sau mai multe eşantioane perechi Friedman
Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia
Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a
datelor)
Variabile nominale
Un singur eşantion sau eşantioane perechi
Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte
Eşantioane perechi testul Mc Nemar
Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2
Icircn analiza proporţiilor există teste diferite pentru
Compararea unei frecvenţe cu o frecvenţă cunoscută
Compararea a două frecvenţe
Semnificaţia statistică
Valoarea p (p value)
Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor
două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E
posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării
aleatorii
36
Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală
urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii
Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este
probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un
experiment de dimensiunea acestuia
Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că
diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii
diferite
Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca
fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă
ar fi fost adevărată
Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă
1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe
baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De
fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001
2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie
3 Se aplică testul statistic aferent pentru a calcula valoarea p
4 Se compară valoarea p cu valoarea ndash prag
5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe
semnificativă dpdv statisticrdquo
6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e
semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să
conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă
Teste de semnificaţie
Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului
populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)
Testarea ipotezelor implică posibile erori
Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile
sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui
grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul
icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005
ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există
37
nici o diferenţă
Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ
statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de
ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost
ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau
dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă
cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă
semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe
ipotetice variate icircn cazul icircn care ele există
Măsuri ale frecvenţei
Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)
Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate
Generic formula pe care se bazează toate cele trei este
unde x şi y sunt cantităţile de comparat
Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea
unei frecvenţe pe grupe de sex vacircrstă etc
Proporţia implică icircn mod necesar ca x să fie inclus icircn y
Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară
frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp
Pentru calcularea unei rate trebuie ţinut cont de trei aspecte
bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin
bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp
bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo
Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un
tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei
populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei
aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)
38
Indicatori
Rata de incidenţă
Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă
icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii
Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o
perioadă de timp
Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de
timp x
Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei
susceptibili de a dezvolta icircmbolnăvirea studiată
Numitorul poate fi
bull Numărul mediu al populaţiei icircn perioada de timp studiată
bull Mărimea populaţiei icircn mijlocul perioadei de studiu
bull Mărimea populaţiei la icircnceputul studiului
Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă
Este obligatorie menţionarea perioadei de timp
Prevalenţa
Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la
un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă
schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa
momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)
39
Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include
numai cazuri noi respectiv include cazuri noi şi vechi
Rata de atac
Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este
folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp
raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori
Rata persoană-timp
Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din
momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte
migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost
observate
Riscul relativ (RR)
Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment
legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele
prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două
grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la
bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la
bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai
mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo
Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2
Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn
cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă
(Tabelul 1)
Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR
Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la
neexpuşi
40
Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de
culegere a datelor
Odds ratio (OR)
Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin
raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general
studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)
Tabelul 2 Tabelul 2 x 2 pentru calcularea OR
Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală
Rate de mortalitate
Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp
specificată Există mai multe tipuri de rate de mortalitate
o Mortalitate specifică pe sex
o Mortalitate specifică pe rasă
o Mortalitate specifică pe boală
o Mortalitate neonatală
o Mortalitate postneonatală
o Mortalitate infantilă
o Mortalitate maternă
Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP
41
Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de
viaţă şi vacircrsta la care survine decesul dacă este prematur
Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu
Ani de viaţă pierduţi datorat dizabilităţii
Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt
utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru
cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite
grupuri
Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de
risc şi o boală se folosesc riscul relativ şi odds ratio
35 Analiza şi interpretarea datelor
După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date
trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul
Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor
colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului
studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu
plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde
prezenţa biostatisticianului este necesară
Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu
elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat
iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului
iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate
depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori
testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere
clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza
Interpretarea rezultatelor statistice
Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne
motive (număr mic de date) acceptarea ei să fie falsă
Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine
gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia
ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument
de decizie Intervalul de confidenţă
42
Interpretarea statistica ne interpretarea clinică
Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă
Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice
obţinute pe eşantionul studiat
Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare
Ce interpretăm Rezultatele
personale obţinute icircn urma studiului
care au fost prezentate icircn secţiunea bdquoRezultaterdquo
Explicăm rezultatele obţinute
Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale
Interpretarea trebuie să se realizeze icircn
lumina limitelor studiului
contextul cultural social şi educaţional al locului unde s-a realizat cercetarea
contextul a ceea ce se cunoaşte din literatura de specialitate
Interpretăm doar rezultatele personale obţinute icircn urma studiului
Interpretarea statistică nu este tot una cu interpretarea clinică
Interpretarea statistică este importantă
Interpretarea clinică este foarte importantă
Intervalul de confidenţă
Media calculată pe baza unui eşantion nu va echivala media populaţiei
Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului
Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a
populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a
populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)
pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru
orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare
dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de
confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de
date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de
5
Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel
Dacă valoarea p este mică
Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare
aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o
medie diferită Diferenţa este semnificativă dpdv statistic
43
Icircn continuare
Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa
reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică
pentru a fi interesante din punct de vedere ştiinţific
Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC
oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care
este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a
obţine o concluzie clară
Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o
diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că
datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din
punct de vedere ştiinţific
Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul
detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat
Erorile studiilor medicale
Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura
anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară
caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea
asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri
legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias
Erorile potenţiale icircn studiile epidemiologice
1 Erori icircntacircmplătoare
2 Erori sistematice
3 Confuzia
4 Validitatea
1 Erori icircntacircmplătoare
Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a
parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel
de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot
fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii
(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor
de măsură (eroarea de măsurare)
44
2 Erori sistematice
Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate
care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu
acurateţe mare Acurateţea nu este afectată de mărimea eşantionului
Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de
experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea
dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus
şi greu de cuantificat (consum de alcool personalitate etc)
Principalele tipuri de erori din această categorie sunt
bull Biasul de selecţie
bull Biasul de informaţie
Biasul de selecţie
Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul
trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion
inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale
persoanelor incluse
Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se
ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia
Biasul de informaţie
Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de
instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze
expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere
nesemnificativă sau chiar să nu şi-o amintească de loc
3 Confuzia
Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune
prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este
cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă
de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte
important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor
protector
4 Validitatea
Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă
Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte
estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional
Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă
45
conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se
demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)
Validitatea externă se poate realiza numai dacă studiul este valid intern
Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii
studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de
studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt
laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi
validă din punct de vedere intern)
3 6 Prezentarea rezultatelor
După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite
Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor
icircntr-o formă bdquodigerabilărdquo este necesară
Scopul prezentării datelor
1 Transmiterea concluziilor studiului
a Datele corecte şi importante merită comunicate
b Datele trebuie să confirme sau să infirme ipoteza studiului
c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală
2 Acordarea posibilităţii altor cercetători să aprecieze studiul
a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti
b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor
prezentate
Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru
fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie
statistică
Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de
valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras
(Tabel 3)
Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)
46
Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct
numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor
precum şi prezentarea acestora sub formă inteligibilă
Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care
convin cercetătorului
Prezentarea datelor se poate face
1 Figuri şi tabele icircn articole scrise
2 Figuri şi tabele icircn prezentări orale
3 Figuri şi tabele icircn postere
4 Text scris sau incluse icircn text
5 Site-uri de WEB
Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor
Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie
Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele
exprimacircnd exact ceea ce acestea exprimă
Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate
anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel
să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se
acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca
mai sus sugestive sunt formatele simple şi puţin icircncărcate
Dacă nu există reguli impuse se respectă
1 Mesaj simplu fără falsificarea datelor
2 De obicei este necesar atacirct tabelul cacirct şi graficul
3 Să fie simplu şi clar
Tabele
Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile
coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică
elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de
1 Se folosesc doar linii orizontale
2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn
evidenţi prin linie de separare (Tabelul 4)
Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland
Noua Zeelandă)
(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)
47
3 Numerele sunt aliniate icircn funcţie de virgulă
4 Indicii statistici sunt explicaţi sub tabel
5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană
6 Abrevierile pot fi folosite
7 Numărul de zecimale trebuie limitat la maxim două
8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel
9 Plasarea legendei este obligatorie sub tabel
10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)
Icircn cazul prezentărilor orale sau a posterelor este indicat ca
1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării
2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte
3 Folosirea de simboluri este permisă
Clasificarea tabelelor
Tabelele se clasifică după
i) conţinut
bull cu distribuţii de frecvenţe
bull de clase de frecvenţe
bull de contingenţă
ii) structura
bull cu doua coloane
bull cu subclasificări
bull ldquomasterrdquo
Tabele ce conţin distribuţii de frecvenţe
O modalitate comodă de a prezenta o mulţime de date brute este
1 Se ordonează datele in ordine crescătoare
2 Se determine frecvenţa fiecărei valori
3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane
(Tabelul 5)
Tabelul 5 Distribuţii de frecvenţă absolută
48
Tabelul claselor de frecvenţe
1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă
2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)
Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)
Tabele de contingenţă
1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a
tabelelor de contingenţă
2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a
combinaţiilor de perechi ordonate de valori
3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre
a factor de risc si
b starea sănătăţii
4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)
5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)
Tabelul 7 Tabel de contingenţă 2 x 2
49
Grafice
Există două categorii de moduri grafice sub care se pot prezenta datele
1 Ilustraţii şi fotografii
2 Grafice
1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă
pentru lucrare
2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit
Putem vorbi despre mai multe tipuri de grafice
bull Grafice pentru reprezentarea datelor cantitative
1048707 Grafic cartezian (X Y)
1048707 Histograma
1048707 Poligonul de frecvenţe
1048707 Diagrama bdquoscatterrdquo
bull Grafice pentru reprezentarea datelor calitative
1048707 Grafic cu bare
1048707 Diagrama tip bdquoboxplotrdquo
1048707 Diagrama bdquopierdquo
1048707 Cartograma
Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi
dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)
Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)
Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie
Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)
Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)
50
Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir
de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele
două variabile studiate (Figura 6)
Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2
(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2
rămacircne aproximativ constantă)
Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea
comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea
comparativă a mai multor variabile
Figura 7 Grafic calitativ cu bare
51
Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo
Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două
posibilităţi reprezentate grafic este mai frecventă (Figura 8)
Figura 8 Reprezentare tip bdquopierdquo
Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli
sau a oricărui element comparativ Se foloseşte de epidemiologi
Rezultate
Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare
Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o
manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu
explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția
bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la
ilustraţii tabele grafice
Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi
nici rezultatele care invalidează eventual ipoteza
Discuţii
Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd
cultura ştiinţifică şi inteligenţa autorilor
Acest capitol răspunde la trei obiective
Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia
calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de
selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează
rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv
52
este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn
care a fost abordată problema fără a face o revistă a literaturii
Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea
rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul
Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor
afirmaţii nesusţinute de conţinutul lucrării
Concluzii
Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate
să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie
Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de
concluzii va scădea valoarea lucrării
Bibliografia (lista referinţelor citarea icircn text)
Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn
lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente
Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli
- să conţină cele mai importante şi recente lucrări
- să includă numai lucrări publicate
- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate
Bibliografie
Elisabeta Jaba ndash Statistică Ed Economică 1998
Mihai Ţarcă ndash Statistică volI Ed UAIC 1979
Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale
Ed University Press 2009
Sorana Daniela Bolboacă ndash Metodologia cercetării curs
53
Diferenţierea variabilelor din punctul de vedere a distribuţiei se face folosind testul de normalitate
Kolmogorov ndash Smirnov
Testul statistic reprezintă metoda de comparaţie a două sau mai multe populaţii prin intermediul unor
variabile observate ale lor
Scopul unui test statistic este de a defini realitatea
Definirea icircntrebării de cercetare (ipoteza clinică)
Tratamentul cu Nebivolol este la fel de eficient ca şi cel cu Valsartan icircn tratamentul
hipertensiunii arteriale
Transpunerea icircntrebării de cercetare icircn termeni statistici (ipoteza statistică)
Media tensiunii arteriale a pacienţilor trataţi cu Valsartan nu diferă semnificativ de media
tensiunii arteriale a pacienţilor trataţi cu Nebivolol
Etapele unui test statistic
1 Formularea problemei icircn termenii ipotezelor statistice
2 Alegerea şi calcularea parametrului statistic al testului
3 Regiunea critică
4 Concluzia testului
1 Formularea problemei icircn termenii ipotezelor statistice
Ipoteza nulă ipoteza care trebuie testată testul efectuacircndu-se sub prezumţia că ipoteza nulă ar
fi adevărată
Ipoteza alternativă acea ipoteză care icircntr-un sens sau altul contrazice ipoteza nulă Această
ipoteză se mai numeşte şi ipoteza de lucru
Ipoteza nulă tipuri
O coadă (ldquoone-tailedrdquo sau ldquoone-siderdquo)
Media este mai mare
Media este mai mică
Două cozi (ldquoone-tailedrdquo sau ldquoone-siderdquo)
Media este egală
2 Alegerea şi calcularea parametrului statistic al testului
Parametrul statistic al testului exprimă icircntr-o anumită formă diferenţa dintre elementele comparate
Ţinacircnd seama de faptul că eşantionul sau eşantioanele utilizate sunt aleator extrase din populaţiile care
fac obiectul testului parametrul statistic este o variabilă aleatoare de selecţie care urmează o anumită
lege de probabilitate
Un parametru statistic al testului bun trebuie să icircndeplinească două condiţii
19
Trebuie să se comporte diferit atunci cacircnd ipoteza nulă H0 este adevărată faţă de situaţia icircn
care ipoteza alternativă H1 este adevărată
Distribuţia de probabilitate a parametrului statistic al testului sub prezumţia că H0 este
adevărată este cunoscută
3 Regiunea critică
- Trebuie să fim capabili să decidem icircn funcţie de valoarea parametrului statistic calculat care dintre
ipoteze cea nulă sau cea alternativă este adevărată
- Dacă valoarea parametrului statistic aparţine regiunii critice ipoteza nulă H0 va fi respinsă şi va fi
acceptată ipoteza alternativă H1
- Dacă valoarea parametrului statistic nu aparţine regiunii critice ipoteza nulă H0 va fi acceptată
- Decidem mărimea regiunii critice
Pentru aceasta trebuie să specificăm mărimea riscului de eroare pe care icircl acceptăm
Pe scurt definim nivelul de semnificaţie notat cu a sau mărimea riscului pe care
suntem dispuşi să ni-l asumăm icircn respingerea ipotezei nule H0 icircn cazul icircn care aceasta
este adevărată De obicei se alege un nivel de semnificaţie icircntre 1 şi 5
Probabilitatea unei erori de tipul I
probabilitatea de respingere a ipotezei nule H0 icircn favoarea ipotezei alternative H1 icircn
condiţiile icircn care H0 este adevărată
probabilitatea unei erori de tipul I se notează cu a şi se mai numeşte nivel de
semnificaţie al testului
Probabilitatea unei erori de tipul II
probabilitatea acceptării ipotezei nule icircn condiţiile icircn care ipoteza alternativă H1 este
adevărată
această probabilitate se notează cu b
- Unilaterală la dreapta ndash valoarea parametrului statistic al testului este mai mare sau egală cu
valoarea din dreapta a intervalului critic
- Unilaterală la stacircnga ndash valoarea parametrului statistic al testului este mai mică sau egală cu
valoarea din stacircnga a intervalului critic
- Bilaterală ndash valoarea parametrului statistic al testului este mai mică sau egală cu valoarea extremă
din stacircnga regiunii critice sau mai mare sau egală cu valoarea extremă din dreapta regiunii critice
valorile extreme ale regiunii critice avacircnd nivele egale de semnificaţie
4 Concluzia testului
- Ipoteza nulă H0 este respinsă dacă valoarea parametrului statistic aparţine regiunii critice
20
- Regiunea critică trebuie astfel aleasă icircncacirct dacă ipoteza alternativă H1 este adevărată
probabilitatea de respingere a ipotezei nule H0 este mai mare decacirct icircn cazul icircn care ipoteza nulă H0
ar fi adevărată
- Acceptarea ipotezei nule H0 atunci cacircnd ipoteza alternativă H1 este adevărată este cunoscută ca şi
eroarea de tipul II
a probabilitatea ei se notează cu b
b măsoară bdquonivelul de eroarerdquo
- Icircn testarea oricărei ipoteze statistice există patru situaţii care determină dacă decizia noastră este
corectă sau nu
Cazuri
H0 este adevărată H0 este falsă
Concluzie H0 se acceptă decizie corectă eroare de tipul
II
H0 se
respinge
eroare de tipul I decizie corectă
Luarea deciziei pe baza valorii probabilităţii p de semnificaţie a testului
Icircn momentul icircn care prelucrăm statistic o serie de date dorim să ştim dacă rezultatele obţinute sunt sau
nu semnificative statistic
Răspunsul la această icircntrebare este dat de valoarea lui p calculată de orice program statistic la
prelucrarea unor date
Icircn cazul testelor statistice ipoteza nulă este respinsă dacă nivelul de semnificaţie este mai mic decacirct
005 iar programele de prelucrare statistică a datelor vor afişa o steluţă () icircn tabelul rezultatelor
21
Dacă p le 005 respingem ipoteza nulă şi acceptăm ipoteza alternativă (am obţinut semnificaţia
statistică)
Dacă p gt 005 acceptăm ipoteza nulă (nu am obţinut semnificaţia statistică)
p = 013
NU respingem ipoteza nulă
Risc de eroare de tip II
α = 005
p = 002
Respingem ipoteza nulă
Risc de eroare de tip I
Semnificaţia lui p
Criteriu de luare a deciziei cu privire la o ipoteză statistică nulă
Cuantifică şansa ca o decizie de respingere a ipotezei nule să fie greşită
Măsură a semnificaţiei statistice şi NU CLINICĂ
22
Semnificaţia lui p (reguli empirice)
001 le p lt 005 rezultatul e semnificativ statistic
0001 le p lt 001 rezultatul e icircnalt semnificativ statistic
p lt 0001 rezultatul e foarte icircnalt semnificativ statistic
p ge 005 rezultatul e considerat nesemnificativ statistic
Limite ale valorii p
Valoarea p NU ne dă informaţii despre
Şansa de beneficiu a unui pacient individual
Procentul de pacienţi care vor avea un beneficiu icircn urma instituirii procedurii medicale
Gradul de beneficiu expectat pentru un anumit pacient
Puterea unui test statistic
Este capacitatea de a detecta o diferenţă acolo unde există
Creşterea volumului eşantionului determină creşterea puterii testului statistic aplicat
Valoarea este icircn relaţie directă cu eroarea de tip II
Puterea = 1 ndash β
Cea mai utilizată modalitate de creştere a puterii unui test statistic este de a creşte volumul
eşantionului
Tipul scalei de măsură ndash testul statistic
Denumire test Interval Nominal Observaţii
Corelaţie Pearson 2 0 Există o relaţie liniară
χ2 0 2
Student 1 1 Doar 2 grupuri
ANOVA 1 1 2 sau mai multe grupuri
Student perechi 1 1 Eşantioane perechi
Măsurători repetate (ANOVA) 1 1 Mai mult de 2 grupuri date
perechi
Inferenţa statistică pe date calitativ e
Tabela de contingenţă 2times2
Riscuri şi raţii
Testul χ2 (testarea asocierii icircn tabela de contingenţă)
Testul Fisher
23
Testul z pentru proporţii
Testul McNemar
Tabela de contingenţă 2times2
Scale de tip nominal (dicotomiale tabela de contingenţă de 2times2) sau ordinal (tabela de contingenţă de
rtimesc)
Frecvenţa absolută (numărul de evenimente per categorie)
Tabela de contingenţă de 2times2 4 categorii
AP = adevărat pozitiv
FP = fals pozitiv
FN = fals negativ
AN = adevărat negativ
Ulcer deschis Ulcer vindecat Total
Recurenţă + AP = 1 FP = 5 = 1+5 = 6
Recurenţă - FN = 7 AN = 16 = 7+16 = 23
Total =1+7=8 =5+16=21 29
Riscuri şi raţii Mărimi ale asocierii
Denumire Formula Definiţie
Rata falşilor pozitivi =FP(FP+AN) Probabilitatea unui test fals + (α)
Rata falşilor negativi =FN(FN+AP) Probabilitatea unui test fals ndash (β)
Sensibilitate =AP(AP+FN) Probabilitatea unui test real + (1- β)
Specificitate =AN(AN+FP) Probabilitatea unui test real ndash (1- α)
Acurateţe =(AP+AN)n Probabilitatea generală a unei decizii corecte
Valoarea predictivă pozitivă =AP(AP+FP) Probabilitatea ca un test pozitiv să fie corect
Valoarea predictivă negativă =AN(AN+FN) Probabilitatea ca un test negativ să fie corect
Riscul relativ =AP(FP+AN)FN(AP+FP)
Rata şansei =(AP∙AN)(FN∙FP)
Riscul atribuabil =AP(AP+FP)-FN(FN+AN)
24
Denumire Formula
Rata falşilor pozitivi = 5(5+1) = 08334
Rata falşilor negativi = 7(7+16) = 03043
Sensibilitate = 1(1+7) = 01250
Specificitate = 16(16+5) = 07619
Acurateţe = (1+16)29 = 05862
Valoarea predictivă pozitivă = 1(1+5) = 01667
Valoarea predictivă negativă = 16(16+7) = 06957
Riscul relativ = 1(5+16)7(1+5) = 2142 = 050
Rata şansei = (1∙16)(7∙5) = 04571
Riscul atribuabil = 1(1+5)-7(7+16) = 01667-03043=-01376
Testarea asocierii icircn tabela de contingenţă
Testul χ2
Nu trebuie utilizat pentru eşantioane de volum mic
Testul este valid doar dacă valoarea expectată (aşteptată) pentru fiecare celulă este cel puţin
egală cu 1 şi frecvenţa absolută observată este de minim 5
Dacă aceste condiţii nu sunt icircndeplinite se aplică testul exact al lui Fisher (Fisherrsquos Exact Test)
Indică dacă cele două variabile sunt sau nu independente DAR NU cuantifică puterea asocierii
dintre ele
Problema S-a investigat icircntr-un studiu asocierea dintre obezitatea (ca factor de risc) şi bolile
cardio-vasculare la persoanele icircn etate (gt 60 ani) Din totalul de 620 persoane investigate s-au
identificat 150 persoane cu obezitate şi boală cardio-vasculară 230 persoane fără obezitate şi
fără boală cardio-vasculară şi 60 persoane fără obezitate dar cu boală cardio-vasculară Există
o asociere icircntre obezitate şi boala cardio-vasculară (df=1 α=005 χ2critic = 384)
Testul χ2 exemplu
H025
Nu există asociere icircntre obezitate şi bolile cardio-vasculare
Obezitatea şi bolile cardio-vasculare sunt independente
H1
Există asociere icircntre obezitate şi bolile cardio-vasculare
Obezitatea şi bolile cardio-vasculare sunt asociate
a = 005 pragul de semnificaţie al testului
urmează o lege cu (r-1)(c-1) grade de libertate
χ2 = parametrul testului χ2
fio = frecvenţa observată
fit = frecvenţa teoretică
Regiunea critică este [χα2 yen)
Pentru α = 005 χα2 = 384
OBSERVAT BCV+ BCV- Total
Obezitate + AP = 150 FP = 180 330
Obezitate - FN = 60 AN = 230 290
Total 210 410 620
TEORETIC BCV+ BCV- Total
Obezitate + = 330times210620 = 330times410620 330
Obezitate - = 290times210620 = 290times410620 290
Total 210 410 620
TEORETIC BCV+ BCV- Total
Obezitate + = 330times210620 = 330times410620 330
26
Obezitate - = 290times210620 = 290times410620 290
Total 210 410 620
TEORETIC BCV+ BCV-
Obezitate + = 112 = 218
Obezitate - = 98 = 192
Deoarece 4177Icirc[384 yen) se respinge H0 cu un risc de eroare de 5
Există asociere icircntre obezitate şi bolile cardio-vasculare
Testul Fisher
Corecţie a testului χ2
Valoarea p asociată parametrului ne dă probabilitatea ca valoarea observată de independenţă să fie
atribuită doar şansei
O valoare p mică indică că există alte cauze decacirct şansa influenţează rezultatul şi astfel cele două
variabile investigate nu sunt independente
Testul Fisher = dispersia corectată a factorului x dispersia corectată a factorilor reziduali
Icircn acest context regula adunării dispersiilor se poate scrie unde
este variaţia lui y pe seama variaţiei variabilei x
este variaţia lui y pe seama influenţei factorilor reziduali (neicircnregistraţi)
este variaţia totală a caracteristicii y
Testul Fisher empiric se calculează după formula
27
se compară cu Ftab pentru nx şi nz grade de libertate la un anumit prag de semnificaţie stabilit
Dacă Fc gt Ftab rezultă că variaţia factorului de grupare x este semnificativă pentru variaţia caracteristicii y
Testul z pentru proporţii
1 Compararea unei frecvenţe observate cu o frecvenţă teoretică
2 Testarea egalităţii a două frecvenţe
Testul z Compararea unei frecvenţe observate cu o frecvenţă teoretică
Scop Investigarea semnificaţiei diferenţei icircntre o frecvenţă teoretică p (icircntr-o populaţie) şi o frecvenţă
observată f pe un eşantion reprezentativ (variabilă calitativă (binare))
Condiţii de aplicare Testul este corect aplicat dacă numărul n al observaţiilor eşantionului este
suficient de mare (n∙p n∙(1-p)gt10
Parametrul
n = volumul eşantionului
Suntem interesaţi de investigarea prevalenţei hepatitei B la personalul care lucrează icircn laboratoarele
clinicilor de boli infecţioase din Transilvania Se ştie din studii anterioare că prevalenţa hepatitei B icircn
populaţia generală din Transilvania este de 9 S-a luat icircn studiu un eşantion de 100 persoane şi s-a
obţinut o prevalenţă a hepatitei B de 6 Există diferenţă semnificativă icircntre frecvenţa hepatitei B la
personalul care lucrează icircn laboratoarele spitalelor de boli infecţioase din Transilvania faţă de
populaţia generală
f = 006 p = 009 n = 100
Ipoteza nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat
faţă de frecvenţa hepatitei B icircn populaţia generală
Ipoteza alternativă test bilateral Există diferenţă semnificativă icircntre frecvenţa hepatitei B la
nivelul eşantionului şi prevalenţa hepatitei B icircn populaţia generală
f = 006 p = 009 n = 100
Pragul de semnificaţie a = 005
Regiunea critică test bilateral (-yen -196 ]Egrave[196 yen)
28
Concluzia testului
Deoarece parametrul statistic calculat al testului nu aparţine regiunii critice se acceptă ipoteza
nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat faţă de
frecvenţa hepatitei B icircn populaţia generală
Testul McNemar
Evaluarea dependenţei variabilelor calitative perechi (dorim să determinăm dacă o anumită
caracteristică este sau nu asociată cu o anumită patologie)
Identificăm n pacienţi care prezintă patologia de interes (eg Cancer bronho-pulmonar) şi n
pacienţi cu aceleaşi caracteristici ca şi primul grup dar care nu o prezintă
Martor = da Martor = nu
Caz = da a b
Caz = nu c d
Testul McNemar - exemplu fumat vs cancer
Martor = da Martor = nu
Cancer = da a = 2 b = 5
Cancer = nu c = 0 d = 3
29
χ2critic(α=005) = 384
32 lt 384 rarr acceptăm ipoteza nulă
Fumatul nu este icircn relaţie cu apariţia cancerului bronho-pulmonar
Inferenţa statistică pe date cantitative
Variabile cantitative continue
Testul z şi Student (t) (o medie sau medii perechi)
Testul z şi Student (t) (testarea a două medii)
ANOVA (ge 3 medii)
Ranguri (variabile cantitative discrete sau cantitative care nu icircndeplinesc condiţia de
normalitate)
Testul sumei rangurilor Wilcoxon
Kruskal-Wallis (ge 3 eşantioane independente)
Friedman (ge 3 eşantioane dependente)
Teste de normalitate variabile cantitative continue
Shapiro-Wilk
Kolmogorov-Smirnov
Shapiro-Wilk
Chi-Square Goodness-of-Fit
Dacă datele urmează o distribuţie normală aplicăm un test parametric
Dacă datele nu urmează o distribuţie normală aplicăm un test de comparare al rangurilor
30
Testul Z de comparare a mediei unui eşantion cu media unei populaţii
Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ
extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie
s2 care se cunoaşte
Condiţii de aplicare
1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru
compararea mediei unui eşantion cu media unei populaţii)
2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal
distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă
3 Talia eşantionului este mare ( ge 30)
Ipoteze
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media
eşantionului şi media populaţiei
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
(-yen -196 ] Egrave [196 yen)
Parametrul testului
n = volumul eşantionului
= media eşantionului
s = deviaţia standard a populaţiei
Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)
Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard
cunoscută
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi
media standard
Condiţii de aplicare
Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se
realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această
condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea
31
Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai
puternic
Numărul de grade de libertate (df) df = n-1
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
Parametrul testului
n = volumul eşantionului
micro0 = media standard
= media eşantionului
s = deviaţia standard a eşantionului
Testul ANOVA compararea mediilor a mai multe eşantioane
H0 = toate mediile sunt egale
H1 = nu toate mediile sunt egale
Condiţii de aplicare
1 Datele sunt independente unele faţă de celelalte
2 Datele fiecărui grup sunt normal distribuite
3 Deviaţia standard este aceeaşi pentru toate grupurile
Id Medicament
A B C D E F
1 5 6 7 10 5 9
2 6 8 8 11 8 8
3 7 7 9 13 6 7
4 8 9 11 12 4 5
32
5 9 10 10 9 7 6
Suma 35 40 45 55 30 35
Media 7 8 9 11 6 7
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =
= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)
Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2
F = (suma pătratelor(icircntre))(suma pătratelor(icircn))
Suma pătratelor (icircntre) = 16times5 = 80
Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60
Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn
interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare
SP df Media pătratelor F = MPicircntreMPicircn
Icircntre 80 5 = 805 = 16 = 1625 = 64
Icircn 60 24 = 6024 = 25
Total 140 29 -
Testul sumei rangurilor Wilcoxon
Aplicat pentru
Un set de observaţii provenite dintr-o valoare ipotetică comună
Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)
Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero
Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace
Suma rangurilor pentru diferenţele negative = 2+3+1 = 6
Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30
33
Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului
egal cu 8 = 0109
Icircnainte După Diferenţa Rang
64 66 -2 2
66 58 8 5
67 68 -1 3
71 65 6 4
72 75 -3 1
76 67 9 6
78 59 19 8
89 74 15 7
Testul Kruskal-Wallis (ge 3 eşantioane independente)
Test de ranguri aplicate pe mai mult de 3 eşantioane
H = parametrul testului
n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)
Tk = suma rangurilor
Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie
pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni
34
df = k-1 (k = numărul de eşantioane)
df = 3-1 = 2
Hcritic(α=005) = 599
H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie
pozitivă şi respectiv biopsie negativă
Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie
a tipului de studiu pe eşantioane perechi)
1 Definirea numărului de tratamente k
2 Obţinerea rangurilor pentru fiecare tratament
3 Sumarea rangurilor fiecărui tratament
4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)
5 Dacă Fr gt Frcritic rarr respingem H0
Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost
măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi
n = 9 k = 3 T12 = 225 T2
2 = 38025 T32 = 38025
Frcritic = 599
Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de
prostată
35
De reţinut
Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei
Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-
of-Fit
Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z
Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t
Compararea mediilor a 3 sau mai multe eşantioane ANOVA
Compararea mediilor a două populaţii (σ) testul Z
Compararea mediilor a două eşantioane (s) testul t
Compararea mediilor a două eşantioane perechi (s) testul t
ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi
cu cel pentru compararea a două eşantioane perechi
Ranguri
Distribuţia datelor nu are importanţă
Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)
Trei sau mai multe eşantioane Kruskal-Wallis
Trei sau mai multe eşantioane perechi Friedman
Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia
Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a
datelor)
Variabile nominale
Un singur eşantion sau eşantioane perechi
Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte
Eşantioane perechi testul Mc Nemar
Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2
Icircn analiza proporţiilor există teste diferite pentru
Compararea unei frecvenţe cu o frecvenţă cunoscută
Compararea a două frecvenţe
Semnificaţia statistică
Valoarea p (p value)
Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor
două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E
posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării
aleatorii
36
Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală
urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii
Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este
probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un
experiment de dimensiunea acestuia
Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că
diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii
diferite
Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca
fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă
ar fi fost adevărată
Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă
1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe
baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De
fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001
2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie
3 Se aplică testul statistic aferent pentru a calcula valoarea p
4 Se compară valoarea p cu valoarea ndash prag
5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe
semnificativă dpdv statisticrdquo
6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e
semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să
conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă
Teste de semnificaţie
Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului
populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)
Testarea ipotezelor implică posibile erori
Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile
sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui
grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul
icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005
ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există
37
nici o diferenţă
Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ
statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de
ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost
ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau
dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă
cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă
semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe
ipotetice variate icircn cazul icircn care ele există
Măsuri ale frecvenţei
Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)
Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate
Generic formula pe care se bazează toate cele trei este
unde x şi y sunt cantităţile de comparat
Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea
unei frecvenţe pe grupe de sex vacircrstă etc
Proporţia implică icircn mod necesar ca x să fie inclus icircn y
Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară
frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp
Pentru calcularea unei rate trebuie ţinut cont de trei aspecte
bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin
bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp
bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo
Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un
tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei
populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei
aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)
38
Indicatori
Rata de incidenţă
Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă
icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii
Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o
perioadă de timp
Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de
timp x
Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei
susceptibili de a dezvolta icircmbolnăvirea studiată
Numitorul poate fi
bull Numărul mediu al populaţiei icircn perioada de timp studiată
bull Mărimea populaţiei icircn mijlocul perioadei de studiu
bull Mărimea populaţiei la icircnceputul studiului
Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă
Este obligatorie menţionarea perioadei de timp
Prevalenţa
Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la
un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă
schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa
momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)
39
Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include
numai cazuri noi respectiv include cazuri noi şi vechi
Rata de atac
Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este
folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp
raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori
Rata persoană-timp
Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din
momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte
migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost
observate
Riscul relativ (RR)
Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment
legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele
prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două
grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la
bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la
bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai
mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo
Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2
Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn
cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă
(Tabelul 1)
Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR
Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la
neexpuşi
40
Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de
culegere a datelor
Odds ratio (OR)
Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin
raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general
studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)
Tabelul 2 Tabelul 2 x 2 pentru calcularea OR
Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală
Rate de mortalitate
Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp
specificată Există mai multe tipuri de rate de mortalitate
o Mortalitate specifică pe sex
o Mortalitate specifică pe rasă
o Mortalitate specifică pe boală
o Mortalitate neonatală
o Mortalitate postneonatală
o Mortalitate infantilă
o Mortalitate maternă
Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP
41
Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de
viaţă şi vacircrsta la care survine decesul dacă este prematur
Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu
Ani de viaţă pierduţi datorat dizabilităţii
Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt
utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru
cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite
grupuri
Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de
risc şi o boală se folosesc riscul relativ şi odds ratio
35 Analiza şi interpretarea datelor
După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date
trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul
Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor
colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului
studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu
plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde
prezenţa biostatisticianului este necesară
Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu
elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat
iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului
iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate
depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori
testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere
clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza
Interpretarea rezultatelor statistice
Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne
motive (număr mic de date) acceptarea ei să fie falsă
Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine
gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia
ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument
de decizie Intervalul de confidenţă
42
Interpretarea statistica ne interpretarea clinică
Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă
Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice
obţinute pe eşantionul studiat
Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare
Ce interpretăm Rezultatele
personale obţinute icircn urma studiului
care au fost prezentate icircn secţiunea bdquoRezultaterdquo
Explicăm rezultatele obţinute
Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale
Interpretarea trebuie să se realizeze icircn
lumina limitelor studiului
contextul cultural social şi educaţional al locului unde s-a realizat cercetarea
contextul a ceea ce se cunoaşte din literatura de specialitate
Interpretăm doar rezultatele personale obţinute icircn urma studiului
Interpretarea statistică nu este tot una cu interpretarea clinică
Interpretarea statistică este importantă
Interpretarea clinică este foarte importantă
Intervalul de confidenţă
Media calculată pe baza unui eşantion nu va echivala media populaţiei
Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului
Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a
populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a
populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)
pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru
orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare
dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de
confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de
date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de
5
Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel
Dacă valoarea p este mică
Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare
aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o
medie diferită Diferenţa este semnificativă dpdv statistic
43
Icircn continuare
Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa
reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică
pentru a fi interesante din punct de vedere ştiinţific
Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC
oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care
este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a
obţine o concluzie clară
Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o
diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că
datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din
punct de vedere ştiinţific
Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul
detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat
Erorile studiilor medicale
Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura
anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară
caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea
asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri
legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias
Erorile potenţiale icircn studiile epidemiologice
1 Erori icircntacircmplătoare
2 Erori sistematice
3 Confuzia
4 Validitatea
1 Erori icircntacircmplătoare
Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a
parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel
de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot
fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii
(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor
de măsură (eroarea de măsurare)
44
2 Erori sistematice
Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate
care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu
acurateţe mare Acurateţea nu este afectată de mărimea eşantionului
Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de
experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea
dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus
şi greu de cuantificat (consum de alcool personalitate etc)
Principalele tipuri de erori din această categorie sunt
bull Biasul de selecţie
bull Biasul de informaţie
Biasul de selecţie
Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul
trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion
inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale
persoanelor incluse
Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se
ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia
Biasul de informaţie
Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de
instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze
expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere
nesemnificativă sau chiar să nu şi-o amintească de loc
3 Confuzia
Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune
prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este
cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă
de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte
important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor
protector
4 Validitatea
Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă
Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte
estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional
Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă
45
conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se
demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)
Validitatea externă se poate realiza numai dacă studiul este valid intern
Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii
studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de
studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt
laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi
validă din punct de vedere intern)
3 6 Prezentarea rezultatelor
După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite
Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor
icircntr-o formă bdquodigerabilărdquo este necesară
Scopul prezentării datelor
1 Transmiterea concluziilor studiului
a Datele corecte şi importante merită comunicate
b Datele trebuie să confirme sau să infirme ipoteza studiului
c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală
2 Acordarea posibilităţii altor cercetători să aprecieze studiul
a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti
b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor
prezentate
Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru
fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie
statistică
Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de
valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras
(Tabel 3)
Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)
46
Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct
numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor
precum şi prezentarea acestora sub formă inteligibilă
Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care
convin cercetătorului
Prezentarea datelor se poate face
1 Figuri şi tabele icircn articole scrise
2 Figuri şi tabele icircn prezentări orale
3 Figuri şi tabele icircn postere
4 Text scris sau incluse icircn text
5 Site-uri de WEB
Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor
Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie
Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele
exprimacircnd exact ceea ce acestea exprimă
Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate
anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel
să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se
acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca
mai sus sugestive sunt formatele simple şi puţin icircncărcate
Dacă nu există reguli impuse se respectă
1 Mesaj simplu fără falsificarea datelor
2 De obicei este necesar atacirct tabelul cacirct şi graficul
3 Să fie simplu şi clar
Tabele
Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile
coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică
elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de
1 Se folosesc doar linii orizontale
2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn
evidenţi prin linie de separare (Tabelul 4)
Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland
Noua Zeelandă)
(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)
47
3 Numerele sunt aliniate icircn funcţie de virgulă
4 Indicii statistici sunt explicaţi sub tabel
5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană
6 Abrevierile pot fi folosite
7 Numărul de zecimale trebuie limitat la maxim două
8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel
9 Plasarea legendei este obligatorie sub tabel
10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)
Icircn cazul prezentărilor orale sau a posterelor este indicat ca
1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării
2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte
3 Folosirea de simboluri este permisă
Clasificarea tabelelor
Tabelele se clasifică după
i) conţinut
bull cu distribuţii de frecvenţe
bull de clase de frecvenţe
bull de contingenţă
ii) structura
bull cu doua coloane
bull cu subclasificări
bull ldquomasterrdquo
Tabele ce conţin distribuţii de frecvenţe
O modalitate comodă de a prezenta o mulţime de date brute este
1 Se ordonează datele in ordine crescătoare
2 Se determine frecvenţa fiecărei valori
3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane
(Tabelul 5)
Tabelul 5 Distribuţii de frecvenţă absolută
48
Tabelul claselor de frecvenţe
1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă
2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)
Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)
Tabele de contingenţă
1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a
tabelelor de contingenţă
2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a
combinaţiilor de perechi ordonate de valori
3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre
a factor de risc si
b starea sănătăţii
4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)
5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)
Tabelul 7 Tabel de contingenţă 2 x 2
49
Grafice
Există două categorii de moduri grafice sub care se pot prezenta datele
1 Ilustraţii şi fotografii
2 Grafice
1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă
pentru lucrare
2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit
Putem vorbi despre mai multe tipuri de grafice
bull Grafice pentru reprezentarea datelor cantitative
1048707 Grafic cartezian (X Y)
1048707 Histograma
1048707 Poligonul de frecvenţe
1048707 Diagrama bdquoscatterrdquo
bull Grafice pentru reprezentarea datelor calitative
1048707 Grafic cu bare
1048707 Diagrama tip bdquoboxplotrdquo
1048707 Diagrama bdquopierdquo
1048707 Cartograma
Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi
dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)
Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)
Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie
Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)
Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)
50
Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir
de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele
două variabile studiate (Figura 6)
Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2
(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2
rămacircne aproximativ constantă)
Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea
comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea
comparativă a mai multor variabile
Figura 7 Grafic calitativ cu bare
51
Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo
Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două
posibilităţi reprezentate grafic este mai frecventă (Figura 8)
Figura 8 Reprezentare tip bdquopierdquo
Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli
sau a oricărui element comparativ Se foloseşte de epidemiologi
Rezultate
Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare
Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o
manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu
explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția
bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la
ilustraţii tabele grafice
Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi
nici rezultatele care invalidează eventual ipoteza
Discuţii
Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd
cultura ştiinţifică şi inteligenţa autorilor
Acest capitol răspunde la trei obiective
Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia
calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de
selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează
rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv
52
este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn
care a fost abordată problema fără a face o revistă a literaturii
Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea
rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul
Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor
afirmaţii nesusţinute de conţinutul lucrării
Concluzii
Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate
să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie
Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de
concluzii va scădea valoarea lucrării
Bibliografia (lista referinţelor citarea icircn text)
Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn
lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente
Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli
- să conţină cele mai importante şi recente lucrări
- să includă numai lucrări publicate
- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate
Bibliografie
Elisabeta Jaba ndash Statistică Ed Economică 1998
Mihai Ţarcă ndash Statistică volI Ed UAIC 1979
Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale
Ed University Press 2009
Sorana Daniela Bolboacă ndash Metodologia cercetării curs
53
Trebuie să se comporte diferit atunci cacircnd ipoteza nulă H0 este adevărată faţă de situaţia icircn
care ipoteza alternativă H1 este adevărată
Distribuţia de probabilitate a parametrului statistic al testului sub prezumţia că H0 este
adevărată este cunoscută
3 Regiunea critică
- Trebuie să fim capabili să decidem icircn funcţie de valoarea parametrului statistic calculat care dintre
ipoteze cea nulă sau cea alternativă este adevărată
- Dacă valoarea parametrului statistic aparţine regiunii critice ipoteza nulă H0 va fi respinsă şi va fi
acceptată ipoteza alternativă H1
- Dacă valoarea parametrului statistic nu aparţine regiunii critice ipoteza nulă H0 va fi acceptată
- Decidem mărimea regiunii critice
Pentru aceasta trebuie să specificăm mărimea riscului de eroare pe care icircl acceptăm
Pe scurt definim nivelul de semnificaţie notat cu a sau mărimea riscului pe care
suntem dispuşi să ni-l asumăm icircn respingerea ipotezei nule H0 icircn cazul icircn care aceasta
este adevărată De obicei se alege un nivel de semnificaţie icircntre 1 şi 5
Probabilitatea unei erori de tipul I
probabilitatea de respingere a ipotezei nule H0 icircn favoarea ipotezei alternative H1 icircn
condiţiile icircn care H0 este adevărată
probabilitatea unei erori de tipul I se notează cu a şi se mai numeşte nivel de
semnificaţie al testului
Probabilitatea unei erori de tipul II
probabilitatea acceptării ipotezei nule icircn condiţiile icircn care ipoteza alternativă H1 este
adevărată
această probabilitate se notează cu b
- Unilaterală la dreapta ndash valoarea parametrului statistic al testului este mai mare sau egală cu
valoarea din dreapta a intervalului critic
- Unilaterală la stacircnga ndash valoarea parametrului statistic al testului este mai mică sau egală cu
valoarea din stacircnga a intervalului critic
- Bilaterală ndash valoarea parametrului statistic al testului este mai mică sau egală cu valoarea extremă
din stacircnga regiunii critice sau mai mare sau egală cu valoarea extremă din dreapta regiunii critice
valorile extreme ale regiunii critice avacircnd nivele egale de semnificaţie
4 Concluzia testului
- Ipoteza nulă H0 este respinsă dacă valoarea parametrului statistic aparţine regiunii critice
20
- Regiunea critică trebuie astfel aleasă icircncacirct dacă ipoteza alternativă H1 este adevărată
probabilitatea de respingere a ipotezei nule H0 este mai mare decacirct icircn cazul icircn care ipoteza nulă H0
ar fi adevărată
- Acceptarea ipotezei nule H0 atunci cacircnd ipoteza alternativă H1 este adevărată este cunoscută ca şi
eroarea de tipul II
a probabilitatea ei se notează cu b
b măsoară bdquonivelul de eroarerdquo
- Icircn testarea oricărei ipoteze statistice există patru situaţii care determină dacă decizia noastră este
corectă sau nu
Cazuri
H0 este adevărată H0 este falsă
Concluzie H0 se acceptă decizie corectă eroare de tipul
II
H0 se
respinge
eroare de tipul I decizie corectă
Luarea deciziei pe baza valorii probabilităţii p de semnificaţie a testului
Icircn momentul icircn care prelucrăm statistic o serie de date dorim să ştim dacă rezultatele obţinute sunt sau
nu semnificative statistic
Răspunsul la această icircntrebare este dat de valoarea lui p calculată de orice program statistic la
prelucrarea unor date
Icircn cazul testelor statistice ipoteza nulă este respinsă dacă nivelul de semnificaţie este mai mic decacirct
005 iar programele de prelucrare statistică a datelor vor afişa o steluţă () icircn tabelul rezultatelor
21
Dacă p le 005 respingem ipoteza nulă şi acceptăm ipoteza alternativă (am obţinut semnificaţia
statistică)
Dacă p gt 005 acceptăm ipoteza nulă (nu am obţinut semnificaţia statistică)
p = 013
NU respingem ipoteza nulă
Risc de eroare de tip II
α = 005
p = 002
Respingem ipoteza nulă
Risc de eroare de tip I
Semnificaţia lui p
Criteriu de luare a deciziei cu privire la o ipoteză statistică nulă
Cuantifică şansa ca o decizie de respingere a ipotezei nule să fie greşită
Măsură a semnificaţiei statistice şi NU CLINICĂ
22
Semnificaţia lui p (reguli empirice)
001 le p lt 005 rezultatul e semnificativ statistic
0001 le p lt 001 rezultatul e icircnalt semnificativ statistic
p lt 0001 rezultatul e foarte icircnalt semnificativ statistic
p ge 005 rezultatul e considerat nesemnificativ statistic
Limite ale valorii p
Valoarea p NU ne dă informaţii despre
Şansa de beneficiu a unui pacient individual
Procentul de pacienţi care vor avea un beneficiu icircn urma instituirii procedurii medicale
Gradul de beneficiu expectat pentru un anumit pacient
Puterea unui test statistic
Este capacitatea de a detecta o diferenţă acolo unde există
Creşterea volumului eşantionului determină creşterea puterii testului statistic aplicat
Valoarea este icircn relaţie directă cu eroarea de tip II
Puterea = 1 ndash β
Cea mai utilizată modalitate de creştere a puterii unui test statistic este de a creşte volumul
eşantionului
Tipul scalei de măsură ndash testul statistic
Denumire test Interval Nominal Observaţii
Corelaţie Pearson 2 0 Există o relaţie liniară
χ2 0 2
Student 1 1 Doar 2 grupuri
ANOVA 1 1 2 sau mai multe grupuri
Student perechi 1 1 Eşantioane perechi
Măsurători repetate (ANOVA) 1 1 Mai mult de 2 grupuri date
perechi
Inferenţa statistică pe date calitativ e
Tabela de contingenţă 2times2
Riscuri şi raţii
Testul χ2 (testarea asocierii icircn tabela de contingenţă)
Testul Fisher
23
Testul z pentru proporţii
Testul McNemar
Tabela de contingenţă 2times2
Scale de tip nominal (dicotomiale tabela de contingenţă de 2times2) sau ordinal (tabela de contingenţă de
rtimesc)
Frecvenţa absolută (numărul de evenimente per categorie)
Tabela de contingenţă de 2times2 4 categorii
AP = adevărat pozitiv
FP = fals pozitiv
FN = fals negativ
AN = adevărat negativ
Ulcer deschis Ulcer vindecat Total
Recurenţă + AP = 1 FP = 5 = 1+5 = 6
Recurenţă - FN = 7 AN = 16 = 7+16 = 23
Total =1+7=8 =5+16=21 29
Riscuri şi raţii Mărimi ale asocierii
Denumire Formula Definiţie
Rata falşilor pozitivi =FP(FP+AN) Probabilitatea unui test fals + (α)
Rata falşilor negativi =FN(FN+AP) Probabilitatea unui test fals ndash (β)
Sensibilitate =AP(AP+FN) Probabilitatea unui test real + (1- β)
Specificitate =AN(AN+FP) Probabilitatea unui test real ndash (1- α)
Acurateţe =(AP+AN)n Probabilitatea generală a unei decizii corecte
Valoarea predictivă pozitivă =AP(AP+FP) Probabilitatea ca un test pozitiv să fie corect
Valoarea predictivă negativă =AN(AN+FN) Probabilitatea ca un test negativ să fie corect
Riscul relativ =AP(FP+AN)FN(AP+FP)
Rata şansei =(AP∙AN)(FN∙FP)
Riscul atribuabil =AP(AP+FP)-FN(FN+AN)
24
Denumire Formula
Rata falşilor pozitivi = 5(5+1) = 08334
Rata falşilor negativi = 7(7+16) = 03043
Sensibilitate = 1(1+7) = 01250
Specificitate = 16(16+5) = 07619
Acurateţe = (1+16)29 = 05862
Valoarea predictivă pozitivă = 1(1+5) = 01667
Valoarea predictivă negativă = 16(16+7) = 06957
Riscul relativ = 1(5+16)7(1+5) = 2142 = 050
Rata şansei = (1∙16)(7∙5) = 04571
Riscul atribuabil = 1(1+5)-7(7+16) = 01667-03043=-01376
Testarea asocierii icircn tabela de contingenţă
Testul χ2
Nu trebuie utilizat pentru eşantioane de volum mic
Testul este valid doar dacă valoarea expectată (aşteptată) pentru fiecare celulă este cel puţin
egală cu 1 şi frecvenţa absolută observată este de minim 5
Dacă aceste condiţii nu sunt icircndeplinite se aplică testul exact al lui Fisher (Fisherrsquos Exact Test)
Indică dacă cele două variabile sunt sau nu independente DAR NU cuantifică puterea asocierii
dintre ele
Problema S-a investigat icircntr-un studiu asocierea dintre obezitatea (ca factor de risc) şi bolile
cardio-vasculare la persoanele icircn etate (gt 60 ani) Din totalul de 620 persoane investigate s-au
identificat 150 persoane cu obezitate şi boală cardio-vasculară 230 persoane fără obezitate şi
fără boală cardio-vasculară şi 60 persoane fără obezitate dar cu boală cardio-vasculară Există
o asociere icircntre obezitate şi boala cardio-vasculară (df=1 α=005 χ2critic = 384)
Testul χ2 exemplu
H025
Nu există asociere icircntre obezitate şi bolile cardio-vasculare
Obezitatea şi bolile cardio-vasculare sunt independente
H1
Există asociere icircntre obezitate şi bolile cardio-vasculare
Obezitatea şi bolile cardio-vasculare sunt asociate
a = 005 pragul de semnificaţie al testului
urmează o lege cu (r-1)(c-1) grade de libertate
χ2 = parametrul testului χ2
fio = frecvenţa observată
fit = frecvenţa teoretică
Regiunea critică este [χα2 yen)
Pentru α = 005 χα2 = 384
OBSERVAT BCV+ BCV- Total
Obezitate + AP = 150 FP = 180 330
Obezitate - FN = 60 AN = 230 290
Total 210 410 620
TEORETIC BCV+ BCV- Total
Obezitate + = 330times210620 = 330times410620 330
Obezitate - = 290times210620 = 290times410620 290
Total 210 410 620
TEORETIC BCV+ BCV- Total
Obezitate + = 330times210620 = 330times410620 330
26
Obezitate - = 290times210620 = 290times410620 290
Total 210 410 620
TEORETIC BCV+ BCV-
Obezitate + = 112 = 218
Obezitate - = 98 = 192
Deoarece 4177Icirc[384 yen) se respinge H0 cu un risc de eroare de 5
Există asociere icircntre obezitate şi bolile cardio-vasculare
Testul Fisher
Corecţie a testului χ2
Valoarea p asociată parametrului ne dă probabilitatea ca valoarea observată de independenţă să fie
atribuită doar şansei
O valoare p mică indică că există alte cauze decacirct şansa influenţează rezultatul şi astfel cele două
variabile investigate nu sunt independente
Testul Fisher = dispersia corectată a factorului x dispersia corectată a factorilor reziduali
Icircn acest context regula adunării dispersiilor se poate scrie unde
este variaţia lui y pe seama variaţiei variabilei x
este variaţia lui y pe seama influenţei factorilor reziduali (neicircnregistraţi)
este variaţia totală a caracteristicii y
Testul Fisher empiric se calculează după formula
27
se compară cu Ftab pentru nx şi nz grade de libertate la un anumit prag de semnificaţie stabilit
Dacă Fc gt Ftab rezultă că variaţia factorului de grupare x este semnificativă pentru variaţia caracteristicii y
Testul z pentru proporţii
1 Compararea unei frecvenţe observate cu o frecvenţă teoretică
2 Testarea egalităţii a două frecvenţe
Testul z Compararea unei frecvenţe observate cu o frecvenţă teoretică
Scop Investigarea semnificaţiei diferenţei icircntre o frecvenţă teoretică p (icircntr-o populaţie) şi o frecvenţă
observată f pe un eşantion reprezentativ (variabilă calitativă (binare))
Condiţii de aplicare Testul este corect aplicat dacă numărul n al observaţiilor eşantionului este
suficient de mare (n∙p n∙(1-p)gt10
Parametrul
n = volumul eşantionului
Suntem interesaţi de investigarea prevalenţei hepatitei B la personalul care lucrează icircn laboratoarele
clinicilor de boli infecţioase din Transilvania Se ştie din studii anterioare că prevalenţa hepatitei B icircn
populaţia generală din Transilvania este de 9 S-a luat icircn studiu un eşantion de 100 persoane şi s-a
obţinut o prevalenţă a hepatitei B de 6 Există diferenţă semnificativă icircntre frecvenţa hepatitei B la
personalul care lucrează icircn laboratoarele spitalelor de boli infecţioase din Transilvania faţă de
populaţia generală
f = 006 p = 009 n = 100
Ipoteza nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat
faţă de frecvenţa hepatitei B icircn populaţia generală
Ipoteza alternativă test bilateral Există diferenţă semnificativă icircntre frecvenţa hepatitei B la
nivelul eşantionului şi prevalenţa hepatitei B icircn populaţia generală
f = 006 p = 009 n = 100
Pragul de semnificaţie a = 005
Regiunea critică test bilateral (-yen -196 ]Egrave[196 yen)
28
Concluzia testului
Deoarece parametrul statistic calculat al testului nu aparţine regiunii critice se acceptă ipoteza
nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat faţă de
frecvenţa hepatitei B icircn populaţia generală
Testul McNemar
Evaluarea dependenţei variabilelor calitative perechi (dorim să determinăm dacă o anumită
caracteristică este sau nu asociată cu o anumită patologie)
Identificăm n pacienţi care prezintă patologia de interes (eg Cancer bronho-pulmonar) şi n
pacienţi cu aceleaşi caracteristici ca şi primul grup dar care nu o prezintă
Martor = da Martor = nu
Caz = da a b
Caz = nu c d
Testul McNemar - exemplu fumat vs cancer
Martor = da Martor = nu
Cancer = da a = 2 b = 5
Cancer = nu c = 0 d = 3
29
χ2critic(α=005) = 384
32 lt 384 rarr acceptăm ipoteza nulă
Fumatul nu este icircn relaţie cu apariţia cancerului bronho-pulmonar
Inferenţa statistică pe date cantitative
Variabile cantitative continue
Testul z şi Student (t) (o medie sau medii perechi)
Testul z şi Student (t) (testarea a două medii)
ANOVA (ge 3 medii)
Ranguri (variabile cantitative discrete sau cantitative care nu icircndeplinesc condiţia de
normalitate)
Testul sumei rangurilor Wilcoxon
Kruskal-Wallis (ge 3 eşantioane independente)
Friedman (ge 3 eşantioane dependente)
Teste de normalitate variabile cantitative continue
Shapiro-Wilk
Kolmogorov-Smirnov
Shapiro-Wilk
Chi-Square Goodness-of-Fit
Dacă datele urmează o distribuţie normală aplicăm un test parametric
Dacă datele nu urmează o distribuţie normală aplicăm un test de comparare al rangurilor
30
Testul Z de comparare a mediei unui eşantion cu media unei populaţii
Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ
extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie
s2 care se cunoaşte
Condiţii de aplicare
1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru
compararea mediei unui eşantion cu media unei populaţii)
2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal
distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă
3 Talia eşantionului este mare ( ge 30)
Ipoteze
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media
eşantionului şi media populaţiei
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
(-yen -196 ] Egrave [196 yen)
Parametrul testului
n = volumul eşantionului
= media eşantionului
s = deviaţia standard a populaţiei
Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)
Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard
cunoscută
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi
media standard
Condiţii de aplicare
Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se
realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această
condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea
31
Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai
puternic
Numărul de grade de libertate (df) df = n-1
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
Parametrul testului
n = volumul eşantionului
micro0 = media standard
= media eşantionului
s = deviaţia standard a eşantionului
Testul ANOVA compararea mediilor a mai multe eşantioane
H0 = toate mediile sunt egale
H1 = nu toate mediile sunt egale
Condiţii de aplicare
1 Datele sunt independente unele faţă de celelalte
2 Datele fiecărui grup sunt normal distribuite
3 Deviaţia standard este aceeaşi pentru toate grupurile
Id Medicament
A B C D E F
1 5 6 7 10 5 9
2 6 8 8 11 8 8
3 7 7 9 13 6 7
4 8 9 11 12 4 5
32
5 9 10 10 9 7 6
Suma 35 40 45 55 30 35
Media 7 8 9 11 6 7
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =
= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)
Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2
F = (suma pătratelor(icircntre))(suma pătratelor(icircn))
Suma pătratelor (icircntre) = 16times5 = 80
Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60
Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn
interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare
SP df Media pătratelor F = MPicircntreMPicircn
Icircntre 80 5 = 805 = 16 = 1625 = 64
Icircn 60 24 = 6024 = 25
Total 140 29 -
Testul sumei rangurilor Wilcoxon
Aplicat pentru
Un set de observaţii provenite dintr-o valoare ipotetică comună
Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)
Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero
Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace
Suma rangurilor pentru diferenţele negative = 2+3+1 = 6
Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30
33
Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului
egal cu 8 = 0109
Icircnainte După Diferenţa Rang
64 66 -2 2
66 58 8 5
67 68 -1 3
71 65 6 4
72 75 -3 1
76 67 9 6
78 59 19 8
89 74 15 7
Testul Kruskal-Wallis (ge 3 eşantioane independente)
Test de ranguri aplicate pe mai mult de 3 eşantioane
H = parametrul testului
n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)
Tk = suma rangurilor
Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie
pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni
34
df = k-1 (k = numărul de eşantioane)
df = 3-1 = 2
Hcritic(α=005) = 599
H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie
pozitivă şi respectiv biopsie negativă
Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie
a tipului de studiu pe eşantioane perechi)
1 Definirea numărului de tratamente k
2 Obţinerea rangurilor pentru fiecare tratament
3 Sumarea rangurilor fiecărui tratament
4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)
5 Dacă Fr gt Frcritic rarr respingem H0
Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost
măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi
n = 9 k = 3 T12 = 225 T2
2 = 38025 T32 = 38025
Frcritic = 599
Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de
prostată
35
De reţinut
Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei
Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-
of-Fit
Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z
Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t
Compararea mediilor a 3 sau mai multe eşantioane ANOVA
Compararea mediilor a două populaţii (σ) testul Z
Compararea mediilor a două eşantioane (s) testul t
Compararea mediilor a două eşantioane perechi (s) testul t
ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi
cu cel pentru compararea a două eşantioane perechi
Ranguri
Distribuţia datelor nu are importanţă
Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)
Trei sau mai multe eşantioane Kruskal-Wallis
Trei sau mai multe eşantioane perechi Friedman
Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia
Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a
datelor)
Variabile nominale
Un singur eşantion sau eşantioane perechi
Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte
Eşantioane perechi testul Mc Nemar
Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2
Icircn analiza proporţiilor există teste diferite pentru
Compararea unei frecvenţe cu o frecvenţă cunoscută
Compararea a două frecvenţe
Semnificaţia statistică
Valoarea p (p value)
Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor
două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E
posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării
aleatorii
36
Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală
urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii
Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este
probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un
experiment de dimensiunea acestuia
Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că
diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii
diferite
Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca
fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă
ar fi fost adevărată
Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă
1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe
baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De
fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001
2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie
3 Se aplică testul statistic aferent pentru a calcula valoarea p
4 Se compară valoarea p cu valoarea ndash prag
5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe
semnificativă dpdv statisticrdquo
6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e
semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să
conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă
Teste de semnificaţie
Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului
populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)
Testarea ipotezelor implică posibile erori
Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile
sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui
grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul
icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005
ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există
37
nici o diferenţă
Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ
statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de
ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost
ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau
dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă
cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă
semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe
ipotetice variate icircn cazul icircn care ele există
Măsuri ale frecvenţei
Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)
Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate
Generic formula pe care se bazează toate cele trei este
unde x şi y sunt cantităţile de comparat
Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea
unei frecvenţe pe grupe de sex vacircrstă etc
Proporţia implică icircn mod necesar ca x să fie inclus icircn y
Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară
frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp
Pentru calcularea unei rate trebuie ţinut cont de trei aspecte
bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin
bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp
bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo
Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un
tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei
populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei
aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)
38
Indicatori
Rata de incidenţă
Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă
icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii
Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o
perioadă de timp
Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de
timp x
Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei
susceptibili de a dezvolta icircmbolnăvirea studiată
Numitorul poate fi
bull Numărul mediu al populaţiei icircn perioada de timp studiată
bull Mărimea populaţiei icircn mijlocul perioadei de studiu
bull Mărimea populaţiei la icircnceputul studiului
Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă
Este obligatorie menţionarea perioadei de timp
Prevalenţa
Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la
un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă
schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa
momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)
39
Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include
numai cazuri noi respectiv include cazuri noi şi vechi
Rata de atac
Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este
folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp
raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori
Rata persoană-timp
Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din
momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte
migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost
observate
Riscul relativ (RR)
Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment
legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele
prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două
grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la
bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la
bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai
mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo
Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2
Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn
cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă
(Tabelul 1)
Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR
Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la
neexpuşi
40
Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de
culegere a datelor
Odds ratio (OR)
Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin
raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general
studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)
Tabelul 2 Tabelul 2 x 2 pentru calcularea OR
Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală
Rate de mortalitate
Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp
specificată Există mai multe tipuri de rate de mortalitate
o Mortalitate specifică pe sex
o Mortalitate specifică pe rasă
o Mortalitate specifică pe boală
o Mortalitate neonatală
o Mortalitate postneonatală
o Mortalitate infantilă
o Mortalitate maternă
Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP
41
Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de
viaţă şi vacircrsta la care survine decesul dacă este prematur
Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu
Ani de viaţă pierduţi datorat dizabilităţii
Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt
utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru
cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite
grupuri
Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de
risc şi o boală se folosesc riscul relativ şi odds ratio
35 Analiza şi interpretarea datelor
După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date
trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul
Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor
colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului
studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu
plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde
prezenţa biostatisticianului este necesară
Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu
elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat
iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului
iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate
depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori
testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere
clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza
Interpretarea rezultatelor statistice
Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne
motive (număr mic de date) acceptarea ei să fie falsă
Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine
gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia
ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument
de decizie Intervalul de confidenţă
42
Interpretarea statistica ne interpretarea clinică
Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă
Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice
obţinute pe eşantionul studiat
Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare
Ce interpretăm Rezultatele
personale obţinute icircn urma studiului
care au fost prezentate icircn secţiunea bdquoRezultaterdquo
Explicăm rezultatele obţinute
Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale
Interpretarea trebuie să se realizeze icircn
lumina limitelor studiului
contextul cultural social şi educaţional al locului unde s-a realizat cercetarea
contextul a ceea ce se cunoaşte din literatura de specialitate
Interpretăm doar rezultatele personale obţinute icircn urma studiului
Interpretarea statistică nu este tot una cu interpretarea clinică
Interpretarea statistică este importantă
Interpretarea clinică este foarte importantă
Intervalul de confidenţă
Media calculată pe baza unui eşantion nu va echivala media populaţiei
Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului
Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a
populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a
populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)
pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru
orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare
dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de
confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de
date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de
5
Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel
Dacă valoarea p este mică
Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare
aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o
medie diferită Diferenţa este semnificativă dpdv statistic
43
Icircn continuare
Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa
reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică
pentru a fi interesante din punct de vedere ştiinţific
Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC
oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care
este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a
obţine o concluzie clară
Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o
diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că
datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din
punct de vedere ştiinţific
Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul
detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat
Erorile studiilor medicale
Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura
anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară
caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea
asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri
legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias
Erorile potenţiale icircn studiile epidemiologice
1 Erori icircntacircmplătoare
2 Erori sistematice
3 Confuzia
4 Validitatea
1 Erori icircntacircmplătoare
Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a
parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel
de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot
fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii
(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor
de măsură (eroarea de măsurare)
44
2 Erori sistematice
Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate
care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu
acurateţe mare Acurateţea nu este afectată de mărimea eşantionului
Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de
experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea
dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus
şi greu de cuantificat (consum de alcool personalitate etc)
Principalele tipuri de erori din această categorie sunt
bull Biasul de selecţie
bull Biasul de informaţie
Biasul de selecţie
Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul
trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion
inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale
persoanelor incluse
Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se
ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia
Biasul de informaţie
Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de
instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze
expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere
nesemnificativă sau chiar să nu şi-o amintească de loc
3 Confuzia
Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune
prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este
cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă
de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte
important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor
protector
4 Validitatea
Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă
Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte
estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional
Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă
45
conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se
demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)
Validitatea externă se poate realiza numai dacă studiul este valid intern
Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii
studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de
studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt
laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi
validă din punct de vedere intern)
3 6 Prezentarea rezultatelor
După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite
Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor
icircntr-o formă bdquodigerabilărdquo este necesară
Scopul prezentării datelor
1 Transmiterea concluziilor studiului
a Datele corecte şi importante merită comunicate
b Datele trebuie să confirme sau să infirme ipoteza studiului
c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală
2 Acordarea posibilităţii altor cercetători să aprecieze studiul
a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti
b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor
prezentate
Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru
fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie
statistică
Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de
valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras
(Tabel 3)
Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)
46
Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct
numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor
precum şi prezentarea acestora sub formă inteligibilă
Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care
convin cercetătorului
Prezentarea datelor se poate face
1 Figuri şi tabele icircn articole scrise
2 Figuri şi tabele icircn prezentări orale
3 Figuri şi tabele icircn postere
4 Text scris sau incluse icircn text
5 Site-uri de WEB
Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor
Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie
Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele
exprimacircnd exact ceea ce acestea exprimă
Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate
anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel
să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se
acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca
mai sus sugestive sunt formatele simple şi puţin icircncărcate
Dacă nu există reguli impuse se respectă
1 Mesaj simplu fără falsificarea datelor
2 De obicei este necesar atacirct tabelul cacirct şi graficul
3 Să fie simplu şi clar
Tabele
Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile
coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică
elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de
1 Se folosesc doar linii orizontale
2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn
evidenţi prin linie de separare (Tabelul 4)
Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland
Noua Zeelandă)
(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)
47
3 Numerele sunt aliniate icircn funcţie de virgulă
4 Indicii statistici sunt explicaţi sub tabel
5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană
6 Abrevierile pot fi folosite
7 Numărul de zecimale trebuie limitat la maxim două
8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel
9 Plasarea legendei este obligatorie sub tabel
10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)
Icircn cazul prezentărilor orale sau a posterelor este indicat ca
1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării
2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte
3 Folosirea de simboluri este permisă
Clasificarea tabelelor
Tabelele se clasifică după
i) conţinut
bull cu distribuţii de frecvenţe
bull de clase de frecvenţe
bull de contingenţă
ii) structura
bull cu doua coloane
bull cu subclasificări
bull ldquomasterrdquo
Tabele ce conţin distribuţii de frecvenţe
O modalitate comodă de a prezenta o mulţime de date brute este
1 Se ordonează datele in ordine crescătoare
2 Se determine frecvenţa fiecărei valori
3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane
(Tabelul 5)
Tabelul 5 Distribuţii de frecvenţă absolută
48
Tabelul claselor de frecvenţe
1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă
2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)
Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)
Tabele de contingenţă
1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a
tabelelor de contingenţă
2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a
combinaţiilor de perechi ordonate de valori
3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre
a factor de risc si
b starea sănătăţii
4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)
5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)
Tabelul 7 Tabel de contingenţă 2 x 2
49
Grafice
Există două categorii de moduri grafice sub care se pot prezenta datele
1 Ilustraţii şi fotografii
2 Grafice
1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă
pentru lucrare
2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit
Putem vorbi despre mai multe tipuri de grafice
bull Grafice pentru reprezentarea datelor cantitative
1048707 Grafic cartezian (X Y)
1048707 Histograma
1048707 Poligonul de frecvenţe
1048707 Diagrama bdquoscatterrdquo
bull Grafice pentru reprezentarea datelor calitative
1048707 Grafic cu bare
1048707 Diagrama tip bdquoboxplotrdquo
1048707 Diagrama bdquopierdquo
1048707 Cartograma
Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi
dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)
Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)
Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie
Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)
Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)
50
Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir
de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele
două variabile studiate (Figura 6)
Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2
(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2
rămacircne aproximativ constantă)
Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea
comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea
comparativă a mai multor variabile
Figura 7 Grafic calitativ cu bare
51
Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo
Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două
posibilităţi reprezentate grafic este mai frecventă (Figura 8)
Figura 8 Reprezentare tip bdquopierdquo
Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli
sau a oricărui element comparativ Se foloseşte de epidemiologi
Rezultate
Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare
Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o
manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu
explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția
bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la
ilustraţii tabele grafice
Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi
nici rezultatele care invalidează eventual ipoteza
Discuţii
Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd
cultura ştiinţifică şi inteligenţa autorilor
Acest capitol răspunde la trei obiective
Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia
calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de
selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează
rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv
52
este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn
care a fost abordată problema fără a face o revistă a literaturii
Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea
rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul
Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor
afirmaţii nesusţinute de conţinutul lucrării
Concluzii
Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate
să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie
Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de
concluzii va scădea valoarea lucrării
Bibliografia (lista referinţelor citarea icircn text)
Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn
lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente
Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli
- să conţină cele mai importante şi recente lucrări
- să includă numai lucrări publicate
- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate
Bibliografie
Elisabeta Jaba ndash Statistică Ed Economică 1998
Mihai Ţarcă ndash Statistică volI Ed UAIC 1979
Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale
Ed University Press 2009
Sorana Daniela Bolboacă ndash Metodologia cercetării curs
53
- Regiunea critică trebuie astfel aleasă icircncacirct dacă ipoteza alternativă H1 este adevărată
probabilitatea de respingere a ipotezei nule H0 este mai mare decacirct icircn cazul icircn care ipoteza nulă H0
ar fi adevărată
- Acceptarea ipotezei nule H0 atunci cacircnd ipoteza alternativă H1 este adevărată este cunoscută ca şi
eroarea de tipul II
a probabilitatea ei se notează cu b
b măsoară bdquonivelul de eroarerdquo
- Icircn testarea oricărei ipoteze statistice există patru situaţii care determină dacă decizia noastră este
corectă sau nu
Cazuri
H0 este adevărată H0 este falsă
Concluzie H0 se acceptă decizie corectă eroare de tipul
II
H0 se
respinge
eroare de tipul I decizie corectă
Luarea deciziei pe baza valorii probabilităţii p de semnificaţie a testului
Icircn momentul icircn care prelucrăm statistic o serie de date dorim să ştim dacă rezultatele obţinute sunt sau
nu semnificative statistic
Răspunsul la această icircntrebare este dat de valoarea lui p calculată de orice program statistic la
prelucrarea unor date
Icircn cazul testelor statistice ipoteza nulă este respinsă dacă nivelul de semnificaţie este mai mic decacirct
005 iar programele de prelucrare statistică a datelor vor afişa o steluţă () icircn tabelul rezultatelor
21
Dacă p le 005 respingem ipoteza nulă şi acceptăm ipoteza alternativă (am obţinut semnificaţia
statistică)
Dacă p gt 005 acceptăm ipoteza nulă (nu am obţinut semnificaţia statistică)
p = 013
NU respingem ipoteza nulă
Risc de eroare de tip II
α = 005
p = 002
Respingem ipoteza nulă
Risc de eroare de tip I
Semnificaţia lui p
Criteriu de luare a deciziei cu privire la o ipoteză statistică nulă
Cuantifică şansa ca o decizie de respingere a ipotezei nule să fie greşită
Măsură a semnificaţiei statistice şi NU CLINICĂ
22
Semnificaţia lui p (reguli empirice)
001 le p lt 005 rezultatul e semnificativ statistic
0001 le p lt 001 rezultatul e icircnalt semnificativ statistic
p lt 0001 rezultatul e foarte icircnalt semnificativ statistic
p ge 005 rezultatul e considerat nesemnificativ statistic
Limite ale valorii p
Valoarea p NU ne dă informaţii despre
Şansa de beneficiu a unui pacient individual
Procentul de pacienţi care vor avea un beneficiu icircn urma instituirii procedurii medicale
Gradul de beneficiu expectat pentru un anumit pacient
Puterea unui test statistic
Este capacitatea de a detecta o diferenţă acolo unde există
Creşterea volumului eşantionului determină creşterea puterii testului statistic aplicat
Valoarea este icircn relaţie directă cu eroarea de tip II
Puterea = 1 ndash β
Cea mai utilizată modalitate de creştere a puterii unui test statistic este de a creşte volumul
eşantionului
Tipul scalei de măsură ndash testul statistic
Denumire test Interval Nominal Observaţii
Corelaţie Pearson 2 0 Există o relaţie liniară
χ2 0 2
Student 1 1 Doar 2 grupuri
ANOVA 1 1 2 sau mai multe grupuri
Student perechi 1 1 Eşantioane perechi
Măsurători repetate (ANOVA) 1 1 Mai mult de 2 grupuri date
perechi
Inferenţa statistică pe date calitativ e
Tabela de contingenţă 2times2
Riscuri şi raţii
Testul χ2 (testarea asocierii icircn tabela de contingenţă)
Testul Fisher
23
Testul z pentru proporţii
Testul McNemar
Tabela de contingenţă 2times2
Scale de tip nominal (dicotomiale tabela de contingenţă de 2times2) sau ordinal (tabela de contingenţă de
rtimesc)
Frecvenţa absolută (numărul de evenimente per categorie)
Tabela de contingenţă de 2times2 4 categorii
AP = adevărat pozitiv
FP = fals pozitiv
FN = fals negativ
AN = adevărat negativ
Ulcer deschis Ulcer vindecat Total
Recurenţă + AP = 1 FP = 5 = 1+5 = 6
Recurenţă - FN = 7 AN = 16 = 7+16 = 23
Total =1+7=8 =5+16=21 29
Riscuri şi raţii Mărimi ale asocierii
Denumire Formula Definiţie
Rata falşilor pozitivi =FP(FP+AN) Probabilitatea unui test fals + (α)
Rata falşilor negativi =FN(FN+AP) Probabilitatea unui test fals ndash (β)
Sensibilitate =AP(AP+FN) Probabilitatea unui test real + (1- β)
Specificitate =AN(AN+FP) Probabilitatea unui test real ndash (1- α)
Acurateţe =(AP+AN)n Probabilitatea generală a unei decizii corecte
Valoarea predictivă pozitivă =AP(AP+FP) Probabilitatea ca un test pozitiv să fie corect
Valoarea predictivă negativă =AN(AN+FN) Probabilitatea ca un test negativ să fie corect
Riscul relativ =AP(FP+AN)FN(AP+FP)
Rata şansei =(AP∙AN)(FN∙FP)
Riscul atribuabil =AP(AP+FP)-FN(FN+AN)
24
Denumire Formula
Rata falşilor pozitivi = 5(5+1) = 08334
Rata falşilor negativi = 7(7+16) = 03043
Sensibilitate = 1(1+7) = 01250
Specificitate = 16(16+5) = 07619
Acurateţe = (1+16)29 = 05862
Valoarea predictivă pozitivă = 1(1+5) = 01667
Valoarea predictivă negativă = 16(16+7) = 06957
Riscul relativ = 1(5+16)7(1+5) = 2142 = 050
Rata şansei = (1∙16)(7∙5) = 04571
Riscul atribuabil = 1(1+5)-7(7+16) = 01667-03043=-01376
Testarea asocierii icircn tabela de contingenţă
Testul χ2
Nu trebuie utilizat pentru eşantioane de volum mic
Testul este valid doar dacă valoarea expectată (aşteptată) pentru fiecare celulă este cel puţin
egală cu 1 şi frecvenţa absolută observată este de minim 5
Dacă aceste condiţii nu sunt icircndeplinite se aplică testul exact al lui Fisher (Fisherrsquos Exact Test)
Indică dacă cele două variabile sunt sau nu independente DAR NU cuantifică puterea asocierii
dintre ele
Problema S-a investigat icircntr-un studiu asocierea dintre obezitatea (ca factor de risc) şi bolile
cardio-vasculare la persoanele icircn etate (gt 60 ani) Din totalul de 620 persoane investigate s-au
identificat 150 persoane cu obezitate şi boală cardio-vasculară 230 persoane fără obezitate şi
fără boală cardio-vasculară şi 60 persoane fără obezitate dar cu boală cardio-vasculară Există
o asociere icircntre obezitate şi boala cardio-vasculară (df=1 α=005 χ2critic = 384)
Testul χ2 exemplu
H025
Nu există asociere icircntre obezitate şi bolile cardio-vasculare
Obezitatea şi bolile cardio-vasculare sunt independente
H1
Există asociere icircntre obezitate şi bolile cardio-vasculare
Obezitatea şi bolile cardio-vasculare sunt asociate
a = 005 pragul de semnificaţie al testului
urmează o lege cu (r-1)(c-1) grade de libertate
χ2 = parametrul testului χ2
fio = frecvenţa observată
fit = frecvenţa teoretică
Regiunea critică este [χα2 yen)
Pentru α = 005 χα2 = 384
OBSERVAT BCV+ BCV- Total
Obezitate + AP = 150 FP = 180 330
Obezitate - FN = 60 AN = 230 290
Total 210 410 620
TEORETIC BCV+ BCV- Total
Obezitate + = 330times210620 = 330times410620 330
Obezitate - = 290times210620 = 290times410620 290
Total 210 410 620
TEORETIC BCV+ BCV- Total
Obezitate + = 330times210620 = 330times410620 330
26
Obezitate - = 290times210620 = 290times410620 290
Total 210 410 620
TEORETIC BCV+ BCV-
Obezitate + = 112 = 218
Obezitate - = 98 = 192
Deoarece 4177Icirc[384 yen) se respinge H0 cu un risc de eroare de 5
Există asociere icircntre obezitate şi bolile cardio-vasculare
Testul Fisher
Corecţie a testului χ2
Valoarea p asociată parametrului ne dă probabilitatea ca valoarea observată de independenţă să fie
atribuită doar şansei
O valoare p mică indică că există alte cauze decacirct şansa influenţează rezultatul şi astfel cele două
variabile investigate nu sunt independente
Testul Fisher = dispersia corectată a factorului x dispersia corectată a factorilor reziduali
Icircn acest context regula adunării dispersiilor se poate scrie unde
este variaţia lui y pe seama variaţiei variabilei x
este variaţia lui y pe seama influenţei factorilor reziduali (neicircnregistraţi)
este variaţia totală a caracteristicii y
Testul Fisher empiric se calculează după formula
27
se compară cu Ftab pentru nx şi nz grade de libertate la un anumit prag de semnificaţie stabilit
Dacă Fc gt Ftab rezultă că variaţia factorului de grupare x este semnificativă pentru variaţia caracteristicii y
Testul z pentru proporţii
1 Compararea unei frecvenţe observate cu o frecvenţă teoretică
2 Testarea egalităţii a două frecvenţe
Testul z Compararea unei frecvenţe observate cu o frecvenţă teoretică
Scop Investigarea semnificaţiei diferenţei icircntre o frecvenţă teoretică p (icircntr-o populaţie) şi o frecvenţă
observată f pe un eşantion reprezentativ (variabilă calitativă (binare))
Condiţii de aplicare Testul este corect aplicat dacă numărul n al observaţiilor eşantionului este
suficient de mare (n∙p n∙(1-p)gt10
Parametrul
n = volumul eşantionului
Suntem interesaţi de investigarea prevalenţei hepatitei B la personalul care lucrează icircn laboratoarele
clinicilor de boli infecţioase din Transilvania Se ştie din studii anterioare că prevalenţa hepatitei B icircn
populaţia generală din Transilvania este de 9 S-a luat icircn studiu un eşantion de 100 persoane şi s-a
obţinut o prevalenţă a hepatitei B de 6 Există diferenţă semnificativă icircntre frecvenţa hepatitei B la
personalul care lucrează icircn laboratoarele spitalelor de boli infecţioase din Transilvania faţă de
populaţia generală
f = 006 p = 009 n = 100
Ipoteza nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat
faţă de frecvenţa hepatitei B icircn populaţia generală
Ipoteza alternativă test bilateral Există diferenţă semnificativă icircntre frecvenţa hepatitei B la
nivelul eşantionului şi prevalenţa hepatitei B icircn populaţia generală
f = 006 p = 009 n = 100
Pragul de semnificaţie a = 005
Regiunea critică test bilateral (-yen -196 ]Egrave[196 yen)
28
Concluzia testului
Deoarece parametrul statistic calculat al testului nu aparţine regiunii critice se acceptă ipoteza
nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat faţă de
frecvenţa hepatitei B icircn populaţia generală
Testul McNemar
Evaluarea dependenţei variabilelor calitative perechi (dorim să determinăm dacă o anumită
caracteristică este sau nu asociată cu o anumită patologie)
Identificăm n pacienţi care prezintă patologia de interes (eg Cancer bronho-pulmonar) şi n
pacienţi cu aceleaşi caracteristici ca şi primul grup dar care nu o prezintă
Martor = da Martor = nu
Caz = da a b
Caz = nu c d
Testul McNemar - exemplu fumat vs cancer
Martor = da Martor = nu
Cancer = da a = 2 b = 5
Cancer = nu c = 0 d = 3
29
χ2critic(α=005) = 384
32 lt 384 rarr acceptăm ipoteza nulă
Fumatul nu este icircn relaţie cu apariţia cancerului bronho-pulmonar
Inferenţa statistică pe date cantitative
Variabile cantitative continue
Testul z şi Student (t) (o medie sau medii perechi)
Testul z şi Student (t) (testarea a două medii)
ANOVA (ge 3 medii)
Ranguri (variabile cantitative discrete sau cantitative care nu icircndeplinesc condiţia de
normalitate)
Testul sumei rangurilor Wilcoxon
Kruskal-Wallis (ge 3 eşantioane independente)
Friedman (ge 3 eşantioane dependente)
Teste de normalitate variabile cantitative continue
Shapiro-Wilk
Kolmogorov-Smirnov
Shapiro-Wilk
Chi-Square Goodness-of-Fit
Dacă datele urmează o distribuţie normală aplicăm un test parametric
Dacă datele nu urmează o distribuţie normală aplicăm un test de comparare al rangurilor
30
Testul Z de comparare a mediei unui eşantion cu media unei populaţii
Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ
extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie
s2 care se cunoaşte
Condiţii de aplicare
1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru
compararea mediei unui eşantion cu media unei populaţii)
2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal
distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă
3 Talia eşantionului este mare ( ge 30)
Ipoteze
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media
eşantionului şi media populaţiei
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
(-yen -196 ] Egrave [196 yen)
Parametrul testului
n = volumul eşantionului
= media eşantionului
s = deviaţia standard a populaţiei
Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)
Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard
cunoscută
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi
media standard
Condiţii de aplicare
Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se
realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această
condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea
31
Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai
puternic
Numărul de grade de libertate (df) df = n-1
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
Parametrul testului
n = volumul eşantionului
micro0 = media standard
= media eşantionului
s = deviaţia standard a eşantionului
Testul ANOVA compararea mediilor a mai multe eşantioane
H0 = toate mediile sunt egale
H1 = nu toate mediile sunt egale
Condiţii de aplicare
1 Datele sunt independente unele faţă de celelalte
2 Datele fiecărui grup sunt normal distribuite
3 Deviaţia standard este aceeaşi pentru toate grupurile
Id Medicament
A B C D E F
1 5 6 7 10 5 9
2 6 8 8 11 8 8
3 7 7 9 13 6 7
4 8 9 11 12 4 5
32
5 9 10 10 9 7 6
Suma 35 40 45 55 30 35
Media 7 8 9 11 6 7
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =
= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)
Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2
F = (suma pătratelor(icircntre))(suma pătratelor(icircn))
Suma pătratelor (icircntre) = 16times5 = 80
Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60
Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn
interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare
SP df Media pătratelor F = MPicircntreMPicircn
Icircntre 80 5 = 805 = 16 = 1625 = 64
Icircn 60 24 = 6024 = 25
Total 140 29 -
Testul sumei rangurilor Wilcoxon
Aplicat pentru
Un set de observaţii provenite dintr-o valoare ipotetică comună
Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)
Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero
Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace
Suma rangurilor pentru diferenţele negative = 2+3+1 = 6
Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30
33
Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului
egal cu 8 = 0109
Icircnainte După Diferenţa Rang
64 66 -2 2
66 58 8 5
67 68 -1 3
71 65 6 4
72 75 -3 1
76 67 9 6
78 59 19 8
89 74 15 7
Testul Kruskal-Wallis (ge 3 eşantioane independente)
Test de ranguri aplicate pe mai mult de 3 eşantioane
H = parametrul testului
n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)
Tk = suma rangurilor
Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie
pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni
34
df = k-1 (k = numărul de eşantioane)
df = 3-1 = 2
Hcritic(α=005) = 599
H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie
pozitivă şi respectiv biopsie negativă
Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie
a tipului de studiu pe eşantioane perechi)
1 Definirea numărului de tratamente k
2 Obţinerea rangurilor pentru fiecare tratament
3 Sumarea rangurilor fiecărui tratament
4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)
5 Dacă Fr gt Frcritic rarr respingem H0
Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost
măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi
n = 9 k = 3 T12 = 225 T2
2 = 38025 T32 = 38025
Frcritic = 599
Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de
prostată
35
De reţinut
Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei
Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-
of-Fit
Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z
Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t
Compararea mediilor a 3 sau mai multe eşantioane ANOVA
Compararea mediilor a două populaţii (σ) testul Z
Compararea mediilor a două eşantioane (s) testul t
Compararea mediilor a două eşantioane perechi (s) testul t
ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi
cu cel pentru compararea a două eşantioane perechi
Ranguri
Distribuţia datelor nu are importanţă
Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)
Trei sau mai multe eşantioane Kruskal-Wallis
Trei sau mai multe eşantioane perechi Friedman
Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia
Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a
datelor)
Variabile nominale
Un singur eşantion sau eşantioane perechi
Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte
Eşantioane perechi testul Mc Nemar
Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2
Icircn analiza proporţiilor există teste diferite pentru
Compararea unei frecvenţe cu o frecvenţă cunoscută
Compararea a două frecvenţe
Semnificaţia statistică
Valoarea p (p value)
Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor
două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E
posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării
aleatorii
36
Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală
urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii
Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este
probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un
experiment de dimensiunea acestuia
Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că
diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii
diferite
Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca
fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă
ar fi fost adevărată
Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă
1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe
baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De
fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001
2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie
3 Se aplică testul statistic aferent pentru a calcula valoarea p
4 Se compară valoarea p cu valoarea ndash prag
5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe
semnificativă dpdv statisticrdquo
6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e
semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să
conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă
Teste de semnificaţie
Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului
populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)
Testarea ipotezelor implică posibile erori
Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile
sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui
grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul
icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005
ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există
37
nici o diferenţă
Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ
statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de
ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost
ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau
dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă
cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă
semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe
ipotetice variate icircn cazul icircn care ele există
Măsuri ale frecvenţei
Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)
Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate
Generic formula pe care se bazează toate cele trei este
unde x şi y sunt cantităţile de comparat
Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea
unei frecvenţe pe grupe de sex vacircrstă etc
Proporţia implică icircn mod necesar ca x să fie inclus icircn y
Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară
frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp
Pentru calcularea unei rate trebuie ţinut cont de trei aspecte
bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin
bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp
bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo
Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un
tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei
populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei
aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)
38
Indicatori
Rata de incidenţă
Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă
icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii
Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o
perioadă de timp
Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de
timp x
Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei
susceptibili de a dezvolta icircmbolnăvirea studiată
Numitorul poate fi
bull Numărul mediu al populaţiei icircn perioada de timp studiată
bull Mărimea populaţiei icircn mijlocul perioadei de studiu
bull Mărimea populaţiei la icircnceputul studiului
Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă
Este obligatorie menţionarea perioadei de timp
Prevalenţa
Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la
un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă
schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa
momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)
39
Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include
numai cazuri noi respectiv include cazuri noi şi vechi
Rata de atac
Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este
folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp
raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori
Rata persoană-timp
Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din
momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte
migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost
observate
Riscul relativ (RR)
Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment
legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele
prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două
grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la
bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la
bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai
mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo
Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2
Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn
cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă
(Tabelul 1)
Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR
Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la
neexpuşi
40
Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de
culegere a datelor
Odds ratio (OR)
Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin
raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general
studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)
Tabelul 2 Tabelul 2 x 2 pentru calcularea OR
Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală
Rate de mortalitate
Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp
specificată Există mai multe tipuri de rate de mortalitate
o Mortalitate specifică pe sex
o Mortalitate specifică pe rasă
o Mortalitate specifică pe boală
o Mortalitate neonatală
o Mortalitate postneonatală
o Mortalitate infantilă
o Mortalitate maternă
Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP
41
Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de
viaţă şi vacircrsta la care survine decesul dacă este prematur
Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu
Ani de viaţă pierduţi datorat dizabilităţii
Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt
utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru
cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite
grupuri
Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de
risc şi o boală se folosesc riscul relativ şi odds ratio
35 Analiza şi interpretarea datelor
După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date
trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul
Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor
colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului
studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu
plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde
prezenţa biostatisticianului este necesară
Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu
elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat
iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului
iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate
depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori
testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere
clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza
Interpretarea rezultatelor statistice
Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne
motive (număr mic de date) acceptarea ei să fie falsă
Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine
gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia
ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument
de decizie Intervalul de confidenţă
42
Interpretarea statistica ne interpretarea clinică
Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă
Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice
obţinute pe eşantionul studiat
Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare
Ce interpretăm Rezultatele
personale obţinute icircn urma studiului
care au fost prezentate icircn secţiunea bdquoRezultaterdquo
Explicăm rezultatele obţinute
Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale
Interpretarea trebuie să se realizeze icircn
lumina limitelor studiului
contextul cultural social şi educaţional al locului unde s-a realizat cercetarea
contextul a ceea ce se cunoaşte din literatura de specialitate
Interpretăm doar rezultatele personale obţinute icircn urma studiului
Interpretarea statistică nu este tot una cu interpretarea clinică
Interpretarea statistică este importantă
Interpretarea clinică este foarte importantă
Intervalul de confidenţă
Media calculată pe baza unui eşantion nu va echivala media populaţiei
Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului
Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a
populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a
populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)
pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru
orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare
dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de
confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de
date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de
5
Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel
Dacă valoarea p este mică
Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare
aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o
medie diferită Diferenţa este semnificativă dpdv statistic
43
Icircn continuare
Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa
reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică
pentru a fi interesante din punct de vedere ştiinţific
Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC
oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care
este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a
obţine o concluzie clară
Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o
diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că
datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din
punct de vedere ştiinţific
Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul
detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat
Erorile studiilor medicale
Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura
anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară
caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea
asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri
legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias
Erorile potenţiale icircn studiile epidemiologice
1 Erori icircntacircmplătoare
2 Erori sistematice
3 Confuzia
4 Validitatea
1 Erori icircntacircmplătoare
Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a
parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel
de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot
fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii
(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor
de măsură (eroarea de măsurare)
44
2 Erori sistematice
Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate
care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu
acurateţe mare Acurateţea nu este afectată de mărimea eşantionului
Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de
experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea
dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus
şi greu de cuantificat (consum de alcool personalitate etc)
Principalele tipuri de erori din această categorie sunt
bull Biasul de selecţie
bull Biasul de informaţie
Biasul de selecţie
Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul
trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion
inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale
persoanelor incluse
Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se
ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia
Biasul de informaţie
Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de
instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze
expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere
nesemnificativă sau chiar să nu şi-o amintească de loc
3 Confuzia
Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune
prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este
cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă
de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte
important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor
protector
4 Validitatea
Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă
Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte
estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional
Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă
45
conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se
demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)
Validitatea externă se poate realiza numai dacă studiul este valid intern
Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii
studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de
studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt
laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi
validă din punct de vedere intern)
3 6 Prezentarea rezultatelor
După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite
Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor
icircntr-o formă bdquodigerabilărdquo este necesară
Scopul prezentării datelor
1 Transmiterea concluziilor studiului
a Datele corecte şi importante merită comunicate
b Datele trebuie să confirme sau să infirme ipoteza studiului
c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală
2 Acordarea posibilităţii altor cercetători să aprecieze studiul
a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti
b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor
prezentate
Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru
fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie
statistică
Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de
valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras
(Tabel 3)
Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)
46
Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct
numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor
precum şi prezentarea acestora sub formă inteligibilă
Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care
convin cercetătorului
Prezentarea datelor se poate face
1 Figuri şi tabele icircn articole scrise
2 Figuri şi tabele icircn prezentări orale
3 Figuri şi tabele icircn postere
4 Text scris sau incluse icircn text
5 Site-uri de WEB
Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor
Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie
Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele
exprimacircnd exact ceea ce acestea exprimă
Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate
anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel
să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se
acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca
mai sus sugestive sunt formatele simple şi puţin icircncărcate
Dacă nu există reguli impuse se respectă
1 Mesaj simplu fără falsificarea datelor
2 De obicei este necesar atacirct tabelul cacirct şi graficul
3 Să fie simplu şi clar
Tabele
Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile
coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică
elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de
1 Se folosesc doar linii orizontale
2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn
evidenţi prin linie de separare (Tabelul 4)
Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland
Noua Zeelandă)
(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)
47
3 Numerele sunt aliniate icircn funcţie de virgulă
4 Indicii statistici sunt explicaţi sub tabel
5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană
6 Abrevierile pot fi folosite
7 Numărul de zecimale trebuie limitat la maxim două
8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel
9 Plasarea legendei este obligatorie sub tabel
10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)
Icircn cazul prezentărilor orale sau a posterelor este indicat ca
1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării
2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte
3 Folosirea de simboluri este permisă
Clasificarea tabelelor
Tabelele se clasifică după
i) conţinut
bull cu distribuţii de frecvenţe
bull de clase de frecvenţe
bull de contingenţă
ii) structura
bull cu doua coloane
bull cu subclasificări
bull ldquomasterrdquo
Tabele ce conţin distribuţii de frecvenţe
O modalitate comodă de a prezenta o mulţime de date brute este
1 Se ordonează datele in ordine crescătoare
2 Se determine frecvenţa fiecărei valori
3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane
(Tabelul 5)
Tabelul 5 Distribuţii de frecvenţă absolută
48
Tabelul claselor de frecvenţe
1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă
2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)
Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)
Tabele de contingenţă
1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a
tabelelor de contingenţă
2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a
combinaţiilor de perechi ordonate de valori
3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre
a factor de risc si
b starea sănătăţii
4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)
5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)
Tabelul 7 Tabel de contingenţă 2 x 2
49
Grafice
Există două categorii de moduri grafice sub care se pot prezenta datele
1 Ilustraţii şi fotografii
2 Grafice
1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă
pentru lucrare
2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit
Putem vorbi despre mai multe tipuri de grafice
bull Grafice pentru reprezentarea datelor cantitative
1048707 Grafic cartezian (X Y)
1048707 Histograma
1048707 Poligonul de frecvenţe
1048707 Diagrama bdquoscatterrdquo
bull Grafice pentru reprezentarea datelor calitative
1048707 Grafic cu bare
1048707 Diagrama tip bdquoboxplotrdquo
1048707 Diagrama bdquopierdquo
1048707 Cartograma
Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi
dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)
Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)
Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie
Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)
Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)
50
Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir
de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele
două variabile studiate (Figura 6)
Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2
(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2
rămacircne aproximativ constantă)
Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea
comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea
comparativă a mai multor variabile
Figura 7 Grafic calitativ cu bare
51
Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo
Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două
posibilităţi reprezentate grafic este mai frecventă (Figura 8)
Figura 8 Reprezentare tip bdquopierdquo
Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli
sau a oricărui element comparativ Se foloseşte de epidemiologi
Rezultate
Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare
Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o
manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu
explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția
bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la
ilustraţii tabele grafice
Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi
nici rezultatele care invalidează eventual ipoteza
Discuţii
Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd
cultura ştiinţifică şi inteligenţa autorilor
Acest capitol răspunde la trei obiective
Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia
calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de
selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează
rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv
52
este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn
care a fost abordată problema fără a face o revistă a literaturii
Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea
rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul
Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor
afirmaţii nesusţinute de conţinutul lucrării
Concluzii
Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate
să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie
Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de
concluzii va scădea valoarea lucrării
Bibliografia (lista referinţelor citarea icircn text)
Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn
lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente
Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli
- să conţină cele mai importante şi recente lucrări
- să includă numai lucrări publicate
- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate
Bibliografie
Elisabeta Jaba ndash Statistică Ed Economică 1998
Mihai Ţarcă ndash Statistică volI Ed UAIC 1979
Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale
Ed University Press 2009
Sorana Daniela Bolboacă ndash Metodologia cercetării curs
53
Dacă p le 005 respingem ipoteza nulă şi acceptăm ipoteza alternativă (am obţinut semnificaţia
statistică)
Dacă p gt 005 acceptăm ipoteza nulă (nu am obţinut semnificaţia statistică)
p = 013
NU respingem ipoteza nulă
Risc de eroare de tip II
α = 005
p = 002
Respingem ipoteza nulă
Risc de eroare de tip I
Semnificaţia lui p
Criteriu de luare a deciziei cu privire la o ipoteză statistică nulă
Cuantifică şansa ca o decizie de respingere a ipotezei nule să fie greşită
Măsură a semnificaţiei statistice şi NU CLINICĂ
22
Semnificaţia lui p (reguli empirice)
001 le p lt 005 rezultatul e semnificativ statistic
0001 le p lt 001 rezultatul e icircnalt semnificativ statistic
p lt 0001 rezultatul e foarte icircnalt semnificativ statistic
p ge 005 rezultatul e considerat nesemnificativ statistic
Limite ale valorii p
Valoarea p NU ne dă informaţii despre
Şansa de beneficiu a unui pacient individual
Procentul de pacienţi care vor avea un beneficiu icircn urma instituirii procedurii medicale
Gradul de beneficiu expectat pentru un anumit pacient
Puterea unui test statistic
Este capacitatea de a detecta o diferenţă acolo unde există
Creşterea volumului eşantionului determină creşterea puterii testului statistic aplicat
Valoarea este icircn relaţie directă cu eroarea de tip II
Puterea = 1 ndash β
Cea mai utilizată modalitate de creştere a puterii unui test statistic este de a creşte volumul
eşantionului
Tipul scalei de măsură ndash testul statistic
Denumire test Interval Nominal Observaţii
Corelaţie Pearson 2 0 Există o relaţie liniară
χ2 0 2
Student 1 1 Doar 2 grupuri
ANOVA 1 1 2 sau mai multe grupuri
Student perechi 1 1 Eşantioane perechi
Măsurători repetate (ANOVA) 1 1 Mai mult de 2 grupuri date
perechi
Inferenţa statistică pe date calitativ e
Tabela de contingenţă 2times2
Riscuri şi raţii
Testul χ2 (testarea asocierii icircn tabela de contingenţă)
Testul Fisher
23
Testul z pentru proporţii
Testul McNemar
Tabela de contingenţă 2times2
Scale de tip nominal (dicotomiale tabela de contingenţă de 2times2) sau ordinal (tabela de contingenţă de
rtimesc)
Frecvenţa absolută (numărul de evenimente per categorie)
Tabela de contingenţă de 2times2 4 categorii
AP = adevărat pozitiv
FP = fals pozitiv
FN = fals negativ
AN = adevărat negativ
Ulcer deschis Ulcer vindecat Total
Recurenţă + AP = 1 FP = 5 = 1+5 = 6
Recurenţă - FN = 7 AN = 16 = 7+16 = 23
Total =1+7=8 =5+16=21 29
Riscuri şi raţii Mărimi ale asocierii
Denumire Formula Definiţie
Rata falşilor pozitivi =FP(FP+AN) Probabilitatea unui test fals + (α)
Rata falşilor negativi =FN(FN+AP) Probabilitatea unui test fals ndash (β)
Sensibilitate =AP(AP+FN) Probabilitatea unui test real + (1- β)
Specificitate =AN(AN+FP) Probabilitatea unui test real ndash (1- α)
Acurateţe =(AP+AN)n Probabilitatea generală a unei decizii corecte
Valoarea predictivă pozitivă =AP(AP+FP) Probabilitatea ca un test pozitiv să fie corect
Valoarea predictivă negativă =AN(AN+FN) Probabilitatea ca un test negativ să fie corect
Riscul relativ =AP(FP+AN)FN(AP+FP)
Rata şansei =(AP∙AN)(FN∙FP)
Riscul atribuabil =AP(AP+FP)-FN(FN+AN)
24
Denumire Formula
Rata falşilor pozitivi = 5(5+1) = 08334
Rata falşilor negativi = 7(7+16) = 03043
Sensibilitate = 1(1+7) = 01250
Specificitate = 16(16+5) = 07619
Acurateţe = (1+16)29 = 05862
Valoarea predictivă pozitivă = 1(1+5) = 01667
Valoarea predictivă negativă = 16(16+7) = 06957
Riscul relativ = 1(5+16)7(1+5) = 2142 = 050
Rata şansei = (1∙16)(7∙5) = 04571
Riscul atribuabil = 1(1+5)-7(7+16) = 01667-03043=-01376
Testarea asocierii icircn tabela de contingenţă
Testul χ2
Nu trebuie utilizat pentru eşantioane de volum mic
Testul este valid doar dacă valoarea expectată (aşteptată) pentru fiecare celulă este cel puţin
egală cu 1 şi frecvenţa absolută observată este de minim 5
Dacă aceste condiţii nu sunt icircndeplinite se aplică testul exact al lui Fisher (Fisherrsquos Exact Test)
Indică dacă cele două variabile sunt sau nu independente DAR NU cuantifică puterea asocierii
dintre ele
Problema S-a investigat icircntr-un studiu asocierea dintre obezitatea (ca factor de risc) şi bolile
cardio-vasculare la persoanele icircn etate (gt 60 ani) Din totalul de 620 persoane investigate s-au
identificat 150 persoane cu obezitate şi boală cardio-vasculară 230 persoane fără obezitate şi
fără boală cardio-vasculară şi 60 persoane fără obezitate dar cu boală cardio-vasculară Există
o asociere icircntre obezitate şi boala cardio-vasculară (df=1 α=005 χ2critic = 384)
Testul χ2 exemplu
H025
Nu există asociere icircntre obezitate şi bolile cardio-vasculare
Obezitatea şi bolile cardio-vasculare sunt independente
H1
Există asociere icircntre obezitate şi bolile cardio-vasculare
Obezitatea şi bolile cardio-vasculare sunt asociate
a = 005 pragul de semnificaţie al testului
urmează o lege cu (r-1)(c-1) grade de libertate
χ2 = parametrul testului χ2
fio = frecvenţa observată
fit = frecvenţa teoretică
Regiunea critică este [χα2 yen)
Pentru α = 005 χα2 = 384
OBSERVAT BCV+ BCV- Total
Obezitate + AP = 150 FP = 180 330
Obezitate - FN = 60 AN = 230 290
Total 210 410 620
TEORETIC BCV+ BCV- Total
Obezitate + = 330times210620 = 330times410620 330
Obezitate - = 290times210620 = 290times410620 290
Total 210 410 620
TEORETIC BCV+ BCV- Total
Obezitate + = 330times210620 = 330times410620 330
26
Obezitate - = 290times210620 = 290times410620 290
Total 210 410 620
TEORETIC BCV+ BCV-
Obezitate + = 112 = 218
Obezitate - = 98 = 192
Deoarece 4177Icirc[384 yen) se respinge H0 cu un risc de eroare de 5
Există asociere icircntre obezitate şi bolile cardio-vasculare
Testul Fisher
Corecţie a testului χ2
Valoarea p asociată parametrului ne dă probabilitatea ca valoarea observată de independenţă să fie
atribuită doar şansei
O valoare p mică indică că există alte cauze decacirct şansa influenţează rezultatul şi astfel cele două
variabile investigate nu sunt independente
Testul Fisher = dispersia corectată a factorului x dispersia corectată a factorilor reziduali
Icircn acest context regula adunării dispersiilor se poate scrie unde
este variaţia lui y pe seama variaţiei variabilei x
este variaţia lui y pe seama influenţei factorilor reziduali (neicircnregistraţi)
este variaţia totală a caracteristicii y
Testul Fisher empiric se calculează după formula
27
se compară cu Ftab pentru nx şi nz grade de libertate la un anumit prag de semnificaţie stabilit
Dacă Fc gt Ftab rezultă că variaţia factorului de grupare x este semnificativă pentru variaţia caracteristicii y
Testul z pentru proporţii
1 Compararea unei frecvenţe observate cu o frecvenţă teoretică
2 Testarea egalităţii a două frecvenţe
Testul z Compararea unei frecvenţe observate cu o frecvenţă teoretică
Scop Investigarea semnificaţiei diferenţei icircntre o frecvenţă teoretică p (icircntr-o populaţie) şi o frecvenţă
observată f pe un eşantion reprezentativ (variabilă calitativă (binare))
Condiţii de aplicare Testul este corect aplicat dacă numărul n al observaţiilor eşantionului este
suficient de mare (n∙p n∙(1-p)gt10
Parametrul
n = volumul eşantionului
Suntem interesaţi de investigarea prevalenţei hepatitei B la personalul care lucrează icircn laboratoarele
clinicilor de boli infecţioase din Transilvania Se ştie din studii anterioare că prevalenţa hepatitei B icircn
populaţia generală din Transilvania este de 9 S-a luat icircn studiu un eşantion de 100 persoane şi s-a
obţinut o prevalenţă a hepatitei B de 6 Există diferenţă semnificativă icircntre frecvenţa hepatitei B la
personalul care lucrează icircn laboratoarele spitalelor de boli infecţioase din Transilvania faţă de
populaţia generală
f = 006 p = 009 n = 100
Ipoteza nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat
faţă de frecvenţa hepatitei B icircn populaţia generală
Ipoteza alternativă test bilateral Există diferenţă semnificativă icircntre frecvenţa hepatitei B la
nivelul eşantionului şi prevalenţa hepatitei B icircn populaţia generală
f = 006 p = 009 n = 100
Pragul de semnificaţie a = 005
Regiunea critică test bilateral (-yen -196 ]Egrave[196 yen)
28
Concluzia testului
Deoarece parametrul statistic calculat al testului nu aparţine regiunii critice se acceptă ipoteza
nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat faţă de
frecvenţa hepatitei B icircn populaţia generală
Testul McNemar
Evaluarea dependenţei variabilelor calitative perechi (dorim să determinăm dacă o anumită
caracteristică este sau nu asociată cu o anumită patologie)
Identificăm n pacienţi care prezintă patologia de interes (eg Cancer bronho-pulmonar) şi n
pacienţi cu aceleaşi caracteristici ca şi primul grup dar care nu o prezintă
Martor = da Martor = nu
Caz = da a b
Caz = nu c d
Testul McNemar - exemplu fumat vs cancer
Martor = da Martor = nu
Cancer = da a = 2 b = 5
Cancer = nu c = 0 d = 3
29
χ2critic(α=005) = 384
32 lt 384 rarr acceptăm ipoteza nulă
Fumatul nu este icircn relaţie cu apariţia cancerului bronho-pulmonar
Inferenţa statistică pe date cantitative
Variabile cantitative continue
Testul z şi Student (t) (o medie sau medii perechi)
Testul z şi Student (t) (testarea a două medii)
ANOVA (ge 3 medii)
Ranguri (variabile cantitative discrete sau cantitative care nu icircndeplinesc condiţia de
normalitate)
Testul sumei rangurilor Wilcoxon
Kruskal-Wallis (ge 3 eşantioane independente)
Friedman (ge 3 eşantioane dependente)
Teste de normalitate variabile cantitative continue
Shapiro-Wilk
Kolmogorov-Smirnov
Shapiro-Wilk
Chi-Square Goodness-of-Fit
Dacă datele urmează o distribuţie normală aplicăm un test parametric
Dacă datele nu urmează o distribuţie normală aplicăm un test de comparare al rangurilor
30
Testul Z de comparare a mediei unui eşantion cu media unei populaţii
Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ
extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie
s2 care se cunoaşte
Condiţii de aplicare
1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru
compararea mediei unui eşantion cu media unei populaţii)
2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal
distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă
3 Talia eşantionului este mare ( ge 30)
Ipoteze
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media
eşantionului şi media populaţiei
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
(-yen -196 ] Egrave [196 yen)
Parametrul testului
n = volumul eşantionului
= media eşantionului
s = deviaţia standard a populaţiei
Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)
Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard
cunoscută
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi
media standard
Condiţii de aplicare
Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se
realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această
condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea
31
Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai
puternic
Numărul de grade de libertate (df) df = n-1
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
Parametrul testului
n = volumul eşantionului
micro0 = media standard
= media eşantionului
s = deviaţia standard a eşantionului
Testul ANOVA compararea mediilor a mai multe eşantioane
H0 = toate mediile sunt egale
H1 = nu toate mediile sunt egale
Condiţii de aplicare
1 Datele sunt independente unele faţă de celelalte
2 Datele fiecărui grup sunt normal distribuite
3 Deviaţia standard este aceeaşi pentru toate grupurile
Id Medicament
A B C D E F
1 5 6 7 10 5 9
2 6 8 8 11 8 8
3 7 7 9 13 6 7
4 8 9 11 12 4 5
32
5 9 10 10 9 7 6
Suma 35 40 45 55 30 35
Media 7 8 9 11 6 7
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =
= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)
Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2
F = (suma pătratelor(icircntre))(suma pătratelor(icircn))
Suma pătratelor (icircntre) = 16times5 = 80
Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60
Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn
interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare
SP df Media pătratelor F = MPicircntreMPicircn
Icircntre 80 5 = 805 = 16 = 1625 = 64
Icircn 60 24 = 6024 = 25
Total 140 29 -
Testul sumei rangurilor Wilcoxon
Aplicat pentru
Un set de observaţii provenite dintr-o valoare ipotetică comună
Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)
Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero
Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace
Suma rangurilor pentru diferenţele negative = 2+3+1 = 6
Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30
33
Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului
egal cu 8 = 0109
Icircnainte După Diferenţa Rang
64 66 -2 2
66 58 8 5
67 68 -1 3
71 65 6 4
72 75 -3 1
76 67 9 6
78 59 19 8
89 74 15 7
Testul Kruskal-Wallis (ge 3 eşantioane independente)
Test de ranguri aplicate pe mai mult de 3 eşantioane
H = parametrul testului
n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)
Tk = suma rangurilor
Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie
pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni
34
df = k-1 (k = numărul de eşantioane)
df = 3-1 = 2
Hcritic(α=005) = 599
H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie
pozitivă şi respectiv biopsie negativă
Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie
a tipului de studiu pe eşantioane perechi)
1 Definirea numărului de tratamente k
2 Obţinerea rangurilor pentru fiecare tratament
3 Sumarea rangurilor fiecărui tratament
4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)
5 Dacă Fr gt Frcritic rarr respingem H0
Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost
măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi
n = 9 k = 3 T12 = 225 T2
2 = 38025 T32 = 38025
Frcritic = 599
Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de
prostată
35
De reţinut
Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei
Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-
of-Fit
Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z
Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t
Compararea mediilor a 3 sau mai multe eşantioane ANOVA
Compararea mediilor a două populaţii (σ) testul Z
Compararea mediilor a două eşantioane (s) testul t
Compararea mediilor a două eşantioane perechi (s) testul t
ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi
cu cel pentru compararea a două eşantioane perechi
Ranguri
Distribuţia datelor nu are importanţă
Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)
Trei sau mai multe eşantioane Kruskal-Wallis
Trei sau mai multe eşantioane perechi Friedman
Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia
Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a
datelor)
Variabile nominale
Un singur eşantion sau eşantioane perechi
Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte
Eşantioane perechi testul Mc Nemar
Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2
Icircn analiza proporţiilor există teste diferite pentru
Compararea unei frecvenţe cu o frecvenţă cunoscută
Compararea a două frecvenţe
Semnificaţia statistică
Valoarea p (p value)
Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor
două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E
posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării
aleatorii
36
Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală
urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii
Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este
probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un
experiment de dimensiunea acestuia
Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că
diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii
diferite
Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca
fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă
ar fi fost adevărată
Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă
1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe
baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De
fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001
2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie
3 Se aplică testul statistic aferent pentru a calcula valoarea p
4 Se compară valoarea p cu valoarea ndash prag
5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe
semnificativă dpdv statisticrdquo
6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e
semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să
conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă
Teste de semnificaţie
Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului
populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)
Testarea ipotezelor implică posibile erori
Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile
sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui
grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul
icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005
ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există
37
nici o diferenţă
Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ
statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de
ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost
ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau
dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă
cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă
semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe
ipotetice variate icircn cazul icircn care ele există
Măsuri ale frecvenţei
Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)
Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate
Generic formula pe care se bazează toate cele trei este
unde x şi y sunt cantităţile de comparat
Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea
unei frecvenţe pe grupe de sex vacircrstă etc
Proporţia implică icircn mod necesar ca x să fie inclus icircn y
Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară
frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp
Pentru calcularea unei rate trebuie ţinut cont de trei aspecte
bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin
bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp
bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo
Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un
tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei
populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei
aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)
38
Indicatori
Rata de incidenţă
Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă
icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii
Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o
perioadă de timp
Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de
timp x
Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei
susceptibili de a dezvolta icircmbolnăvirea studiată
Numitorul poate fi
bull Numărul mediu al populaţiei icircn perioada de timp studiată
bull Mărimea populaţiei icircn mijlocul perioadei de studiu
bull Mărimea populaţiei la icircnceputul studiului
Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă
Este obligatorie menţionarea perioadei de timp
Prevalenţa
Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la
un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă
schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa
momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)
39
Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include
numai cazuri noi respectiv include cazuri noi şi vechi
Rata de atac
Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este
folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp
raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori
Rata persoană-timp
Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din
momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte
migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost
observate
Riscul relativ (RR)
Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment
legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele
prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două
grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la
bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la
bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai
mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo
Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2
Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn
cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă
(Tabelul 1)
Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR
Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la
neexpuşi
40
Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de
culegere a datelor
Odds ratio (OR)
Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin
raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general
studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)
Tabelul 2 Tabelul 2 x 2 pentru calcularea OR
Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală
Rate de mortalitate
Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp
specificată Există mai multe tipuri de rate de mortalitate
o Mortalitate specifică pe sex
o Mortalitate specifică pe rasă
o Mortalitate specifică pe boală
o Mortalitate neonatală
o Mortalitate postneonatală
o Mortalitate infantilă
o Mortalitate maternă
Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP
41
Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de
viaţă şi vacircrsta la care survine decesul dacă este prematur
Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu
Ani de viaţă pierduţi datorat dizabilităţii
Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt
utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru
cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite
grupuri
Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de
risc şi o boală se folosesc riscul relativ şi odds ratio
35 Analiza şi interpretarea datelor
După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date
trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul
Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor
colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului
studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu
plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde
prezenţa biostatisticianului este necesară
Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu
elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat
iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului
iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate
depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori
testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere
clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza
Interpretarea rezultatelor statistice
Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne
motive (număr mic de date) acceptarea ei să fie falsă
Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine
gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia
ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument
de decizie Intervalul de confidenţă
42
Interpretarea statistica ne interpretarea clinică
Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă
Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice
obţinute pe eşantionul studiat
Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare
Ce interpretăm Rezultatele
personale obţinute icircn urma studiului
care au fost prezentate icircn secţiunea bdquoRezultaterdquo
Explicăm rezultatele obţinute
Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale
Interpretarea trebuie să se realizeze icircn
lumina limitelor studiului
contextul cultural social şi educaţional al locului unde s-a realizat cercetarea
contextul a ceea ce se cunoaşte din literatura de specialitate
Interpretăm doar rezultatele personale obţinute icircn urma studiului
Interpretarea statistică nu este tot una cu interpretarea clinică
Interpretarea statistică este importantă
Interpretarea clinică este foarte importantă
Intervalul de confidenţă
Media calculată pe baza unui eşantion nu va echivala media populaţiei
Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului
Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a
populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a
populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)
pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru
orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare
dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de
confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de
date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de
5
Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel
Dacă valoarea p este mică
Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare
aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o
medie diferită Diferenţa este semnificativă dpdv statistic
43
Icircn continuare
Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa
reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică
pentru a fi interesante din punct de vedere ştiinţific
Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC
oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care
este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a
obţine o concluzie clară
Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o
diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că
datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din
punct de vedere ştiinţific
Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul
detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat
Erorile studiilor medicale
Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura
anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară
caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea
asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri
legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias
Erorile potenţiale icircn studiile epidemiologice
1 Erori icircntacircmplătoare
2 Erori sistematice
3 Confuzia
4 Validitatea
1 Erori icircntacircmplătoare
Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a
parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel
de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot
fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii
(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor
de măsură (eroarea de măsurare)
44
2 Erori sistematice
Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate
care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu
acurateţe mare Acurateţea nu este afectată de mărimea eşantionului
Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de
experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea
dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus
şi greu de cuantificat (consum de alcool personalitate etc)
Principalele tipuri de erori din această categorie sunt
bull Biasul de selecţie
bull Biasul de informaţie
Biasul de selecţie
Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul
trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion
inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale
persoanelor incluse
Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se
ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia
Biasul de informaţie
Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de
instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze
expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere
nesemnificativă sau chiar să nu şi-o amintească de loc
3 Confuzia
Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune
prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este
cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă
de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte
important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor
protector
4 Validitatea
Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă
Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte
estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional
Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă
45
conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se
demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)
Validitatea externă se poate realiza numai dacă studiul este valid intern
Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii
studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de
studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt
laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi
validă din punct de vedere intern)
3 6 Prezentarea rezultatelor
După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite
Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor
icircntr-o formă bdquodigerabilărdquo este necesară
Scopul prezentării datelor
1 Transmiterea concluziilor studiului
a Datele corecte şi importante merită comunicate
b Datele trebuie să confirme sau să infirme ipoteza studiului
c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală
2 Acordarea posibilităţii altor cercetători să aprecieze studiul
a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti
b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor
prezentate
Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru
fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie
statistică
Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de
valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras
(Tabel 3)
Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)
46
Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct
numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor
precum şi prezentarea acestora sub formă inteligibilă
Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care
convin cercetătorului
Prezentarea datelor se poate face
1 Figuri şi tabele icircn articole scrise
2 Figuri şi tabele icircn prezentări orale
3 Figuri şi tabele icircn postere
4 Text scris sau incluse icircn text
5 Site-uri de WEB
Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor
Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie
Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele
exprimacircnd exact ceea ce acestea exprimă
Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate
anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel
să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se
acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca
mai sus sugestive sunt formatele simple şi puţin icircncărcate
Dacă nu există reguli impuse se respectă
1 Mesaj simplu fără falsificarea datelor
2 De obicei este necesar atacirct tabelul cacirct şi graficul
3 Să fie simplu şi clar
Tabele
Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile
coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică
elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de
1 Se folosesc doar linii orizontale
2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn
evidenţi prin linie de separare (Tabelul 4)
Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland
Noua Zeelandă)
(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)
47
3 Numerele sunt aliniate icircn funcţie de virgulă
4 Indicii statistici sunt explicaţi sub tabel
5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană
6 Abrevierile pot fi folosite
7 Numărul de zecimale trebuie limitat la maxim două
8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel
9 Plasarea legendei este obligatorie sub tabel
10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)
Icircn cazul prezentărilor orale sau a posterelor este indicat ca
1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării
2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte
3 Folosirea de simboluri este permisă
Clasificarea tabelelor
Tabelele se clasifică după
i) conţinut
bull cu distribuţii de frecvenţe
bull de clase de frecvenţe
bull de contingenţă
ii) structura
bull cu doua coloane
bull cu subclasificări
bull ldquomasterrdquo
Tabele ce conţin distribuţii de frecvenţe
O modalitate comodă de a prezenta o mulţime de date brute este
1 Se ordonează datele in ordine crescătoare
2 Se determine frecvenţa fiecărei valori
3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane
(Tabelul 5)
Tabelul 5 Distribuţii de frecvenţă absolută
48
Tabelul claselor de frecvenţe
1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă
2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)
Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)
Tabele de contingenţă
1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a
tabelelor de contingenţă
2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a
combinaţiilor de perechi ordonate de valori
3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre
a factor de risc si
b starea sănătăţii
4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)
5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)
Tabelul 7 Tabel de contingenţă 2 x 2
49
Grafice
Există două categorii de moduri grafice sub care se pot prezenta datele
1 Ilustraţii şi fotografii
2 Grafice
1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă
pentru lucrare
2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit
Putem vorbi despre mai multe tipuri de grafice
bull Grafice pentru reprezentarea datelor cantitative
1048707 Grafic cartezian (X Y)
1048707 Histograma
1048707 Poligonul de frecvenţe
1048707 Diagrama bdquoscatterrdquo
bull Grafice pentru reprezentarea datelor calitative
1048707 Grafic cu bare
1048707 Diagrama tip bdquoboxplotrdquo
1048707 Diagrama bdquopierdquo
1048707 Cartograma
Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi
dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)
Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)
Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie
Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)
Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)
50
Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir
de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele
două variabile studiate (Figura 6)
Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2
(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2
rămacircne aproximativ constantă)
Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea
comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea
comparativă a mai multor variabile
Figura 7 Grafic calitativ cu bare
51
Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo
Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două
posibilităţi reprezentate grafic este mai frecventă (Figura 8)
Figura 8 Reprezentare tip bdquopierdquo
Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli
sau a oricărui element comparativ Se foloseşte de epidemiologi
Rezultate
Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare
Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o
manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu
explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția
bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la
ilustraţii tabele grafice
Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi
nici rezultatele care invalidează eventual ipoteza
Discuţii
Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd
cultura ştiinţifică şi inteligenţa autorilor
Acest capitol răspunde la trei obiective
Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia
calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de
selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează
rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv
52
este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn
care a fost abordată problema fără a face o revistă a literaturii
Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea
rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul
Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor
afirmaţii nesusţinute de conţinutul lucrării
Concluzii
Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate
să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie
Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de
concluzii va scădea valoarea lucrării
Bibliografia (lista referinţelor citarea icircn text)
Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn
lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente
Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli
- să conţină cele mai importante şi recente lucrări
- să includă numai lucrări publicate
- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate
Bibliografie
Elisabeta Jaba ndash Statistică Ed Economică 1998
Mihai Ţarcă ndash Statistică volI Ed UAIC 1979
Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale
Ed University Press 2009
Sorana Daniela Bolboacă ndash Metodologia cercetării curs
53
Semnificaţia lui p (reguli empirice)
001 le p lt 005 rezultatul e semnificativ statistic
0001 le p lt 001 rezultatul e icircnalt semnificativ statistic
p lt 0001 rezultatul e foarte icircnalt semnificativ statistic
p ge 005 rezultatul e considerat nesemnificativ statistic
Limite ale valorii p
Valoarea p NU ne dă informaţii despre
Şansa de beneficiu a unui pacient individual
Procentul de pacienţi care vor avea un beneficiu icircn urma instituirii procedurii medicale
Gradul de beneficiu expectat pentru un anumit pacient
Puterea unui test statistic
Este capacitatea de a detecta o diferenţă acolo unde există
Creşterea volumului eşantionului determină creşterea puterii testului statistic aplicat
Valoarea este icircn relaţie directă cu eroarea de tip II
Puterea = 1 ndash β
Cea mai utilizată modalitate de creştere a puterii unui test statistic este de a creşte volumul
eşantionului
Tipul scalei de măsură ndash testul statistic
Denumire test Interval Nominal Observaţii
Corelaţie Pearson 2 0 Există o relaţie liniară
χ2 0 2
Student 1 1 Doar 2 grupuri
ANOVA 1 1 2 sau mai multe grupuri
Student perechi 1 1 Eşantioane perechi
Măsurători repetate (ANOVA) 1 1 Mai mult de 2 grupuri date
perechi
Inferenţa statistică pe date calitativ e
Tabela de contingenţă 2times2
Riscuri şi raţii
Testul χ2 (testarea asocierii icircn tabela de contingenţă)
Testul Fisher
23
Testul z pentru proporţii
Testul McNemar
Tabela de contingenţă 2times2
Scale de tip nominal (dicotomiale tabela de contingenţă de 2times2) sau ordinal (tabela de contingenţă de
rtimesc)
Frecvenţa absolută (numărul de evenimente per categorie)
Tabela de contingenţă de 2times2 4 categorii
AP = adevărat pozitiv
FP = fals pozitiv
FN = fals negativ
AN = adevărat negativ
Ulcer deschis Ulcer vindecat Total
Recurenţă + AP = 1 FP = 5 = 1+5 = 6
Recurenţă - FN = 7 AN = 16 = 7+16 = 23
Total =1+7=8 =5+16=21 29
Riscuri şi raţii Mărimi ale asocierii
Denumire Formula Definiţie
Rata falşilor pozitivi =FP(FP+AN) Probabilitatea unui test fals + (α)
Rata falşilor negativi =FN(FN+AP) Probabilitatea unui test fals ndash (β)
Sensibilitate =AP(AP+FN) Probabilitatea unui test real + (1- β)
Specificitate =AN(AN+FP) Probabilitatea unui test real ndash (1- α)
Acurateţe =(AP+AN)n Probabilitatea generală a unei decizii corecte
Valoarea predictivă pozitivă =AP(AP+FP) Probabilitatea ca un test pozitiv să fie corect
Valoarea predictivă negativă =AN(AN+FN) Probabilitatea ca un test negativ să fie corect
Riscul relativ =AP(FP+AN)FN(AP+FP)
Rata şansei =(AP∙AN)(FN∙FP)
Riscul atribuabil =AP(AP+FP)-FN(FN+AN)
24
Denumire Formula
Rata falşilor pozitivi = 5(5+1) = 08334
Rata falşilor negativi = 7(7+16) = 03043
Sensibilitate = 1(1+7) = 01250
Specificitate = 16(16+5) = 07619
Acurateţe = (1+16)29 = 05862
Valoarea predictivă pozitivă = 1(1+5) = 01667
Valoarea predictivă negativă = 16(16+7) = 06957
Riscul relativ = 1(5+16)7(1+5) = 2142 = 050
Rata şansei = (1∙16)(7∙5) = 04571
Riscul atribuabil = 1(1+5)-7(7+16) = 01667-03043=-01376
Testarea asocierii icircn tabela de contingenţă
Testul χ2
Nu trebuie utilizat pentru eşantioane de volum mic
Testul este valid doar dacă valoarea expectată (aşteptată) pentru fiecare celulă este cel puţin
egală cu 1 şi frecvenţa absolută observată este de minim 5
Dacă aceste condiţii nu sunt icircndeplinite se aplică testul exact al lui Fisher (Fisherrsquos Exact Test)
Indică dacă cele două variabile sunt sau nu independente DAR NU cuantifică puterea asocierii
dintre ele
Problema S-a investigat icircntr-un studiu asocierea dintre obezitatea (ca factor de risc) şi bolile
cardio-vasculare la persoanele icircn etate (gt 60 ani) Din totalul de 620 persoane investigate s-au
identificat 150 persoane cu obezitate şi boală cardio-vasculară 230 persoane fără obezitate şi
fără boală cardio-vasculară şi 60 persoane fără obezitate dar cu boală cardio-vasculară Există
o asociere icircntre obezitate şi boala cardio-vasculară (df=1 α=005 χ2critic = 384)
Testul χ2 exemplu
H025
Nu există asociere icircntre obezitate şi bolile cardio-vasculare
Obezitatea şi bolile cardio-vasculare sunt independente
H1
Există asociere icircntre obezitate şi bolile cardio-vasculare
Obezitatea şi bolile cardio-vasculare sunt asociate
a = 005 pragul de semnificaţie al testului
urmează o lege cu (r-1)(c-1) grade de libertate
χ2 = parametrul testului χ2
fio = frecvenţa observată
fit = frecvenţa teoretică
Regiunea critică este [χα2 yen)
Pentru α = 005 χα2 = 384
OBSERVAT BCV+ BCV- Total
Obezitate + AP = 150 FP = 180 330
Obezitate - FN = 60 AN = 230 290
Total 210 410 620
TEORETIC BCV+ BCV- Total
Obezitate + = 330times210620 = 330times410620 330
Obezitate - = 290times210620 = 290times410620 290
Total 210 410 620
TEORETIC BCV+ BCV- Total
Obezitate + = 330times210620 = 330times410620 330
26
Obezitate - = 290times210620 = 290times410620 290
Total 210 410 620
TEORETIC BCV+ BCV-
Obezitate + = 112 = 218
Obezitate - = 98 = 192
Deoarece 4177Icirc[384 yen) se respinge H0 cu un risc de eroare de 5
Există asociere icircntre obezitate şi bolile cardio-vasculare
Testul Fisher
Corecţie a testului χ2
Valoarea p asociată parametrului ne dă probabilitatea ca valoarea observată de independenţă să fie
atribuită doar şansei
O valoare p mică indică că există alte cauze decacirct şansa influenţează rezultatul şi astfel cele două
variabile investigate nu sunt independente
Testul Fisher = dispersia corectată a factorului x dispersia corectată a factorilor reziduali
Icircn acest context regula adunării dispersiilor se poate scrie unde
este variaţia lui y pe seama variaţiei variabilei x
este variaţia lui y pe seama influenţei factorilor reziduali (neicircnregistraţi)
este variaţia totală a caracteristicii y
Testul Fisher empiric se calculează după formula
27
se compară cu Ftab pentru nx şi nz grade de libertate la un anumit prag de semnificaţie stabilit
Dacă Fc gt Ftab rezultă că variaţia factorului de grupare x este semnificativă pentru variaţia caracteristicii y
Testul z pentru proporţii
1 Compararea unei frecvenţe observate cu o frecvenţă teoretică
2 Testarea egalităţii a două frecvenţe
Testul z Compararea unei frecvenţe observate cu o frecvenţă teoretică
Scop Investigarea semnificaţiei diferenţei icircntre o frecvenţă teoretică p (icircntr-o populaţie) şi o frecvenţă
observată f pe un eşantion reprezentativ (variabilă calitativă (binare))
Condiţii de aplicare Testul este corect aplicat dacă numărul n al observaţiilor eşantionului este
suficient de mare (n∙p n∙(1-p)gt10
Parametrul
n = volumul eşantionului
Suntem interesaţi de investigarea prevalenţei hepatitei B la personalul care lucrează icircn laboratoarele
clinicilor de boli infecţioase din Transilvania Se ştie din studii anterioare că prevalenţa hepatitei B icircn
populaţia generală din Transilvania este de 9 S-a luat icircn studiu un eşantion de 100 persoane şi s-a
obţinut o prevalenţă a hepatitei B de 6 Există diferenţă semnificativă icircntre frecvenţa hepatitei B la
personalul care lucrează icircn laboratoarele spitalelor de boli infecţioase din Transilvania faţă de
populaţia generală
f = 006 p = 009 n = 100
Ipoteza nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat
faţă de frecvenţa hepatitei B icircn populaţia generală
Ipoteza alternativă test bilateral Există diferenţă semnificativă icircntre frecvenţa hepatitei B la
nivelul eşantionului şi prevalenţa hepatitei B icircn populaţia generală
f = 006 p = 009 n = 100
Pragul de semnificaţie a = 005
Regiunea critică test bilateral (-yen -196 ]Egrave[196 yen)
28
Concluzia testului
Deoarece parametrul statistic calculat al testului nu aparţine regiunii critice se acceptă ipoteza
nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat faţă de
frecvenţa hepatitei B icircn populaţia generală
Testul McNemar
Evaluarea dependenţei variabilelor calitative perechi (dorim să determinăm dacă o anumită
caracteristică este sau nu asociată cu o anumită patologie)
Identificăm n pacienţi care prezintă patologia de interes (eg Cancer bronho-pulmonar) şi n
pacienţi cu aceleaşi caracteristici ca şi primul grup dar care nu o prezintă
Martor = da Martor = nu
Caz = da a b
Caz = nu c d
Testul McNemar - exemplu fumat vs cancer
Martor = da Martor = nu
Cancer = da a = 2 b = 5
Cancer = nu c = 0 d = 3
29
χ2critic(α=005) = 384
32 lt 384 rarr acceptăm ipoteza nulă
Fumatul nu este icircn relaţie cu apariţia cancerului bronho-pulmonar
Inferenţa statistică pe date cantitative
Variabile cantitative continue
Testul z şi Student (t) (o medie sau medii perechi)
Testul z şi Student (t) (testarea a două medii)
ANOVA (ge 3 medii)
Ranguri (variabile cantitative discrete sau cantitative care nu icircndeplinesc condiţia de
normalitate)
Testul sumei rangurilor Wilcoxon
Kruskal-Wallis (ge 3 eşantioane independente)
Friedman (ge 3 eşantioane dependente)
Teste de normalitate variabile cantitative continue
Shapiro-Wilk
Kolmogorov-Smirnov
Shapiro-Wilk
Chi-Square Goodness-of-Fit
Dacă datele urmează o distribuţie normală aplicăm un test parametric
Dacă datele nu urmează o distribuţie normală aplicăm un test de comparare al rangurilor
30
Testul Z de comparare a mediei unui eşantion cu media unei populaţii
Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ
extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie
s2 care se cunoaşte
Condiţii de aplicare
1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru
compararea mediei unui eşantion cu media unei populaţii)
2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal
distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă
3 Talia eşantionului este mare ( ge 30)
Ipoteze
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media
eşantionului şi media populaţiei
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
(-yen -196 ] Egrave [196 yen)
Parametrul testului
n = volumul eşantionului
= media eşantionului
s = deviaţia standard a populaţiei
Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)
Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard
cunoscută
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi
media standard
Condiţii de aplicare
Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se
realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această
condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea
31
Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai
puternic
Numărul de grade de libertate (df) df = n-1
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
Parametrul testului
n = volumul eşantionului
micro0 = media standard
= media eşantionului
s = deviaţia standard a eşantionului
Testul ANOVA compararea mediilor a mai multe eşantioane
H0 = toate mediile sunt egale
H1 = nu toate mediile sunt egale
Condiţii de aplicare
1 Datele sunt independente unele faţă de celelalte
2 Datele fiecărui grup sunt normal distribuite
3 Deviaţia standard este aceeaşi pentru toate grupurile
Id Medicament
A B C D E F
1 5 6 7 10 5 9
2 6 8 8 11 8 8
3 7 7 9 13 6 7
4 8 9 11 12 4 5
32
5 9 10 10 9 7 6
Suma 35 40 45 55 30 35
Media 7 8 9 11 6 7
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =
= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)
Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2
F = (suma pătratelor(icircntre))(suma pătratelor(icircn))
Suma pătratelor (icircntre) = 16times5 = 80
Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60
Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn
interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare
SP df Media pătratelor F = MPicircntreMPicircn
Icircntre 80 5 = 805 = 16 = 1625 = 64
Icircn 60 24 = 6024 = 25
Total 140 29 -
Testul sumei rangurilor Wilcoxon
Aplicat pentru
Un set de observaţii provenite dintr-o valoare ipotetică comună
Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)
Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero
Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace
Suma rangurilor pentru diferenţele negative = 2+3+1 = 6
Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30
33
Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului
egal cu 8 = 0109
Icircnainte După Diferenţa Rang
64 66 -2 2
66 58 8 5
67 68 -1 3
71 65 6 4
72 75 -3 1
76 67 9 6
78 59 19 8
89 74 15 7
Testul Kruskal-Wallis (ge 3 eşantioane independente)
Test de ranguri aplicate pe mai mult de 3 eşantioane
H = parametrul testului
n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)
Tk = suma rangurilor
Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie
pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni
34
df = k-1 (k = numărul de eşantioane)
df = 3-1 = 2
Hcritic(α=005) = 599
H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie
pozitivă şi respectiv biopsie negativă
Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie
a tipului de studiu pe eşantioane perechi)
1 Definirea numărului de tratamente k
2 Obţinerea rangurilor pentru fiecare tratament
3 Sumarea rangurilor fiecărui tratament
4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)
5 Dacă Fr gt Frcritic rarr respingem H0
Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost
măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi
n = 9 k = 3 T12 = 225 T2
2 = 38025 T32 = 38025
Frcritic = 599
Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de
prostată
35
De reţinut
Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei
Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-
of-Fit
Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z
Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t
Compararea mediilor a 3 sau mai multe eşantioane ANOVA
Compararea mediilor a două populaţii (σ) testul Z
Compararea mediilor a două eşantioane (s) testul t
Compararea mediilor a două eşantioane perechi (s) testul t
ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi
cu cel pentru compararea a două eşantioane perechi
Ranguri
Distribuţia datelor nu are importanţă
Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)
Trei sau mai multe eşantioane Kruskal-Wallis
Trei sau mai multe eşantioane perechi Friedman
Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia
Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a
datelor)
Variabile nominale
Un singur eşantion sau eşantioane perechi
Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte
Eşantioane perechi testul Mc Nemar
Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2
Icircn analiza proporţiilor există teste diferite pentru
Compararea unei frecvenţe cu o frecvenţă cunoscută
Compararea a două frecvenţe
Semnificaţia statistică
Valoarea p (p value)
Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor
două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E
posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării
aleatorii
36
Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală
urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii
Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este
probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un
experiment de dimensiunea acestuia
Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că
diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii
diferite
Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca
fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă
ar fi fost adevărată
Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă
1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe
baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De
fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001
2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie
3 Se aplică testul statistic aferent pentru a calcula valoarea p
4 Se compară valoarea p cu valoarea ndash prag
5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe
semnificativă dpdv statisticrdquo
6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e
semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să
conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă
Teste de semnificaţie
Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului
populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)
Testarea ipotezelor implică posibile erori
Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile
sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui
grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul
icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005
ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există
37
nici o diferenţă
Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ
statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de
ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost
ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau
dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă
cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă
semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe
ipotetice variate icircn cazul icircn care ele există
Măsuri ale frecvenţei
Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)
Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate
Generic formula pe care se bazează toate cele trei este
unde x şi y sunt cantităţile de comparat
Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea
unei frecvenţe pe grupe de sex vacircrstă etc
Proporţia implică icircn mod necesar ca x să fie inclus icircn y
Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară
frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp
Pentru calcularea unei rate trebuie ţinut cont de trei aspecte
bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin
bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp
bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo
Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un
tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei
populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei
aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)
38
Indicatori
Rata de incidenţă
Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă
icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii
Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o
perioadă de timp
Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de
timp x
Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei
susceptibili de a dezvolta icircmbolnăvirea studiată
Numitorul poate fi
bull Numărul mediu al populaţiei icircn perioada de timp studiată
bull Mărimea populaţiei icircn mijlocul perioadei de studiu
bull Mărimea populaţiei la icircnceputul studiului
Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă
Este obligatorie menţionarea perioadei de timp
Prevalenţa
Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la
un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă
schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa
momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)
39
Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include
numai cazuri noi respectiv include cazuri noi şi vechi
Rata de atac
Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este
folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp
raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori
Rata persoană-timp
Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din
momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte
migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost
observate
Riscul relativ (RR)
Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment
legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele
prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două
grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la
bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la
bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai
mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo
Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2
Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn
cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă
(Tabelul 1)
Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR
Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la
neexpuşi
40
Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de
culegere a datelor
Odds ratio (OR)
Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin
raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general
studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)
Tabelul 2 Tabelul 2 x 2 pentru calcularea OR
Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală
Rate de mortalitate
Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp
specificată Există mai multe tipuri de rate de mortalitate
o Mortalitate specifică pe sex
o Mortalitate specifică pe rasă
o Mortalitate specifică pe boală
o Mortalitate neonatală
o Mortalitate postneonatală
o Mortalitate infantilă
o Mortalitate maternă
Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP
41
Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de
viaţă şi vacircrsta la care survine decesul dacă este prematur
Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu
Ani de viaţă pierduţi datorat dizabilităţii
Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt
utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru
cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite
grupuri
Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de
risc şi o boală se folosesc riscul relativ şi odds ratio
35 Analiza şi interpretarea datelor
După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date
trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul
Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor
colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului
studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu
plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde
prezenţa biostatisticianului este necesară
Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu
elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat
iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului
iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate
depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori
testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere
clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza
Interpretarea rezultatelor statistice
Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne
motive (număr mic de date) acceptarea ei să fie falsă
Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine
gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia
ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument
de decizie Intervalul de confidenţă
42
Interpretarea statistica ne interpretarea clinică
Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă
Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice
obţinute pe eşantionul studiat
Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare
Ce interpretăm Rezultatele
personale obţinute icircn urma studiului
care au fost prezentate icircn secţiunea bdquoRezultaterdquo
Explicăm rezultatele obţinute
Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale
Interpretarea trebuie să se realizeze icircn
lumina limitelor studiului
contextul cultural social şi educaţional al locului unde s-a realizat cercetarea
contextul a ceea ce se cunoaşte din literatura de specialitate
Interpretăm doar rezultatele personale obţinute icircn urma studiului
Interpretarea statistică nu este tot una cu interpretarea clinică
Interpretarea statistică este importantă
Interpretarea clinică este foarte importantă
Intervalul de confidenţă
Media calculată pe baza unui eşantion nu va echivala media populaţiei
Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului
Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a
populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a
populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)
pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru
orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare
dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de
confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de
date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de
5
Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel
Dacă valoarea p este mică
Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare
aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o
medie diferită Diferenţa este semnificativă dpdv statistic
43
Icircn continuare
Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa
reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică
pentru a fi interesante din punct de vedere ştiinţific
Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC
oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care
este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a
obţine o concluzie clară
Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o
diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că
datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din
punct de vedere ştiinţific
Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul
detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat
Erorile studiilor medicale
Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura
anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară
caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea
asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri
legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias
Erorile potenţiale icircn studiile epidemiologice
1 Erori icircntacircmplătoare
2 Erori sistematice
3 Confuzia
4 Validitatea
1 Erori icircntacircmplătoare
Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a
parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel
de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot
fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii
(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor
de măsură (eroarea de măsurare)
44
2 Erori sistematice
Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate
care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu
acurateţe mare Acurateţea nu este afectată de mărimea eşantionului
Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de
experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea
dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus
şi greu de cuantificat (consum de alcool personalitate etc)
Principalele tipuri de erori din această categorie sunt
bull Biasul de selecţie
bull Biasul de informaţie
Biasul de selecţie
Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul
trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion
inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale
persoanelor incluse
Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se
ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia
Biasul de informaţie
Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de
instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze
expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere
nesemnificativă sau chiar să nu şi-o amintească de loc
3 Confuzia
Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune
prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este
cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă
de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte
important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor
protector
4 Validitatea
Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă
Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte
estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional
Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă
45
conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se
demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)
Validitatea externă se poate realiza numai dacă studiul este valid intern
Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii
studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de
studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt
laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi
validă din punct de vedere intern)
3 6 Prezentarea rezultatelor
După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite
Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor
icircntr-o formă bdquodigerabilărdquo este necesară
Scopul prezentării datelor
1 Transmiterea concluziilor studiului
a Datele corecte şi importante merită comunicate
b Datele trebuie să confirme sau să infirme ipoteza studiului
c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală
2 Acordarea posibilităţii altor cercetători să aprecieze studiul
a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti
b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor
prezentate
Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru
fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie
statistică
Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de
valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras
(Tabel 3)
Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)
46
Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct
numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor
precum şi prezentarea acestora sub formă inteligibilă
Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care
convin cercetătorului
Prezentarea datelor se poate face
1 Figuri şi tabele icircn articole scrise
2 Figuri şi tabele icircn prezentări orale
3 Figuri şi tabele icircn postere
4 Text scris sau incluse icircn text
5 Site-uri de WEB
Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor
Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie
Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele
exprimacircnd exact ceea ce acestea exprimă
Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate
anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel
să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se
acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca
mai sus sugestive sunt formatele simple şi puţin icircncărcate
Dacă nu există reguli impuse se respectă
1 Mesaj simplu fără falsificarea datelor
2 De obicei este necesar atacirct tabelul cacirct şi graficul
3 Să fie simplu şi clar
Tabele
Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile
coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică
elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de
1 Se folosesc doar linii orizontale
2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn
evidenţi prin linie de separare (Tabelul 4)
Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland
Noua Zeelandă)
(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)
47
3 Numerele sunt aliniate icircn funcţie de virgulă
4 Indicii statistici sunt explicaţi sub tabel
5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană
6 Abrevierile pot fi folosite
7 Numărul de zecimale trebuie limitat la maxim două
8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel
9 Plasarea legendei este obligatorie sub tabel
10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)
Icircn cazul prezentărilor orale sau a posterelor este indicat ca
1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării
2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte
3 Folosirea de simboluri este permisă
Clasificarea tabelelor
Tabelele se clasifică după
i) conţinut
bull cu distribuţii de frecvenţe
bull de clase de frecvenţe
bull de contingenţă
ii) structura
bull cu doua coloane
bull cu subclasificări
bull ldquomasterrdquo
Tabele ce conţin distribuţii de frecvenţe
O modalitate comodă de a prezenta o mulţime de date brute este
1 Se ordonează datele in ordine crescătoare
2 Se determine frecvenţa fiecărei valori
3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane
(Tabelul 5)
Tabelul 5 Distribuţii de frecvenţă absolută
48
Tabelul claselor de frecvenţe
1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă
2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)
Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)
Tabele de contingenţă
1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a
tabelelor de contingenţă
2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a
combinaţiilor de perechi ordonate de valori
3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre
a factor de risc si
b starea sănătăţii
4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)
5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)
Tabelul 7 Tabel de contingenţă 2 x 2
49
Grafice
Există două categorii de moduri grafice sub care se pot prezenta datele
1 Ilustraţii şi fotografii
2 Grafice
1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă
pentru lucrare
2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit
Putem vorbi despre mai multe tipuri de grafice
bull Grafice pentru reprezentarea datelor cantitative
1048707 Grafic cartezian (X Y)
1048707 Histograma
1048707 Poligonul de frecvenţe
1048707 Diagrama bdquoscatterrdquo
bull Grafice pentru reprezentarea datelor calitative
1048707 Grafic cu bare
1048707 Diagrama tip bdquoboxplotrdquo
1048707 Diagrama bdquopierdquo
1048707 Cartograma
Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi
dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)
Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)
Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie
Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)
Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)
50
Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir
de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele
două variabile studiate (Figura 6)
Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2
(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2
rămacircne aproximativ constantă)
Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea
comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea
comparativă a mai multor variabile
Figura 7 Grafic calitativ cu bare
51
Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo
Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două
posibilităţi reprezentate grafic este mai frecventă (Figura 8)
Figura 8 Reprezentare tip bdquopierdquo
Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli
sau a oricărui element comparativ Se foloseşte de epidemiologi
Rezultate
Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare
Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o
manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu
explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția
bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la
ilustraţii tabele grafice
Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi
nici rezultatele care invalidează eventual ipoteza
Discuţii
Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd
cultura ştiinţifică şi inteligenţa autorilor
Acest capitol răspunde la trei obiective
Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia
calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de
selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează
rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv
52
este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn
care a fost abordată problema fără a face o revistă a literaturii
Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea
rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul
Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor
afirmaţii nesusţinute de conţinutul lucrării
Concluzii
Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate
să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie
Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de
concluzii va scădea valoarea lucrării
Bibliografia (lista referinţelor citarea icircn text)
Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn
lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente
Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli
- să conţină cele mai importante şi recente lucrări
- să includă numai lucrări publicate
- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate
Bibliografie
Elisabeta Jaba ndash Statistică Ed Economică 1998
Mihai Ţarcă ndash Statistică volI Ed UAIC 1979
Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale
Ed University Press 2009
Sorana Daniela Bolboacă ndash Metodologia cercetării curs
53
Testul z pentru proporţii
Testul McNemar
Tabela de contingenţă 2times2
Scale de tip nominal (dicotomiale tabela de contingenţă de 2times2) sau ordinal (tabela de contingenţă de
rtimesc)
Frecvenţa absolută (numărul de evenimente per categorie)
Tabela de contingenţă de 2times2 4 categorii
AP = adevărat pozitiv
FP = fals pozitiv
FN = fals negativ
AN = adevărat negativ
Ulcer deschis Ulcer vindecat Total
Recurenţă + AP = 1 FP = 5 = 1+5 = 6
Recurenţă - FN = 7 AN = 16 = 7+16 = 23
Total =1+7=8 =5+16=21 29
Riscuri şi raţii Mărimi ale asocierii
Denumire Formula Definiţie
Rata falşilor pozitivi =FP(FP+AN) Probabilitatea unui test fals + (α)
Rata falşilor negativi =FN(FN+AP) Probabilitatea unui test fals ndash (β)
Sensibilitate =AP(AP+FN) Probabilitatea unui test real + (1- β)
Specificitate =AN(AN+FP) Probabilitatea unui test real ndash (1- α)
Acurateţe =(AP+AN)n Probabilitatea generală a unei decizii corecte
Valoarea predictivă pozitivă =AP(AP+FP) Probabilitatea ca un test pozitiv să fie corect
Valoarea predictivă negativă =AN(AN+FN) Probabilitatea ca un test negativ să fie corect
Riscul relativ =AP(FP+AN)FN(AP+FP)
Rata şansei =(AP∙AN)(FN∙FP)
Riscul atribuabil =AP(AP+FP)-FN(FN+AN)
24
Denumire Formula
Rata falşilor pozitivi = 5(5+1) = 08334
Rata falşilor negativi = 7(7+16) = 03043
Sensibilitate = 1(1+7) = 01250
Specificitate = 16(16+5) = 07619
Acurateţe = (1+16)29 = 05862
Valoarea predictivă pozitivă = 1(1+5) = 01667
Valoarea predictivă negativă = 16(16+7) = 06957
Riscul relativ = 1(5+16)7(1+5) = 2142 = 050
Rata şansei = (1∙16)(7∙5) = 04571
Riscul atribuabil = 1(1+5)-7(7+16) = 01667-03043=-01376
Testarea asocierii icircn tabela de contingenţă
Testul χ2
Nu trebuie utilizat pentru eşantioane de volum mic
Testul este valid doar dacă valoarea expectată (aşteptată) pentru fiecare celulă este cel puţin
egală cu 1 şi frecvenţa absolută observată este de minim 5
Dacă aceste condiţii nu sunt icircndeplinite se aplică testul exact al lui Fisher (Fisherrsquos Exact Test)
Indică dacă cele două variabile sunt sau nu independente DAR NU cuantifică puterea asocierii
dintre ele
Problema S-a investigat icircntr-un studiu asocierea dintre obezitatea (ca factor de risc) şi bolile
cardio-vasculare la persoanele icircn etate (gt 60 ani) Din totalul de 620 persoane investigate s-au
identificat 150 persoane cu obezitate şi boală cardio-vasculară 230 persoane fără obezitate şi
fără boală cardio-vasculară şi 60 persoane fără obezitate dar cu boală cardio-vasculară Există
o asociere icircntre obezitate şi boala cardio-vasculară (df=1 α=005 χ2critic = 384)
Testul χ2 exemplu
H025
Nu există asociere icircntre obezitate şi bolile cardio-vasculare
Obezitatea şi bolile cardio-vasculare sunt independente
H1
Există asociere icircntre obezitate şi bolile cardio-vasculare
Obezitatea şi bolile cardio-vasculare sunt asociate
a = 005 pragul de semnificaţie al testului
urmează o lege cu (r-1)(c-1) grade de libertate
χ2 = parametrul testului χ2
fio = frecvenţa observată
fit = frecvenţa teoretică
Regiunea critică este [χα2 yen)
Pentru α = 005 χα2 = 384
OBSERVAT BCV+ BCV- Total
Obezitate + AP = 150 FP = 180 330
Obezitate - FN = 60 AN = 230 290
Total 210 410 620
TEORETIC BCV+ BCV- Total
Obezitate + = 330times210620 = 330times410620 330
Obezitate - = 290times210620 = 290times410620 290
Total 210 410 620
TEORETIC BCV+ BCV- Total
Obezitate + = 330times210620 = 330times410620 330
26
Obezitate - = 290times210620 = 290times410620 290
Total 210 410 620
TEORETIC BCV+ BCV-
Obezitate + = 112 = 218
Obezitate - = 98 = 192
Deoarece 4177Icirc[384 yen) se respinge H0 cu un risc de eroare de 5
Există asociere icircntre obezitate şi bolile cardio-vasculare
Testul Fisher
Corecţie a testului χ2
Valoarea p asociată parametrului ne dă probabilitatea ca valoarea observată de independenţă să fie
atribuită doar şansei
O valoare p mică indică că există alte cauze decacirct şansa influenţează rezultatul şi astfel cele două
variabile investigate nu sunt independente
Testul Fisher = dispersia corectată a factorului x dispersia corectată a factorilor reziduali
Icircn acest context regula adunării dispersiilor se poate scrie unde
este variaţia lui y pe seama variaţiei variabilei x
este variaţia lui y pe seama influenţei factorilor reziduali (neicircnregistraţi)
este variaţia totală a caracteristicii y
Testul Fisher empiric se calculează după formula
27
se compară cu Ftab pentru nx şi nz grade de libertate la un anumit prag de semnificaţie stabilit
Dacă Fc gt Ftab rezultă că variaţia factorului de grupare x este semnificativă pentru variaţia caracteristicii y
Testul z pentru proporţii
1 Compararea unei frecvenţe observate cu o frecvenţă teoretică
2 Testarea egalităţii a două frecvenţe
Testul z Compararea unei frecvenţe observate cu o frecvenţă teoretică
Scop Investigarea semnificaţiei diferenţei icircntre o frecvenţă teoretică p (icircntr-o populaţie) şi o frecvenţă
observată f pe un eşantion reprezentativ (variabilă calitativă (binare))
Condiţii de aplicare Testul este corect aplicat dacă numărul n al observaţiilor eşantionului este
suficient de mare (n∙p n∙(1-p)gt10
Parametrul
n = volumul eşantionului
Suntem interesaţi de investigarea prevalenţei hepatitei B la personalul care lucrează icircn laboratoarele
clinicilor de boli infecţioase din Transilvania Se ştie din studii anterioare că prevalenţa hepatitei B icircn
populaţia generală din Transilvania este de 9 S-a luat icircn studiu un eşantion de 100 persoane şi s-a
obţinut o prevalenţă a hepatitei B de 6 Există diferenţă semnificativă icircntre frecvenţa hepatitei B la
personalul care lucrează icircn laboratoarele spitalelor de boli infecţioase din Transilvania faţă de
populaţia generală
f = 006 p = 009 n = 100
Ipoteza nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat
faţă de frecvenţa hepatitei B icircn populaţia generală
Ipoteza alternativă test bilateral Există diferenţă semnificativă icircntre frecvenţa hepatitei B la
nivelul eşantionului şi prevalenţa hepatitei B icircn populaţia generală
f = 006 p = 009 n = 100
Pragul de semnificaţie a = 005
Regiunea critică test bilateral (-yen -196 ]Egrave[196 yen)
28
Concluzia testului
Deoarece parametrul statistic calculat al testului nu aparţine regiunii critice se acceptă ipoteza
nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat faţă de
frecvenţa hepatitei B icircn populaţia generală
Testul McNemar
Evaluarea dependenţei variabilelor calitative perechi (dorim să determinăm dacă o anumită
caracteristică este sau nu asociată cu o anumită patologie)
Identificăm n pacienţi care prezintă patologia de interes (eg Cancer bronho-pulmonar) şi n
pacienţi cu aceleaşi caracteristici ca şi primul grup dar care nu o prezintă
Martor = da Martor = nu
Caz = da a b
Caz = nu c d
Testul McNemar - exemplu fumat vs cancer
Martor = da Martor = nu
Cancer = da a = 2 b = 5
Cancer = nu c = 0 d = 3
29
χ2critic(α=005) = 384
32 lt 384 rarr acceptăm ipoteza nulă
Fumatul nu este icircn relaţie cu apariţia cancerului bronho-pulmonar
Inferenţa statistică pe date cantitative
Variabile cantitative continue
Testul z şi Student (t) (o medie sau medii perechi)
Testul z şi Student (t) (testarea a două medii)
ANOVA (ge 3 medii)
Ranguri (variabile cantitative discrete sau cantitative care nu icircndeplinesc condiţia de
normalitate)
Testul sumei rangurilor Wilcoxon
Kruskal-Wallis (ge 3 eşantioane independente)
Friedman (ge 3 eşantioane dependente)
Teste de normalitate variabile cantitative continue
Shapiro-Wilk
Kolmogorov-Smirnov
Shapiro-Wilk
Chi-Square Goodness-of-Fit
Dacă datele urmează o distribuţie normală aplicăm un test parametric
Dacă datele nu urmează o distribuţie normală aplicăm un test de comparare al rangurilor
30
Testul Z de comparare a mediei unui eşantion cu media unei populaţii
Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ
extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie
s2 care se cunoaşte
Condiţii de aplicare
1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru
compararea mediei unui eşantion cu media unei populaţii)
2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal
distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă
3 Talia eşantionului este mare ( ge 30)
Ipoteze
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media
eşantionului şi media populaţiei
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
(-yen -196 ] Egrave [196 yen)
Parametrul testului
n = volumul eşantionului
= media eşantionului
s = deviaţia standard a populaţiei
Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)
Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard
cunoscută
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi
media standard
Condiţii de aplicare
Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se
realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această
condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea
31
Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai
puternic
Numărul de grade de libertate (df) df = n-1
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
Parametrul testului
n = volumul eşantionului
micro0 = media standard
= media eşantionului
s = deviaţia standard a eşantionului
Testul ANOVA compararea mediilor a mai multe eşantioane
H0 = toate mediile sunt egale
H1 = nu toate mediile sunt egale
Condiţii de aplicare
1 Datele sunt independente unele faţă de celelalte
2 Datele fiecărui grup sunt normal distribuite
3 Deviaţia standard este aceeaşi pentru toate grupurile
Id Medicament
A B C D E F
1 5 6 7 10 5 9
2 6 8 8 11 8 8
3 7 7 9 13 6 7
4 8 9 11 12 4 5
32
5 9 10 10 9 7 6
Suma 35 40 45 55 30 35
Media 7 8 9 11 6 7
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =
= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)
Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2
F = (suma pătratelor(icircntre))(suma pătratelor(icircn))
Suma pătratelor (icircntre) = 16times5 = 80
Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60
Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn
interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare
SP df Media pătratelor F = MPicircntreMPicircn
Icircntre 80 5 = 805 = 16 = 1625 = 64
Icircn 60 24 = 6024 = 25
Total 140 29 -
Testul sumei rangurilor Wilcoxon
Aplicat pentru
Un set de observaţii provenite dintr-o valoare ipotetică comună
Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)
Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero
Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace
Suma rangurilor pentru diferenţele negative = 2+3+1 = 6
Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30
33
Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului
egal cu 8 = 0109
Icircnainte După Diferenţa Rang
64 66 -2 2
66 58 8 5
67 68 -1 3
71 65 6 4
72 75 -3 1
76 67 9 6
78 59 19 8
89 74 15 7
Testul Kruskal-Wallis (ge 3 eşantioane independente)
Test de ranguri aplicate pe mai mult de 3 eşantioane
H = parametrul testului
n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)
Tk = suma rangurilor
Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie
pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni
34
df = k-1 (k = numărul de eşantioane)
df = 3-1 = 2
Hcritic(α=005) = 599
H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie
pozitivă şi respectiv biopsie negativă
Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie
a tipului de studiu pe eşantioane perechi)
1 Definirea numărului de tratamente k
2 Obţinerea rangurilor pentru fiecare tratament
3 Sumarea rangurilor fiecărui tratament
4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)
5 Dacă Fr gt Frcritic rarr respingem H0
Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost
măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi
n = 9 k = 3 T12 = 225 T2
2 = 38025 T32 = 38025
Frcritic = 599
Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de
prostată
35
De reţinut
Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei
Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-
of-Fit
Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z
Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t
Compararea mediilor a 3 sau mai multe eşantioane ANOVA
Compararea mediilor a două populaţii (σ) testul Z
Compararea mediilor a două eşantioane (s) testul t
Compararea mediilor a două eşantioane perechi (s) testul t
ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi
cu cel pentru compararea a două eşantioane perechi
Ranguri
Distribuţia datelor nu are importanţă
Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)
Trei sau mai multe eşantioane Kruskal-Wallis
Trei sau mai multe eşantioane perechi Friedman
Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia
Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a
datelor)
Variabile nominale
Un singur eşantion sau eşantioane perechi
Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte
Eşantioane perechi testul Mc Nemar
Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2
Icircn analiza proporţiilor există teste diferite pentru
Compararea unei frecvenţe cu o frecvenţă cunoscută
Compararea a două frecvenţe
Semnificaţia statistică
Valoarea p (p value)
Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor
două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E
posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării
aleatorii
36
Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală
urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii
Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este
probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un
experiment de dimensiunea acestuia
Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că
diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii
diferite
Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca
fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă
ar fi fost adevărată
Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă
1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe
baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De
fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001
2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie
3 Se aplică testul statistic aferent pentru a calcula valoarea p
4 Se compară valoarea p cu valoarea ndash prag
5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe
semnificativă dpdv statisticrdquo
6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e
semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să
conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă
Teste de semnificaţie
Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului
populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)
Testarea ipotezelor implică posibile erori
Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile
sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui
grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul
icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005
ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există
37
nici o diferenţă
Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ
statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de
ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost
ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau
dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă
cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă
semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe
ipotetice variate icircn cazul icircn care ele există
Măsuri ale frecvenţei
Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)
Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate
Generic formula pe care se bazează toate cele trei este
unde x şi y sunt cantităţile de comparat
Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea
unei frecvenţe pe grupe de sex vacircrstă etc
Proporţia implică icircn mod necesar ca x să fie inclus icircn y
Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară
frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp
Pentru calcularea unei rate trebuie ţinut cont de trei aspecte
bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin
bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp
bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo
Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un
tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei
populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei
aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)
38
Indicatori
Rata de incidenţă
Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă
icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii
Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o
perioadă de timp
Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de
timp x
Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei
susceptibili de a dezvolta icircmbolnăvirea studiată
Numitorul poate fi
bull Numărul mediu al populaţiei icircn perioada de timp studiată
bull Mărimea populaţiei icircn mijlocul perioadei de studiu
bull Mărimea populaţiei la icircnceputul studiului
Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă
Este obligatorie menţionarea perioadei de timp
Prevalenţa
Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la
un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă
schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa
momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)
39
Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include
numai cazuri noi respectiv include cazuri noi şi vechi
Rata de atac
Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este
folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp
raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori
Rata persoană-timp
Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din
momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte
migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost
observate
Riscul relativ (RR)
Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment
legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele
prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două
grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la
bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la
bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai
mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo
Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2
Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn
cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă
(Tabelul 1)
Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR
Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la
neexpuşi
40
Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de
culegere a datelor
Odds ratio (OR)
Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin
raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general
studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)
Tabelul 2 Tabelul 2 x 2 pentru calcularea OR
Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală
Rate de mortalitate
Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp
specificată Există mai multe tipuri de rate de mortalitate
o Mortalitate specifică pe sex
o Mortalitate specifică pe rasă
o Mortalitate specifică pe boală
o Mortalitate neonatală
o Mortalitate postneonatală
o Mortalitate infantilă
o Mortalitate maternă
Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP
41
Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de
viaţă şi vacircrsta la care survine decesul dacă este prematur
Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu
Ani de viaţă pierduţi datorat dizabilităţii
Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt
utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru
cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite
grupuri
Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de
risc şi o boală se folosesc riscul relativ şi odds ratio
35 Analiza şi interpretarea datelor
După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date
trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul
Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor
colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului
studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu
plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde
prezenţa biostatisticianului este necesară
Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu
elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat
iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului
iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate
depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori
testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere
clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza
Interpretarea rezultatelor statistice
Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne
motive (număr mic de date) acceptarea ei să fie falsă
Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine
gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia
ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument
de decizie Intervalul de confidenţă
42
Interpretarea statistica ne interpretarea clinică
Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă
Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice
obţinute pe eşantionul studiat
Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare
Ce interpretăm Rezultatele
personale obţinute icircn urma studiului
care au fost prezentate icircn secţiunea bdquoRezultaterdquo
Explicăm rezultatele obţinute
Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale
Interpretarea trebuie să se realizeze icircn
lumina limitelor studiului
contextul cultural social şi educaţional al locului unde s-a realizat cercetarea
contextul a ceea ce se cunoaşte din literatura de specialitate
Interpretăm doar rezultatele personale obţinute icircn urma studiului
Interpretarea statistică nu este tot una cu interpretarea clinică
Interpretarea statistică este importantă
Interpretarea clinică este foarte importantă
Intervalul de confidenţă
Media calculată pe baza unui eşantion nu va echivala media populaţiei
Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului
Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a
populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a
populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)
pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru
orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare
dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de
confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de
date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de
5
Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel
Dacă valoarea p este mică
Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare
aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o
medie diferită Diferenţa este semnificativă dpdv statistic
43
Icircn continuare
Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa
reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică
pentru a fi interesante din punct de vedere ştiinţific
Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC
oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care
este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a
obţine o concluzie clară
Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o
diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că
datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din
punct de vedere ştiinţific
Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul
detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat
Erorile studiilor medicale
Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura
anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară
caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea
asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri
legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias
Erorile potenţiale icircn studiile epidemiologice
1 Erori icircntacircmplătoare
2 Erori sistematice
3 Confuzia
4 Validitatea
1 Erori icircntacircmplătoare
Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a
parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel
de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot
fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii
(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor
de măsură (eroarea de măsurare)
44
2 Erori sistematice
Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate
care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu
acurateţe mare Acurateţea nu este afectată de mărimea eşantionului
Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de
experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea
dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus
şi greu de cuantificat (consum de alcool personalitate etc)
Principalele tipuri de erori din această categorie sunt
bull Biasul de selecţie
bull Biasul de informaţie
Biasul de selecţie
Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul
trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion
inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale
persoanelor incluse
Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se
ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia
Biasul de informaţie
Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de
instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze
expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere
nesemnificativă sau chiar să nu şi-o amintească de loc
3 Confuzia
Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune
prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este
cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă
de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte
important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor
protector
4 Validitatea
Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă
Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte
estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional
Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă
45
conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se
demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)
Validitatea externă se poate realiza numai dacă studiul este valid intern
Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii
studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de
studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt
laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi
validă din punct de vedere intern)
3 6 Prezentarea rezultatelor
După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite
Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor
icircntr-o formă bdquodigerabilărdquo este necesară
Scopul prezentării datelor
1 Transmiterea concluziilor studiului
a Datele corecte şi importante merită comunicate
b Datele trebuie să confirme sau să infirme ipoteza studiului
c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală
2 Acordarea posibilităţii altor cercetători să aprecieze studiul
a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti
b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor
prezentate
Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru
fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie
statistică
Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de
valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras
(Tabel 3)
Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)
46
Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct
numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor
precum şi prezentarea acestora sub formă inteligibilă
Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care
convin cercetătorului
Prezentarea datelor se poate face
1 Figuri şi tabele icircn articole scrise
2 Figuri şi tabele icircn prezentări orale
3 Figuri şi tabele icircn postere
4 Text scris sau incluse icircn text
5 Site-uri de WEB
Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor
Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie
Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele
exprimacircnd exact ceea ce acestea exprimă
Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate
anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel
să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se
acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca
mai sus sugestive sunt formatele simple şi puţin icircncărcate
Dacă nu există reguli impuse se respectă
1 Mesaj simplu fără falsificarea datelor
2 De obicei este necesar atacirct tabelul cacirct şi graficul
3 Să fie simplu şi clar
Tabele
Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile
coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică
elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de
1 Se folosesc doar linii orizontale
2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn
evidenţi prin linie de separare (Tabelul 4)
Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland
Noua Zeelandă)
(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)
47
3 Numerele sunt aliniate icircn funcţie de virgulă
4 Indicii statistici sunt explicaţi sub tabel
5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană
6 Abrevierile pot fi folosite
7 Numărul de zecimale trebuie limitat la maxim două
8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel
9 Plasarea legendei este obligatorie sub tabel
10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)
Icircn cazul prezentărilor orale sau a posterelor este indicat ca
1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării
2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte
3 Folosirea de simboluri este permisă
Clasificarea tabelelor
Tabelele se clasifică după
i) conţinut
bull cu distribuţii de frecvenţe
bull de clase de frecvenţe
bull de contingenţă
ii) structura
bull cu doua coloane
bull cu subclasificări
bull ldquomasterrdquo
Tabele ce conţin distribuţii de frecvenţe
O modalitate comodă de a prezenta o mulţime de date brute este
1 Se ordonează datele in ordine crescătoare
2 Se determine frecvenţa fiecărei valori
3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane
(Tabelul 5)
Tabelul 5 Distribuţii de frecvenţă absolută
48
Tabelul claselor de frecvenţe
1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă
2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)
Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)
Tabele de contingenţă
1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a
tabelelor de contingenţă
2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a
combinaţiilor de perechi ordonate de valori
3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre
a factor de risc si
b starea sănătăţii
4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)
5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)
Tabelul 7 Tabel de contingenţă 2 x 2
49
Grafice
Există două categorii de moduri grafice sub care se pot prezenta datele
1 Ilustraţii şi fotografii
2 Grafice
1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă
pentru lucrare
2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit
Putem vorbi despre mai multe tipuri de grafice
bull Grafice pentru reprezentarea datelor cantitative
1048707 Grafic cartezian (X Y)
1048707 Histograma
1048707 Poligonul de frecvenţe
1048707 Diagrama bdquoscatterrdquo
bull Grafice pentru reprezentarea datelor calitative
1048707 Grafic cu bare
1048707 Diagrama tip bdquoboxplotrdquo
1048707 Diagrama bdquopierdquo
1048707 Cartograma
Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi
dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)
Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)
Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie
Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)
Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)
50
Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir
de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele
două variabile studiate (Figura 6)
Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2
(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2
rămacircne aproximativ constantă)
Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea
comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea
comparativă a mai multor variabile
Figura 7 Grafic calitativ cu bare
51
Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo
Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două
posibilităţi reprezentate grafic este mai frecventă (Figura 8)
Figura 8 Reprezentare tip bdquopierdquo
Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli
sau a oricărui element comparativ Se foloseşte de epidemiologi
Rezultate
Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare
Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o
manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu
explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția
bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la
ilustraţii tabele grafice
Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi
nici rezultatele care invalidează eventual ipoteza
Discuţii
Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd
cultura ştiinţifică şi inteligenţa autorilor
Acest capitol răspunde la trei obiective
Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia
calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de
selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează
rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv
52
este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn
care a fost abordată problema fără a face o revistă a literaturii
Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea
rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul
Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor
afirmaţii nesusţinute de conţinutul lucrării
Concluzii
Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate
să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie
Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de
concluzii va scădea valoarea lucrării
Bibliografia (lista referinţelor citarea icircn text)
Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn
lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente
Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli
- să conţină cele mai importante şi recente lucrări
- să includă numai lucrări publicate
- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate
Bibliografie
Elisabeta Jaba ndash Statistică Ed Economică 1998
Mihai Ţarcă ndash Statistică volI Ed UAIC 1979
Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale
Ed University Press 2009
Sorana Daniela Bolboacă ndash Metodologia cercetării curs
53
Denumire Formula
Rata falşilor pozitivi = 5(5+1) = 08334
Rata falşilor negativi = 7(7+16) = 03043
Sensibilitate = 1(1+7) = 01250
Specificitate = 16(16+5) = 07619
Acurateţe = (1+16)29 = 05862
Valoarea predictivă pozitivă = 1(1+5) = 01667
Valoarea predictivă negativă = 16(16+7) = 06957
Riscul relativ = 1(5+16)7(1+5) = 2142 = 050
Rata şansei = (1∙16)(7∙5) = 04571
Riscul atribuabil = 1(1+5)-7(7+16) = 01667-03043=-01376
Testarea asocierii icircn tabela de contingenţă
Testul χ2
Nu trebuie utilizat pentru eşantioane de volum mic
Testul este valid doar dacă valoarea expectată (aşteptată) pentru fiecare celulă este cel puţin
egală cu 1 şi frecvenţa absolută observată este de minim 5
Dacă aceste condiţii nu sunt icircndeplinite se aplică testul exact al lui Fisher (Fisherrsquos Exact Test)
Indică dacă cele două variabile sunt sau nu independente DAR NU cuantifică puterea asocierii
dintre ele
Problema S-a investigat icircntr-un studiu asocierea dintre obezitatea (ca factor de risc) şi bolile
cardio-vasculare la persoanele icircn etate (gt 60 ani) Din totalul de 620 persoane investigate s-au
identificat 150 persoane cu obezitate şi boală cardio-vasculară 230 persoane fără obezitate şi
fără boală cardio-vasculară şi 60 persoane fără obezitate dar cu boală cardio-vasculară Există
o asociere icircntre obezitate şi boala cardio-vasculară (df=1 α=005 χ2critic = 384)
Testul χ2 exemplu
H025
Nu există asociere icircntre obezitate şi bolile cardio-vasculare
Obezitatea şi bolile cardio-vasculare sunt independente
H1
Există asociere icircntre obezitate şi bolile cardio-vasculare
Obezitatea şi bolile cardio-vasculare sunt asociate
a = 005 pragul de semnificaţie al testului
urmează o lege cu (r-1)(c-1) grade de libertate
χ2 = parametrul testului χ2
fio = frecvenţa observată
fit = frecvenţa teoretică
Regiunea critică este [χα2 yen)
Pentru α = 005 χα2 = 384
OBSERVAT BCV+ BCV- Total
Obezitate + AP = 150 FP = 180 330
Obezitate - FN = 60 AN = 230 290
Total 210 410 620
TEORETIC BCV+ BCV- Total
Obezitate + = 330times210620 = 330times410620 330
Obezitate - = 290times210620 = 290times410620 290
Total 210 410 620
TEORETIC BCV+ BCV- Total
Obezitate + = 330times210620 = 330times410620 330
26
Obezitate - = 290times210620 = 290times410620 290
Total 210 410 620
TEORETIC BCV+ BCV-
Obezitate + = 112 = 218
Obezitate - = 98 = 192
Deoarece 4177Icirc[384 yen) se respinge H0 cu un risc de eroare de 5
Există asociere icircntre obezitate şi bolile cardio-vasculare
Testul Fisher
Corecţie a testului χ2
Valoarea p asociată parametrului ne dă probabilitatea ca valoarea observată de independenţă să fie
atribuită doar şansei
O valoare p mică indică că există alte cauze decacirct şansa influenţează rezultatul şi astfel cele două
variabile investigate nu sunt independente
Testul Fisher = dispersia corectată a factorului x dispersia corectată a factorilor reziduali
Icircn acest context regula adunării dispersiilor se poate scrie unde
este variaţia lui y pe seama variaţiei variabilei x
este variaţia lui y pe seama influenţei factorilor reziduali (neicircnregistraţi)
este variaţia totală a caracteristicii y
Testul Fisher empiric se calculează după formula
27
se compară cu Ftab pentru nx şi nz grade de libertate la un anumit prag de semnificaţie stabilit
Dacă Fc gt Ftab rezultă că variaţia factorului de grupare x este semnificativă pentru variaţia caracteristicii y
Testul z pentru proporţii
1 Compararea unei frecvenţe observate cu o frecvenţă teoretică
2 Testarea egalităţii a două frecvenţe
Testul z Compararea unei frecvenţe observate cu o frecvenţă teoretică
Scop Investigarea semnificaţiei diferenţei icircntre o frecvenţă teoretică p (icircntr-o populaţie) şi o frecvenţă
observată f pe un eşantion reprezentativ (variabilă calitativă (binare))
Condiţii de aplicare Testul este corect aplicat dacă numărul n al observaţiilor eşantionului este
suficient de mare (n∙p n∙(1-p)gt10
Parametrul
n = volumul eşantionului
Suntem interesaţi de investigarea prevalenţei hepatitei B la personalul care lucrează icircn laboratoarele
clinicilor de boli infecţioase din Transilvania Se ştie din studii anterioare că prevalenţa hepatitei B icircn
populaţia generală din Transilvania este de 9 S-a luat icircn studiu un eşantion de 100 persoane şi s-a
obţinut o prevalenţă a hepatitei B de 6 Există diferenţă semnificativă icircntre frecvenţa hepatitei B la
personalul care lucrează icircn laboratoarele spitalelor de boli infecţioase din Transilvania faţă de
populaţia generală
f = 006 p = 009 n = 100
Ipoteza nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat
faţă de frecvenţa hepatitei B icircn populaţia generală
Ipoteza alternativă test bilateral Există diferenţă semnificativă icircntre frecvenţa hepatitei B la
nivelul eşantionului şi prevalenţa hepatitei B icircn populaţia generală
f = 006 p = 009 n = 100
Pragul de semnificaţie a = 005
Regiunea critică test bilateral (-yen -196 ]Egrave[196 yen)
28
Concluzia testului
Deoarece parametrul statistic calculat al testului nu aparţine regiunii critice se acceptă ipoteza
nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat faţă de
frecvenţa hepatitei B icircn populaţia generală
Testul McNemar
Evaluarea dependenţei variabilelor calitative perechi (dorim să determinăm dacă o anumită
caracteristică este sau nu asociată cu o anumită patologie)
Identificăm n pacienţi care prezintă patologia de interes (eg Cancer bronho-pulmonar) şi n
pacienţi cu aceleaşi caracteristici ca şi primul grup dar care nu o prezintă
Martor = da Martor = nu
Caz = da a b
Caz = nu c d
Testul McNemar - exemplu fumat vs cancer
Martor = da Martor = nu
Cancer = da a = 2 b = 5
Cancer = nu c = 0 d = 3
29
χ2critic(α=005) = 384
32 lt 384 rarr acceptăm ipoteza nulă
Fumatul nu este icircn relaţie cu apariţia cancerului bronho-pulmonar
Inferenţa statistică pe date cantitative
Variabile cantitative continue
Testul z şi Student (t) (o medie sau medii perechi)
Testul z şi Student (t) (testarea a două medii)
ANOVA (ge 3 medii)
Ranguri (variabile cantitative discrete sau cantitative care nu icircndeplinesc condiţia de
normalitate)
Testul sumei rangurilor Wilcoxon
Kruskal-Wallis (ge 3 eşantioane independente)
Friedman (ge 3 eşantioane dependente)
Teste de normalitate variabile cantitative continue
Shapiro-Wilk
Kolmogorov-Smirnov
Shapiro-Wilk
Chi-Square Goodness-of-Fit
Dacă datele urmează o distribuţie normală aplicăm un test parametric
Dacă datele nu urmează o distribuţie normală aplicăm un test de comparare al rangurilor
30
Testul Z de comparare a mediei unui eşantion cu media unei populaţii
Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ
extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie
s2 care se cunoaşte
Condiţii de aplicare
1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru
compararea mediei unui eşantion cu media unei populaţii)
2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal
distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă
3 Talia eşantionului este mare ( ge 30)
Ipoteze
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media
eşantionului şi media populaţiei
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
(-yen -196 ] Egrave [196 yen)
Parametrul testului
n = volumul eşantionului
= media eşantionului
s = deviaţia standard a populaţiei
Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)
Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard
cunoscută
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi
media standard
Condiţii de aplicare
Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se
realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această
condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea
31
Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai
puternic
Numărul de grade de libertate (df) df = n-1
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
Parametrul testului
n = volumul eşantionului
micro0 = media standard
= media eşantionului
s = deviaţia standard a eşantionului
Testul ANOVA compararea mediilor a mai multe eşantioane
H0 = toate mediile sunt egale
H1 = nu toate mediile sunt egale
Condiţii de aplicare
1 Datele sunt independente unele faţă de celelalte
2 Datele fiecărui grup sunt normal distribuite
3 Deviaţia standard este aceeaşi pentru toate grupurile
Id Medicament
A B C D E F
1 5 6 7 10 5 9
2 6 8 8 11 8 8
3 7 7 9 13 6 7
4 8 9 11 12 4 5
32
5 9 10 10 9 7 6
Suma 35 40 45 55 30 35
Media 7 8 9 11 6 7
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =
= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)
Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2
F = (suma pătratelor(icircntre))(suma pătratelor(icircn))
Suma pătratelor (icircntre) = 16times5 = 80
Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60
Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn
interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare
SP df Media pătratelor F = MPicircntreMPicircn
Icircntre 80 5 = 805 = 16 = 1625 = 64
Icircn 60 24 = 6024 = 25
Total 140 29 -
Testul sumei rangurilor Wilcoxon
Aplicat pentru
Un set de observaţii provenite dintr-o valoare ipotetică comună
Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)
Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero
Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace
Suma rangurilor pentru diferenţele negative = 2+3+1 = 6
Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30
33
Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului
egal cu 8 = 0109
Icircnainte După Diferenţa Rang
64 66 -2 2
66 58 8 5
67 68 -1 3
71 65 6 4
72 75 -3 1
76 67 9 6
78 59 19 8
89 74 15 7
Testul Kruskal-Wallis (ge 3 eşantioane independente)
Test de ranguri aplicate pe mai mult de 3 eşantioane
H = parametrul testului
n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)
Tk = suma rangurilor
Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie
pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni
34
df = k-1 (k = numărul de eşantioane)
df = 3-1 = 2
Hcritic(α=005) = 599
H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie
pozitivă şi respectiv biopsie negativă
Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie
a tipului de studiu pe eşantioane perechi)
1 Definirea numărului de tratamente k
2 Obţinerea rangurilor pentru fiecare tratament
3 Sumarea rangurilor fiecărui tratament
4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)
5 Dacă Fr gt Frcritic rarr respingem H0
Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost
măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi
n = 9 k = 3 T12 = 225 T2
2 = 38025 T32 = 38025
Frcritic = 599
Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de
prostată
35
De reţinut
Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei
Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-
of-Fit
Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z
Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t
Compararea mediilor a 3 sau mai multe eşantioane ANOVA
Compararea mediilor a două populaţii (σ) testul Z
Compararea mediilor a două eşantioane (s) testul t
Compararea mediilor a două eşantioane perechi (s) testul t
ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi
cu cel pentru compararea a două eşantioane perechi
Ranguri
Distribuţia datelor nu are importanţă
Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)
Trei sau mai multe eşantioane Kruskal-Wallis
Trei sau mai multe eşantioane perechi Friedman
Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia
Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a
datelor)
Variabile nominale
Un singur eşantion sau eşantioane perechi
Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte
Eşantioane perechi testul Mc Nemar
Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2
Icircn analiza proporţiilor există teste diferite pentru
Compararea unei frecvenţe cu o frecvenţă cunoscută
Compararea a două frecvenţe
Semnificaţia statistică
Valoarea p (p value)
Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor
două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E
posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării
aleatorii
36
Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală
urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii
Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este
probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un
experiment de dimensiunea acestuia
Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că
diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii
diferite
Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca
fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă
ar fi fost adevărată
Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă
1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe
baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De
fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001
2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie
3 Se aplică testul statistic aferent pentru a calcula valoarea p
4 Se compară valoarea p cu valoarea ndash prag
5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe
semnificativă dpdv statisticrdquo
6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e
semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să
conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă
Teste de semnificaţie
Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului
populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)
Testarea ipotezelor implică posibile erori
Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile
sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui
grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul
icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005
ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există
37
nici o diferenţă
Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ
statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de
ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost
ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau
dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă
cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă
semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe
ipotetice variate icircn cazul icircn care ele există
Măsuri ale frecvenţei
Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)
Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate
Generic formula pe care se bazează toate cele trei este
unde x şi y sunt cantităţile de comparat
Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea
unei frecvenţe pe grupe de sex vacircrstă etc
Proporţia implică icircn mod necesar ca x să fie inclus icircn y
Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară
frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp
Pentru calcularea unei rate trebuie ţinut cont de trei aspecte
bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin
bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp
bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo
Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un
tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei
populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei
aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)
38
Indicatori
Rata de incidenţă
Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă
icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii
Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o
perioadă de timp
Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de
timp x
Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei
susceptibili de a dezvolta icircmbolnăvirea studiată
Numitorul poate fi
bull Numărul mediu al populaţiei icircn perioada de timp studiată
bull Mărimea populaţiei icircn mijlocul perioadei de studiu
bull Mărimea populaţiei la icircnceputul studiului
Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă
Este obligatorie menţionarea perioadei de timp
Prevalenţa
Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la
un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă
schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa
momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)
39
Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include
numai cazuri noi respectiv include cazuri noi şi vechi
Rata de atac
Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este
folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp
raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori
Rata persoană-timp
Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din
momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte
migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost
observate
Riscul relativ (RR)
Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment
legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele
prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două
grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la
bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la
bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai
mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo
Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2
Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn
cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă
(Tabelul 1)
Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR
Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la
neexpuşi
40
Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de
culegere a datelor
Odds ratio (OR)
Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin
raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general
studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)
Tabelul 2 Tabelul 2 x 2 pentru calcularea OR
Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală
Rate de mortalitate
Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp
specificată Există mai multe tipuri de rate de mortalitate
o Mortalitate specifică pe sex
o Mortalitate specifică pe rasă
o Mortalitate specifică pe boală
o Mortalitate neonatală
o Mortalitate postneonatală
o Mortalitate infantilă
o Mortalitate maternă
Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP
41
Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de
viaţă şi vacircrsta la care survine decesul dacă este prematur
Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu
Ani de viaţă pierduţi datorat dizabilităţii
Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt
utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru
cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite
grupuri
Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de
risc şi o boală se folosesc riscul relativ şi odds ratio
35 Analiza şi interpretarea datelor
După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date
trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul
Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor
colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului
studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu
plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde
prezenţa biostatisticianului este necesară
Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu
elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat
iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului
iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate
depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori
testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere
clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza
Interpretarea rezultatelor statistice
Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne
motive (număr mic de date) acceptarea ei să fie falsă
Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine
gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia
ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument
de decizie Intervalul de confidenţă
42
Interpretarea statistica ne interpretarea clinică
Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă
Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice
obţinute pe eşantionul studiat
Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare
Ce interpretăm Rezultatele
personale obţinute icircn urma studiului
care au fost prezentate icircn secţiunea bdquoRezultaterdquo
Explicăm rezultatele obţinute
Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale
Interpretarea trebuie să se realizeze icircn
lumina limitelor studiului
contextul cultural social şi educaţional al locului unde s-a realizat cercetarea
contextul a ceea ce se cunoaşte din literatura de specialitate
Interpretăm doar rezultatele personale obţinute icircn urma studiului
Interpretarea statistică nu este tot una cu interpretarea clinică
Interpretarea statistică este importantă
Interpretarea clinică este foarte importantă
Intervalul de confidenţă
Media calculată pe baza unui eşantion nu va echivala media populaţiei
Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului
Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a
populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a
populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)
pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru
orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare
dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de
confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de
date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de
5
Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel
Dacă valoarea p este mică
Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare
aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o
medie diferită Diferenţa este semnificativă dpdv statistic
43
Icircn continuare
Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa
reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică
pentru a fi interesante din punct de vedere ştiinţific
Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC
oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care
este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a
obţine o concluzie clară
Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o
diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că
datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din
punct de vedere ştiinţific
Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul
detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat
Erorile studiilor medicale
Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura
anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară
caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea
asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri
legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias
Erorile potenţiale icircn studiile epidemiologice
1 Erori icircntacircmplătoare
2 Erori sistematice
3 Confuzia
4 Validitatea
1 Erori icircntacircmplătoare
Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a
parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel
de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot
fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii
(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor
de măsură (eroarea de măsurare)
44
2 Erori sistematice
Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate
care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu
acurateţe mare Acurateţea nu este afectată de mărimea eşantionului
Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de
experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea
dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus
şi greu de cuantificat (consum de alcool personalitate etc)
Principalele tipuri de erori din această categorie sunt
bull Biasul de selecţie
bull Biasul de informaţie
Biasul de selecţie
Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul
trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion
inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale
persoanelor incluse
Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se
ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia
Biasul de informaţie
Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de
instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze
expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere
nesemnificativă sau chiar să nu şi-o amintească de loc
3 Confuzia
Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune
prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este
cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă
de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte
important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor
protector
4 Validitatea
Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă
Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte
estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional
Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă
45
conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se
demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)
Validitatea externă se poate realiza numai dacă studiul este valid intern
Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii
studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de
studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt
laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi
validă din punct de vedere intern)
3 6 Prezentarea rezultatelor
După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite
Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor
icircntr-o formă bdquodigerabilărdquo este necesară
Scopul prezentării datelor
1 Transmiterea concluziilor studiului
a Datele corecte şi importante merită comunicate
b Datele trebuie să confirme sau să infirme ipoteza studiului
c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală
2 Acordarea posibilităţii altor cercetători să aprecieze studiul
a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti
b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor
prezentate
Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru
fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie
statistică
Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de
valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras
(Tabel 3)
Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)
46
Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct
numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor
precum şi prezentarea acestora sub formă inteligibilă
Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care
convin cercetătorului
Prezentarea datelor se poate face
1 Figuri şi tabele icircn articole scrise
2 Figuri şi tabele icircn prezentări orale
3 Figuri şi tabele icircn postere
4 Text scris sau incluse icircn text
5 Site-uri de WEB
Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor
Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie
Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele
exprimacircnd exact ceea ce acestea exprimă
Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate
anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel
să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se
acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca
mai sus sugestive sunt formatele simple şi puţin icircncărcate
Dacă nu există reguli impuse se respectă
1 Mesaj simplu fără falsificarea datelor
2 De obicei este necesar atacirct tabelul cacirct şi graficul
3 Să fie simplu şi clar
Tabele
Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile
coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică
elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de
1 Se folosesc doar linii orizontale
2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn
evidenţi prin linie de separare (Tabelul 4)
Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland
Noua Zeelandă)
(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)
47
3 Numerele sunt aliniate icircn funcţie de virgulă
4 Indicii statistici sunt explicaţi sub tabel
5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană
6 Abrevierile pot fi folosite
7 Numărul de zecimale trebuie limitat la maxim două
8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel
9 Plasarea legendei este obligatorie sub tabel
10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)
Icircn cazul prezentărilor orale sau a posterelor este indicat ca
1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării
2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte
3 Folosirea de simboluri este permisă
Clasificarea tabelelor
Tabelele se clasifică după
i) conţinut
bull cu distribuţii de frecvenţe
bull de clase de frecvenţe
bull de contingenţă
ii) structura
bull cu doua coloane
bull cu subclasificări
bull ldquomasterrdquo
Tabele ce conţin distribuţii de frecvenţe
O modalitate comodă de a prezenta o mulţime de date brute este
1 Se ordonează datele in ordine crescătoare
2 Se determine frecvenţa fiecărei valori
3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane
(Tabelul 5)
Tabelul 5 Distribuţii de frecvenţă absolută
48
Tabelul claselor de frecvenţe
1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă
2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)
Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)
Tabele de contingenţă
1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a
tabelelor de contingenţă
2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a
combinaţiilor de perechi ordonate de valori
3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre
a factor de risc si
b starea sănătăţii
4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)
5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)
Tabelul 7 Tabel de contingenţă 2 x 2
49
Grafice
Există două categorii de moduri grafice sub care se pot prezenta datele
1 Ilustraţii şi fotografii
2 Grafice
1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă
pentru lucrare
2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit
Putem vorbi despre mai multe tipuri de grafice
bull Grafice pentru reprezentarea datelor cantitative
1048707 Grafic cartezian (X Y)
1048707 Histograma
1048707 Poligonul de frecvenţe
1048707 Diagrama bdquoscatterrdquo
bull Grafice pentru reprezentarea datelor calitative
1048707 Grafic cu bare
1048707 Diagrama tip bdquoboxplotrdquo
1048707 Diagrama bdquopierdquo
1048707 Cartograma
Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi
dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)
Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)
Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie
Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)
Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)
50
Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir
de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele
două variabile studiate (Figura 6)
Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2
(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2
rămacircne aproximativ constantă)
Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea
comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea
comparativă a mai multor variabile
Figura 7 Grafic calitativ cu bare
51
Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo
Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două
posibilităţi reprezentate grafic este mai frecventă (Figura 8)
Figura 8 Reprezentare tip bdquopierdquo
Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli
sau a oricărui element comparativ Se foloseşte de epidemiologi
Rezultate
Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare
Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o
manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu
explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția
bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la
ilustraţii tabele grafice
Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi
nici rezultatele care invalidează eventual ipoteza
Discuţii
Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd
cultura ştiinţifică şi inteligenţa autorilor
Acest capitol răspunde la trei obiective
Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia
calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de
selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează
rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv
52
este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn
care a fost abordată problema fără a face o revistă a literaturii
Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea
rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul
Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor
afirmaţii nesusţinute de conţinutul lucrării
Concluzii
Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate
să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie
Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de
concluzii va scădea valoarea lucrării
Bibliografia (lista referinţelor citarea icircn text)
Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn
lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente
Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli
- să conţină cele mai importante şi recente lucrări
- să includă numai lucrări publicate
- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate
Bibliografie
Elisabeta Jaba ndash Statistică Ed Economică 1998
Mihai Ţarcă ndash Statistică volI Ed UAIC 1979
Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale
Ed University Press 2009
Sorana Daniela Bolboacă ndash Metodologia cercetării curs
53
Nu există asociere icircntre obezitate şi bolile cardio-vasculare
Obezitatea şi bolile cardio-vasculare sunt independente
H1
Există asociere icircntre obezitate şi bolile cardio-vasculare
Obezitatea şi bolile cardio-vasculare sunt asociate
a = 005 pragul de semnificaţie al testului
urmează o lege cu (r-1)(c-1) grade de libertate
χ2 = parametrul testului χ2
fio = frecvenţa observată
fit = frecvenţa teoretică
Regiunea critică este [χα2 yen)
Pentru α = 005 χα2 = 384
OBSERVAT BCV+ BCV- Total
Obezitate + AP = 150 FP = 180 330
Obezitate - FN = 60 AN = 230 290
Total 210 410 620
TEORETIC BCV+ BCV- Total
Obezitate + = 330times210620 = 330times410620 330
Obezitate - = 290times210620 = 290times410620 290
Total 210 410 620
TEORETIC BCV+ BCV- Total
Obezitate + = 330times210620 = 330times410620 330
26
Obezitate - = 290times210620 = 290times410620 290
Total 210 410 620
TEORETIC BCV+ BCV-
Obezitate + = 112 = 218
Obezitate - = 98 = 192
Deoarece 4177Icirc[384 yen) se respinge H0 cu un risc de eroare de 5
Există asociere icircntre obezitate şi bolile cardio-vasculare
Testul Fisher
Corecţie a testului χ2
Valoarea p asociată parametrului ne dă probabilitatea ca valoarea observată de independenţă să fie
atribuită doar şansei
O valoare p mică indică că există alte cauze decacirct şansa influenţează rezultatul şi astfel cele două
variabile investigate nu sunt independente
Testul Fisher = dispersia corectată a factorului x dispersia corectată a factorilor reziduali
Icircn acest context regula adunării dispersiilor se poate scrie unde
este variaţia lui y pe seama variaţiei variabilei x
este variaţia lui y pe seama influenţei factorilor reziduali (neicircnregistraţi)
este variaţia totală a caracteristicii y
Testul Fisher empiric se calculează după formula
27
se compară cu Ftab pentru nx şi nz grade de libertate la un anumit prag de semnificaţie stabilit
Dacă Fc gt Ftab rezultă că variaţia factorului de grupare x este semnificativă pentru variaţia caracteristicii y
Testul z pentru proporţii
1 Compararea unei frecvenţe observate cu o frecvenţă teoretică
2 Testarea egalităţii a două frecvenţe
Testul z Compararea unei frecvenţe observate cu o frecvenţă teoretică
Scop Investigarea semnificaţiei diferenţei icircntre o frecvenţă teoretică p (icircntr-o populaţie) şi o frecvenţă
observată f pe un eşantion reprezentativ (variabilă calitativă (binare))
Condiţii de aplicare Testul este corect aplicat dacă numărul n al observaţiilor eşantionului este
suficient de mare (n∙p n∙(1-p)gt10
Parametrul
n = volumul eşantionului
Suntem interesaţi de investigarea prevalenţei hepatitei B la personalul care lucrează icircn laboratoarele
clinicilor de boli infecţioase din Transilvania Se ştie din studii anterioare că prevalenţa hepatitei B icircn
populaţia generală din Transilvania este de 9 S-a luat icircn studiu un eşantion de 100 persoane şi s-a
obţinut o prevalenţă a hepatitei B de 6 Există diferenţă semnificativă icircntre frecvenţa hepatitei B la
personalul care lucrează icircn laboratoarele spitalelor de boli infecţioase din Transilvania faţă de
populaţia generală
f = 006 p = 009 n = 100
Ipoteza nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat
faţă de frecvenţa hepatitei B icircn populaţia generală
Ipoteza alternativă test bilateral Există diferenţă semnificativă icircntre frecvenţa hepatitei B la
nivelul eşantionului şi prevalenţa hepatitei B icircn populaţia generală
f = 006 p = 009 n = 100
Pragul de semnificaţie a = 005
Regiunea critică test bilateral (-yen -196 ]Egrave[196 yen)
28
Concluzia testului
Deoarece parametrul statistic calculat al testului nu aparţine regiunii critice se acceptă ipoteza
nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat faţă de
frecvenţa hepatitei B icircn populaţia generală
Testul McNemar
Evaluarea dependenţei variabilelor calitative perechi (dorim să determinăm dacă o anumită
caracteristică este sau nu asociată cu o anumită patologie)
Identificăm n pacienţi care prezintă patologia de interes (eg Cancer bronho-pulmonar) şi n
pacienţi cu aceleaşi caracteristici ca şi primul grup dar care nu o prezintă
Martor = da Martor = nu
Caz = da a b
Caz = nu c d
Testul McNemar - exemplu fumat vs cancer
Martor = da Martor = nu
Cancer = da a = 2 b = 5
Cancer = nu c = 0 d = 3
29
χ2critic(α=005) = 384
32 lt 384 rarr acceptăm ipoteza nulă
Fumatul nu este icircn relaţie cu apariţia cancerului bronho-pulmonar
Inferenţa statistică pe date cantitative
Variabile cantitative continue
Testul z şi Student (t) (o medie sau medii perechi)
Testul z şi Student (t) (testarea a două medii)
ANOVA (ge 3 medii)
Ranguri (variabile cantitative discrete sau cantitative care nu icircndeplinesc condiţia de
normalitate)
Testul sumei rangurilor Wilcoxon
Kruskal-Wallis (ge 3 eşantioane independente)
Friedman (ge 3 eşantioane dependente)
Teste de normalitate variabile cantitative continue
Shapiro-Wilk
Kolmogorov-Smirnov
Shapiro-Wilk
Chi-Square Goodness-of-Fit
Dacă datele urmează o distribuţie normală aplicăm un test parametric
Dacă datele nu urmează o distribuţie normală aplicăm un test de comparare al rangurilor
30
Testul Z de comparare a mediei unui eşantion cu media unei populaţii
Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ
extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie
s2 care se cunoaşte
Condiţii de aplicare
1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru
compararea mediei unui eşantion cu media unei populaţii)
2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal
distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă
3 Talia eşantionului este mare ( ge 30)
Ipoteze
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media
eşantionului şi media populaţiei
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
(-yen -196 ] Egrave [196 yen)
Parametrul testului
n = volumul eşantionului
= media eşantionului
s = deviaţia standard a populaţiei
Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)
Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard
cunoscută
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi
media standard
Condiţii de aplicare
Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se
realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această
condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea
31
Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai
puternic
Numărul de grade de libertate (df) df = n-1
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
Parametrul testului
n = volumul eşantionului
micro0 = media standard
= media eşantionului
s = deviaţia standard a eşantionului
Testul ANOVA compararea mediilor a mai multe eşantioane
H0 = toate mediile sunt egale
H1 = nu toate mediile sunt egale
Condiţii de aplicare
1 Datele sunt independente unele faţă de celelalte
2 Datele fiecărui grup sunt normal distribuite
3 Deviaţia standard este aceeaşi pentru toate grupurile
Id Medicament
A B C D E F
1 5 6 7 10 5 9
2 6 8 8 11 8 8
3 7 7 9 13 6 7
4 8 9 11 12 4 5
32
5 9 10 10 9 7 6
Suma 35 40 45 55 30 35
Media 7 8 9 11 6 7
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =
= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)
Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2
F = (suma pătratelor(icircntre))(suma pătratelor(icircn))
Suma pătratelor (icircntre) = 16times5 = 80
Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60
Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn
interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare
SP df Media pătratelor F = MPicircntreMPicircn
Icircntre 80 5 = 805 = 16 = 1625 = 64
Icircn 60 24 = 6024 = 25
Total 140 29 -
Testul sumei rangurilor Wilcoxon
Aplicat pentru
Un set de observaţii provenite dintr-o valoare ipotetică comună
Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)
Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero
Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace
Suma rangurilor pentru diferenţele negative = 2+3+1 = 6
Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30
33
Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului
egal cu 8 = 0109
Icircnainte După Diferenţa Rang
64 66 -2 2
66 58 8 5
67 68 -1 3
71 65 6 4
72 75 -3 1
76 67 9 6
78 59 19 8
89 74 15 7
Testul Kruskal-Wallis (ge 3 eşantioane independente)
Test de ranguri aplicate pe mai mult de 3 eşantioane
H = parametrul testului
n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)
Tk = suma rangurilor
Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie
pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni
34
df = k-1 (k = numărul de eşantioane)
df = 3-1 = 2
Hcritic(α=005) = 599
H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie
pozitivă şi respectiv biopsie negativă
Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie
a tipului de studiu pe eşantioane perechi)
1 Definirea numărului de tratamente k
2 Obţinerea rangurilor pentru fiecare tratament
3 Sumarea rangurilor fiecărui tratament
4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)
5 Dacă Fr gt Frcritic rarr respingem H0
Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost
măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi
n = 9 k = 3 T12 = 225 T2
2 = 38025 T32 = 38025
Frcritic = 599
Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de
prostată
35
De reţinut
Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei
Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-
of-Fit
Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z
Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t
Compararea mediilor a 3 sau mai multe eşantioane ANOVA
Compararea mediilor a două populaţii (σ) testul Z
Compararea mediilor a două eşantioane (s) testul t
Compararea mediilor a două eşantioane perechi (s) testul t
ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi
cu cel pentru compararea a două eşantioane perechi
Ranguri
Distribuţia datelor nu are importanţă
Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)
Trei sau mai multe eşantioane Kruskal-Wallis
Trei sau mai multe eşantioane perechi Friedman
Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia
Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a
datelor)
Variabile nominale
Un singur eşantion sau eşantioane perechi
Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte
Eşantioane perechi testul Mc Nemar
Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2
Icircn analiza proporţiilor există teste diferite pentru
Compararea unei frecvenţe cu o frecvenţă cunoscută
Compararea a două frecvenţe
Semnificaţia statistică
Valoarea p (p value)
Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor
două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E
posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării
aleatorii
36
Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală
urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii
Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este
probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un
experiment de dimensiunea acestuia
Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că
diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii
diferite
Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca
fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă
ar fi fost adevărată
Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă
1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe
baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De
fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001
2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie
3 Se aplică testul statistic aferent pentru a calcula valoarea p
4 Se compară valoarea p cu valoarea ndash prag
5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe
semnificativă dpdv statisticrdquo
6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e
semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să
conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă
Teste de semnificaţie
Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului
populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)
Testarea ipotezelor implică posibile erori
Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile
sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui
grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul
icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005
ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există
37
nici o diferenţă
Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ
statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de
ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost
ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau
dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă
cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă
semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe
ipotetice variate icircn cazul icircn care ele există
Măsuri ale frecvenţei
Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)
Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate
Generic formula pe care se bazează toate cele trei este
unde x şi y sunt cantităţile de comparat
Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea
unei frecvenţe pe grupe de sex vacircrstă etc
Proporţia implică icircn mod necesar ca x să fie inclus icircn y
Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară
frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp
Pentru calcularea unei rate trebuie ţinut cont de trei aspecte
bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin
bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp
bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo
Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un
tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei
populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei
aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)
38
Indicatori
Rata de incidenţă
Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă
icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii
Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o
perioadă de timp
Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de
timp x
Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei
susceptibili de a dezvolta icircmbolnăvirea studiată
Numitorul poate fi
bull Numărul mediu al populaţiei icircn perioada de timp studiată
bull Mărimea populaţiei icircn mijlocul perioadei de studiu
bull Mărimea populaţiei la icircnceputul studiului
Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă
Este obligatorie menţionarea perioadei de timp
Prevalenţa
Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la
un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă
schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa
momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)
39
Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include
numai cazuri noi respectiv include cazuri noi şi vechi
Rata de atac
Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este
folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp
raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori
Rata persoană-timp
Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din
momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte
migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost
observate
Riscul relativ (RR)
Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment
legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele
prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două
grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la
bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la
bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai
mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo
Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2
Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn
cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă
(Tabelul 1)
Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR
Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la
neexpuşi
40
Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de
culegere a datelor
Odds ratio (OR)
Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin
raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general
studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)
Tabelul 2 Tabelul 2 x 2 pentru calcularea OR
Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală
Rate de mortalitate
Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp
specificată Există mai multe tipuri de rate de mortalitate
o Mortalitate specifică pe sex
o Mortalitate specifică pe rasă
o Mortalitate specifică pe boală
o Mortalitate neonatală
o Mortalitate postneonatală
o Mortalitate infantilă
o Mortalitate maternă
Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP
41
Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de
viaţă şi vacircrsta la care survine decesul dacă este prematur
Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu
Ani de viaţă pierduţi datorat dizabilităţii
Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt
utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru
cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite
grupuri
Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de
risc şi o boală se folosesc riscul relativ şi odds ratio
35 Analiza şi interpretarea datelor
După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date
trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul
Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor
colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului
studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu
plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde
prezenţa biostatisticianului este necesară
Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu
elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat
iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului
iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate
depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori
testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere
clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza
Interpretarea rezultatelor statistice
Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne
motive (număr mic de date) acceptarea ei să fie falsă
Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine
gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia
ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument
de decizie Intervalul de confidenţă
42
Interpretarea statistica ne interpretarea clinică
Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă
Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice
obţinute pe eşantionul studiat
Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare
Ce interpretăm Rezultatele
personale obţinute icircn urma studiului
care au fost prezentate icircn secţiunea bdquoRezultaterdquo
Explicăm rezultatele obţinute
Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale
Interpretarea trebuie să se realizeze icircn
lumina limitelor studiului
contextul cultural social şi educaţional al locului unde s-a realizat cercetarea
contextul a ceea ce se cunoaşte din literatura de specialitate
Interpretăm doar rezultatele personale obţinute icircn urma studiului
Interpretarea statistică nu este tot una cu interpretarea clinică
Interpretarea statistică este importantă
Interpretarea clinică este foarte importantă
Intervalul de confidenţă
Media calculată pe baza unui eşantion nu va echivala media populaţiei
Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului
Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a
populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a
populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)
pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru
orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare
dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de
confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de
date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de
5
Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel
Dacă valoarea p este mică
Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare
aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o
medie diferită Diferenţa este semnificativă dpdv statistic
43
Icircn continuare
Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa
reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică
pentru a fi interesante din punct de vedere ştiinţific
Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC
oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care
este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a
obţine o concluzie clară
Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o
diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că
datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din
punct de vedere ştiinţific
Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul
detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat
Erorile studiilor medicale
Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura
anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară
caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea
asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri
legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias
Erorile potenţiale icircn studiile epidemiologice
1 Erori icircntacircmplătoare
2 Erori sistematice
3 Confuzia
4 Validitatea
1 Erori icircntacircmplătoare
Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a
parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel
de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot
fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii
(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor
de măsură (eroarea de măsurare)
44
2 Erori sistematice
Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate
care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu
acurateţe mare Acurateţea nu este afectată de mărimea eşantionului
Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de
experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea
dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus
şi greu de cuantificat (consum de alcool personalitate etc)
Principalele tipuri de erori din această categorie sunt
bull Biasul de selecţie
bull Biasul de informaţie
Biasul de selecţie
Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul
trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion
inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale
persoanelor incluse
Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se
ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia
Biasul de informaţie
Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de
instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze
expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere
nesemnificativă sau chiar să nu şi-o amintească de loc
3 Confuzia
Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune
prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este
cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă
de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte
important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor
protector
4 Validitatea
Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă
Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte
estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional
Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă
45
conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se
demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)
Validitatea externă se poate realiza numai dacă studiul este valid intern
Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii
studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de
studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt
laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi
validă din punct de vedere intern)
3 6 Prezentarea rezultatelor
După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite
Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor
icircntr-o formă bdquodigerabilărdquo este necesară
Scopul prezentării datelor
1 Transmiterea concluziilor studiului
a Datele corecte şi importante merită comunicate
b Datele trebuie să confirme sau să infirme ipoteza studiului
c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală
2 Acordarea posibilităţii altor cercetători să aprecieze studiul
a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti
b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor
prezentate
Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru
fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie
statistică
Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de
valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras
(Tabel 3)
Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)
46
Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct
numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor
precum şi prezentarea acestora sub formă inteligibilă
Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care
convin cercetătorului
Prezentarea datelor se poate face
1 Figuri şi tabele icircn articole scrise
2 Figuri şi tabele icircn prezentări orale
3 Figuri şi tabele icircn postere
4 Text scris sau incluse icircn text
5 Site-uri de WEB
Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor
Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie
Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele
exprimacircnd exact ceea ce acestea exprimă
Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate
anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel
să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se
acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca
mai sus sugestive sunt formatele simple şi puţin icircncărcate
Dacă nu există reguli impuse se respectă
1 Mesaj simplu fără falsificarea datelor
2 De obicei este necesar atacirct tabelul cacirct şi graficul
3 Să fie simplu şi clar
Tabele
Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile
coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică
elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de
1 Se folosesc doar linii orizontale
2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn
evidenţi prin linie de separare (Tabelul 4)
Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland
Noua Zeelandă)
(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)
47
3 Numerele sunt aliniate icircn funcţie de virgulă
4 Indicii statistici sunt explicaţi sub tabel
5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană
6 Abrevierile pot fi folosite
7 Numărul de zecimale trebuie limitat la maxim două
8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel
9 Plasarea legendei este obligatorie sub tabel
10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)
Icircn cazul prezentărilor orale sau a posterelor este indicat ca
1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării
2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte
3 Folosirea de simboluri este permisă
Clasificarea tabelelor
Tabelele se clasifică după
i) conţinut
bull cu distribuţii de frecvenţe
bull de clase de frecvenţe
bull de contingenţă
ii) structura
bull cu doua coloane
bull cu subclasificări
bull ldquomasterrdquo
Tabele ce conţin distribuţii de frecvenţe
O modalitate comodă de a prezenta o mulţime de date brute este
1 Se ordonează datele in ordine crescătoare
2 Se determine frecvenţa fiecărei valori
3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane
(Tabelul 5)
Tabelul 5 Distribuţii de frecvenţă absolută
48
Tabelul claselor de frecvenţe
1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă
2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)
Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)
Tabele de contingenţă
1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a
tabelelor de contingenţă
2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a
combinaţiilor de perechi ordonate de valori
3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre
a factor de risc si
b starea sănătăţii
4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)
5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)
Tabelul 7 Tabel de contingenţă 2 x 2
49
Grafice
Există două categorii de moduri grafice sub care se pot prezenta datele
1 Ilustraţii şi fotografii
2 Grafice
1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă
pentru lucrare
2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit
Putem vorbi despre mai multe tipuri de grafice
bull Grafice pentru reprezentarea datelor cantitative
1048707 Grafic cartezian (X Y)
1048707 Histograma
1048707 Poligonul de frecvenţe
1048707 Diagrama bdquoscatterrdquo
bull Grafice pentru reprezentarea datelor calitative
1048707 Grafic cu bare
1048707 Diagrama tip bdquoboxplotrdquo
1048707 Diagrama bdquopierdquo
1048707 Cartograma
Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi
dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)
Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)
Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie
Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)
Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)
50
Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir
de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele
două variabile studiate (Figura 6)
Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2
(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2
rămacircne aproximativ constantă)
Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea
comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea
comparativă a mai multor variabile
Figura 7 Grafic calitativ cu bare
51
Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo
Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două
posibilităţi reprezentate grafic este mai frecventă (Figura 8)
Figura 8 Reprezentare tip bdquopierdquo
Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli
sau a oricărui element comparativ Se foloseşte de epidemiologi
Rezultate
Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare
Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o
manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu
explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția
bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la
ilustraţii tabele grafice
Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi
nici rezultatele care invalidează eventual ipoteza
Discuţii
Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd
cultura ştiinţifică şi inteligenţa autorilor
Acest capitol răspunde la trei obiective
Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia
calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de
selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează
rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv
52
este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn
care a fost abordată problema fără a face o revistă a literaturii
Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea
rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul
Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor
afirmaţii nesusţinute de conţinutul lucrării
Concluzii
Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate
să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie
Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de
concluzii va scădea valoarea lucrării
Bibliografia (lista referinţelor citarea icircn text)
Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn
lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente
Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli
- să conţină cele mai importante şi recente lucrări
- să includă numai lucrări publicate
- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate
Bibliografie
Elisabeta Jaba ndash Statistică Ed Economică 1998
Mihai Ţarcă ndash Statistică volI Ed UAIC 1979
Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale
Ed University Press 2009
Sorana Daniela Bolboacă ndash Metodologia cercetării curs
53
Obezitate - = 290times210620 = 290times410620 290
Total 210 410 620
TEORETIC BCV+ BCV-
Obezitate + = 112 = 218
Obezitate - = 98 = 192
Deoarece 4177Icirc[384 yen) se respinge H0 cu un risc de eroare de 5
Există asociere icircntre obezitate şi bolile cardio-vasculare
Testul Fisher
Corecţie a testului χ2
Valoarea p asociată parametrului ne dă probabilitatea ca valoarea observată de independenţă să fie
atribuită doar şansei
O valoare p mică indică că există alte cauze decacirct şansa influenţează rezultatul şi astfel cele două
variabile investigate nu sunt independente
Testul Fisher = dispersia corectată a factorului x dispersia corectată a factorilor reziduali
Icircn acest context regula adunării dispersiilor se poate scrie unde
este variaţia lui y pe seama variaţiei variabilei x
este variaţia lui y pe seama influenţei factorilor reziduali (neicircnregistraţi)
este variaţia totală a caracteristicii y
Testul Fisher empiric se calculează după formula
27
se compară cu Ftab pentru nx şi nz grade de libertate la un anumit prag de semnificaţie stabilit
Dacă Fc gt Ftab rezultă că variaţia factorului de grupare x este semnificativă pentru variaţia caracteristicii y
Testul z pentru proporţii
1 Compararea unei frecvenţe observate cu o frecvenţă teoretică
2 Testarea egalităţii a două frecvenţe
Testul z Compararea unei frecvenţe observate cu o frecvenţă teoretică
Scop Investigarea semnificaţiei diferenţei icircntre o frecvenţă teoretică p (icircntr-o populaţie) şi o frecvenţă
observată f pe un eşantion reprezentativ (variabilă calitativă (binare))
Condiţii de aplicare Testul este corect aplicat dacă numărul n al observaţiilor eşantionului este
suficient de mare (n∙p n∙(1-p)gt10
Parametrul
n = volumul eşantionului
Suntem interesaţi de investigarea prevalenţei hepatitei B la personalul care lucrează icircn laboratoarele
clinicilor de boli infecţioase din Transilvania Se ştie din studii anterioare că prevalenţa hepatitei B icircn
populaţia generală din Transilvania este de 9 S-a luat icircn studiu un eşantion de 100 persoane şi s-a
obţinut o prevalenţă a hepatitei B de 6 Există diferenţă semnificativă icircntre frecvenţa hepatitei B la
personalul care lucrează icircn laboratoarele spitalelor de boli infecţioase din Transilvania faţă de
populaţia generală
f = 006 p = 009 n = 100
Ipoteza nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat
faţă de frecvenţa hepatitei B icircn populaţia generală
Ipoteza alternativă test bilateral Există diferenţă semnificativă icircntre frecvenţa hepatitei B la
nivelul eşantionului şi prevalenţa hepatitei B icircn populaţia generală
f = 006 p = 009 n = 100
Pragul de semnificaţie a = 005
Regiunea critică test bilateral (-yen -196 ]Egrave[196 yen)
28
Concluzia testului
Deoarece parametrul statistic calculat al testului nu aparţine regiunii critice se acceptă ipoteza
nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat faţă de
frecvenţa hepatitei B icircn populaţia generală
Testul McNemar
Evaluarea dependenţei variabilelor calitative perechi (dorim să determinăm dacă o anumită
caracteristică este sau nu asociată cu o anumită patologie)
Identificăm n pacienţi care prezintă patologia de interes (eg Cancer bronho-pulmonar) şi n
pacienţi cu aceleaşi caracteristici ca şi primul grup dar care nu o prezintă
Martor = da Martor = nu
Caz = da a b
Caz = nu c d
Testul McNemar - exemplu fumat vs cancer
Martor = da Martor = nu
Cancer = da a = 2 b = 5
Cancer = nu c = 0 d = 3
29
χ2critic(α=005) = 384
32 lt 384 rarr acceptăm ipoteza nulă
Fumatul nu este icircn relaţie cu apariţia cancerului bronho-pulmonar
Inferenţa statistică pe date cantitative
Variabile cantitative continue
Testul z şi Student (t) (o medie sau medii perechi)
Testul z şi Student (t) (testarea a două medii)
ANOVA (ge 3 medii)
Ranguri (variabile cantitative discrete sau cantitative care nu icircndeplinesc condiţia de
normalitate)
Testul sumei rangurilor Wilcoxon
Kruskal-Wallis (ge 3 eşantioane independente)
Friedman (ge 3 eşantioane dependente)
Teste de normalitate variabile cantitative continue
Shapiro-Wilk
Kolmogorov-Smirnov
Shapiro-Wilk
Chi-Square Goodness-of-Fit
Dacă datele urmează o distribuţie normală aplicăm un test parametric
Dacă datele nu urmează o distribuţie normală aplicăm un test de comparare al rangurilor
30
Testul Z de comparare a mediei unui eşantion cu media unei populaţii
Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ
extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie
s2 care se cunoaşte
Condiţii de aplicare
1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru
compararea mediei unui eşantion cu media unei populaţii)
2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal
distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă
3 Talia eşantionului este mare ( ge 30)
Ipoteze
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media
eşantionului şi media populaţiei
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
(-yen -196 ] Egrave [196 yen)
Parametrul testului
n = volumul eşantionului
= media eşantionului
s = deviaţia standard a populaţiei
Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)
Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard
cunoscută
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi
media standard
Condiţii de aplicare
Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se
realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această
condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea
31
Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai
puternic
Numărul de grade de libertate (df) df = n-1
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
Parametrul testului
n = volumul eşantionului
micro0 = media standard
= media eşantionului
s = deviaţia standard a eşantionului
Testul ANOVA compararea mediilor a mai multe eşantioane
H0 = toate mediile sunt egale
H1 = nu toate mediile sunt egale
Condiţii de aplicare
1 Datele sunt independente unele faţă de celelalte
2 Datele fiecărui grup sunt normal distribuite
3 Deviaţia standard este aceeaşi pentru toate grupurile
Id Medicament
A B C D E F
1 5 6 7 10 5 9
2 6 8 8 11 8 8
3 7 7 9 13 6 7
4 8 9 11 12 4 5
32
5 9 10 10 9 7 6
Suma 35 40 45 55 30 35
Media 7 8 9 11 6 7
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =
= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)
Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2
F = (suma pătratelor(icircntre))(suma pătratelor(icircn))
Suma pătratelor (icircntre) = 16times5 = 80
Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60
Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn
interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare
SP df Media pătratelor F = MPicircntreMPicircn
Icircntre 80 5 = 805 = 16 = 1625 = 64
Icircn 60 24 = 6024 = 25
Total 140 29 -
Testul sumei rangurilor Wilcoxon
Aplicat pentru
Un set de observaţii provenite dintr-o valoare ipotetică comună
Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)
Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero
Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace
Suma rangurilor pentru diferenţele negative = 2+3+1 = 6
Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30
33
Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului
egal cu 8 = 0109
Icircnainte După Diferenţa Rang
64 66 -2 2
66 58 8 5
67 68 -1 3
71 65 6 4
72 75 -3 1
76 67 9 6
78 59 19 8
89 74 15 7
Testul Kruskal-Wallis (ge 3 eşantioane independente)
Test de ranguri aplicate pe mai mult de 3 eşantioane
H = parametrul testului
n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)
Tk = suma rangurilor
Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie
pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni
34
df = k-1 (k = numărul de eşantioane)
df = 3-1 = 2
Hcritic(α=005) = 599
H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie
pozitivă şi respectiv biopsie negativă
Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie
a tipului de studiu pe eşantioane perechi)
1 Definirea numărului de tratamente k
2 Obţinerea rangurilor pentru fiecare tratament
3 Sumarea rangurilor fiecărui tratament
4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)
5 Dacă Fr gt Frcritic rarr respingem H0
Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost
măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi
n = 9 k = 3 T12 = 225 T2
2 = 38025 T32 = 38025
Frcritic = 599
Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de
prostată
35
De reţinut
Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei
Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-
of-Fit
Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z
Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t
Compararea mediilor a 3 sau mai multe eşantioane ANOVA
Compararea mediilor a două populaţii (σ) testul Z
Compararea mediilor a două eşantioane (s) testul t
Compararea mediilor a două eşantioane perechi (s) testul t
ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi
cu cel pentru compararea a două eşantioane perechi
Ranguri
Distribuţia datelor nu are importanţă
Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)
Trei sau mai multe eşantioane Kruskal-Wallis
Trei sau mai multe eşantioane perechi Friedman
Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia
Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a
datelor)
Variabile nominale
Un singur eşantion sau eşantioane perechi
Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte
Eşantioane perechi testul Mc Nemar
Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2
Icircn analiza proporţiilor există teste diferite pentru
Compararea unei frecvenţe cu o frecvenţă cunoscută
Compararea a două frecvenţe
Semnificaţia statistică
Valoarea p (p value)
Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor
două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E
posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării
aleatorii
36
Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală
urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii
Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este
probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un
experiment de dimensiunea acestuia
Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că
diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii
diferite
Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca
fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă
ar fi fost adevărată
Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă
1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe
baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De
fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001
2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie
3 Se aplică testul statistic aferent pentru a calcula valoarea p
4 Se compară valoarea p cu valoarea ndash prag
5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe
semnificativă dpdv statisticrdquo
6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e
semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să
conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă
Teste de semnificaţie
Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului
populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)
Testarea ipotezelor implică posibile erori
Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile
sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui
grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul
icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005
ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există
37
nici o diferenţă
Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ
statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de
ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost
ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau
dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă
cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă
semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe
ipotetice variate icircn cazul icircn care ele există
Măsuri ale frecvenţei
Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)
Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate
Generic formula pe care se bazează toate cele trei este
unde x şi y sunt cantităţile de comparat
Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea
unei frecvenţe pe grupe de sex vacircrstă etc
Proporţia implică icircn mod necesar ca x să fie inclus icircn y
Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară
frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp
Pentru calcularea unei rate trebuie ţinut cont de trei aspecte
bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin
bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp
bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo
Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un
tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei
populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei
aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)
38
Indicatori
Rata de incidenţă
Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă
icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii
Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o
perioadă de timp
Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de
timp x
Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei
susceptibili de a dezvolta icircmbolnăvirea studiată
Numitorul poate fi
bull Numărul mediu al populaţiei icircn perioada de timp studiată
bull Mărimea populaţiei icircn mijlocul perioadei de studiu
bull Mărimea populaţiei la icircnceputul studiului
Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă
Este obligatorie menţionarea perioadei de timp
Prevalenţa
Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la
un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă
schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa
momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)
39
Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include
numai cazuri noi respectiv include cazuri noi şi vechi
Rata de atac
Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este
folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp
raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori
Rata persoană-timp
Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din
momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte
migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost
observate
Riscul relativ (RR)
Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment
legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele
prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două
grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la
bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la
bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai
mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo
Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2
Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn
cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă
(Tabelul 1)
Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR
Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la
neexpuşi
40
Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de
culegere a datelor
Odds ratio (OR)
Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin
raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general
studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)
Tabelul 2 Tabelul 2 x 2 pentru calcularea OR
Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală
Rate de mortalitate
Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp
specificată Există mai multe tipuri de rate de mortalitate
o Mortalitate specifică pe sex
o Mortalitate specifică pe rasă
o Mortalitate specifică pe boală
o Mortalitate neonatală
o Mortalitate postneonatală
o Mortalitate infantilă
o Mortalitate maternă
Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP
41
Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de
viaţă şi vacircrsta la care survine decesul dacă este prematur
Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu
Ani de viaţă pierduţi datorat dizabilităţii
Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt
utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru
cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite
grupuri
Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de
risc şi o boală se folosesc riscul relativ şi odds ratio
35 Analiza şi interpretarea datelor
După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date
trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul
Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor
colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului
studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu
plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde
prezenţa biostatisticianului este necesară
Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu
elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat
iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului
iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate
depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori
testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere
clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza
Interpretarea rezultatelor statistice
Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne
motive (număr mic de date) acceptarea ei să fie falsă
Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine
gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia
ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument
de decizie Intervalul de confidenţă
42
Interpretarea statistica ne interpretarea clinică
Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă
Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice
obţinute pe eşantionul studiat
Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare
Ce interpretăm Rezultatele
personale obţinute icircn urma studiului
care au fost prezentate icircn secţiunea bdquoRezultaterdquo
Explicăm rezultatele obţinute
Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale
Interpretarea trebuie să se realizeze icircn
lumina limitelor studiului
contextul cultural social şi educaţional al locului unde s-a realizat cercetarea
contextul a ceea ce se cunoaşte din literatura de specialitate
Interpretăm doar rezultatele personale obţinute icircn urma studiului
Interpretarea statistică nu este tot una cu interpretarea clinică
Interpretarea statistică este importantă
Interpretarea clinică este foarte importantă
Intervalul de confidenţă
Media calculată pe baza unui eşantion nu va echivala media populaţiei
Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului
Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a
populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a
populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)
pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru
orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare
dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de
confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de
date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de
5
Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel
Dacă valoarea p este mică
Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare
aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o
medie diferită Diferenţa este semnificativă dpdv statistic
43
Icircn continuare
Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa
reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică
pentru a fi interesante din punct de vedere ştiinţific
Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC
oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care
este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a
obţine o concluzie clară
Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o
diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că
datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din
punct de vedere ştiinţific
Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul
detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat
Erorile studiilor medicale
Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura
anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară
caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea
asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri
legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias
Erorile potenţiale icircn studiile epidemiologice
1 Erori icircntacircmplătoare
2 Erori sistematice
3 Confuzia
4 Validitatea
1 Erori icircntacircmplătoare
Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a
parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel
de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot
fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii
(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor
de măsură (eroarea de măsurare)
44
2 Erori sistematice
Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate
care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu
acurateţe mare Acurateţea nu este afectată de mărimea eşantionului
Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de
experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea
dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus
şi greu de cuantificat (consum de alcool personalitate etc)
Principalele tipuri de erori din această categorie sunt
bull Biasul de selecţie
bull Biasul de informaţie
Biasul de selecţie
Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul
trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion
inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale
persoanelor incluse
Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se
ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia
Biasul de informaţie
Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de
instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze
expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere
nesemnificativă sau chiar să nu şi-o amintească de loc
3 Confuzia
Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune
prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este
cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă
de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte
important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor
protector
4 Validitatea
Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă
Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte
estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional
Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă
45
conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se
demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)
Validitatea externă se poate realiza numai dacă studiul este valid intern
Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii
studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de
studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt
laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi
validă din punct de vedere intern)
3 6 Prezentarea rezultatelor
După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite
Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor
icircntr-o formă bdquodigerabilărdquo este necesară
Scopul prezentării datelor
1 Transmiterea concluziilor studiului
a Datele corecte şi importante merită comunicate
b Datele trebuie să confirme sau să infirme ipoteza studiului
c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală
2 Acordarea posibilităţii altor cercetători să aprecieze studiul
a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti
b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor
prezentate
Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru
fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie
statistică
Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de
valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras
(Tabel 3)
Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)
46
Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct
numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor
precum şi prezentarea acestora sub formă inteligibilă
Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care
convin cercetătorului
Prezentarea datelor se poate face
1 Figuri şi tabele icircn articole scrise
2 Figuri şi tabele icircn prezentări orale
3 Figuri şi tabele icircn postere
4 Text scris sau incluse icircn text
5 Site-uri de WEB
Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor
Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie
Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele
exprimacircnd exact ceea ce acestea exprimă
Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate
anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel
să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se
acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca
mai sus sugestive sunt formatele simple şi puţin icircncărcate
Dacă nu există reguli impuse se respectă
1 Mesaj simplu fără falsificarea datelor
2 De obicei este necesar atacirct tabelul cacirct şi graficul
3 Să fie simplu şi clar
Tabele
Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile
coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică
elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de
1 Se folosesc doar linii orizontale
2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn
evidenţi prin linie de separare (Tabelul 4)
Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland
Noua Zeelandă)
(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)
47
3 Numerele sunt aliniate icircn funcţie de virgulă
4 Indicii statistici sunt explicaţi sub tabel
5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană
6 Abrevierile pot fi folosite
7 Numărul de zecimale trebuie limitat la maxim două
8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel
9 Plasarea legendei este obligatorie sub tabel
10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)
Icircn cazul prezentărilor orale sau a posterelor este indicat ca
1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării
2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte
3 Folosirea de simboluri este permisă
Clasificarea tabelelor
Tabelele se clasifică după
i) conţinut
bull cu distribuţii de frecvenţe
bull de clase de frecvenţe
bull de contingenţă
ii) structura
bull cu doua coloane
bull cu subclasificări
bull ldquomasterrdquo
Tabele ce conţin distribuţii de frecvenţe
O modalitate comodă de a prezenta o mulţime de date brute este
1 Se ordonează datele in ordine crescătoare
2 Se determine frecvenţa fiecărei valori
3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane
(Tabelul 5)
Tabelul 5 Distribuţii de frecvenţă absolută
48
Tabelul claselor de frecvenţe
1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă
2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)
Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)
Tabele de contingenţă
1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a
tabelelor de contingenţă
2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a
combinaţiilor de perechi ordonate de valori
3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre
a factor de risc si
b starea sănătăţii
4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)
5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)
Tabelul 7 Tabel de contingenţă 2 x 2
49
Grafice
Există două categorii de moduri grafice sub care se pot prezenta datele
1 Ilustraţii şi fotografii
2 Grafice
1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă
pentru lucrare
2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit
Putem vorbi despre mai multe tipuri de grafice
bull Grafice pentru reprezentarea datelor cantitative
1048707 Grafic cartezian (X Y)
1048707 Histograma
1048707 Poligonul de frecvenţe
1048707 Diagrama bdquoscatterrdquo
bull Grafice pentru reprezentarea datelor calitative
1048707 Grafic cu bare
1048707 Diagrama tip bdquoboxplotrdquo
1048707 Diagrama bdquopierdquo
1048707 Cartograma
Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi
dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)
Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)
Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie
Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)
Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)
50
Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir
de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele
două variabile studiate (Figura 6)
Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2
(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2
rămacircne aproximativ constantă)
Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea
comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea
comparativă a mai multor variabile
Figura 7 Grafic calitativ cu bare
51
Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo
Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două
posibilităţi reprezentate grafic este mai frecventă (Figura 8)
Figura 8 Reprezentare tip bdquopierdquo
Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli
sau a oricărui element comparativ Se foloseşte de epidemiologi
Rezultate
Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare
Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o
manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu
explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția
bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la
ilustraţii tabele grafice
Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi
nici rezultatele care invalidează eventual ipoteza
Discuţii
Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd
cultura ştiinţifică şi inteligenţa autorilor
Acest capitol răspunde la trei obiective
Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia
calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de
selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează
rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv
52
este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn
care a fost abordată problema fără a face o revistă a literaturii
Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea
rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul
Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor
afirmaţii nesusţinute de conţinutul lucrării
Concluzii
Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate
să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie
Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de
concluzii va scădea valoarea lucrării
Bibliografia (lista referinţelor citarea icircn text)
Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn
lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente
Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli
- să conţină cele mai importante şi recente lucrări
- să includă numai lucrări publicate
- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate
Bibliografie
Elisabeta Jaba ndash Statistică Ed Economică 1998
Mihai Ţarcă ndash Statistică volI Ed UAIC 1979
Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale
Ed University Press 2009
Sorana Daniela Bolboacă ndash Metodologia cercetării curs
53
se compară cu Ftab pentru nx şi nz grade de libertate la un anumit prag de semnificaţie stabilit
Dacă Fc gt Ftab rezultă că variaţia factorului de grupare x este semnificativă pentru variaţia caracteristicii y
Testul z pentru proporţii
1 Compararea unei frecvenţe observate cu o frecvenţă teoretică
2 Testarea egalităţii a două frecvenţe
Testul z Compararea unei frecvenţe observate cu o frecvenţă teoretică
Scop Investigarea semnificaţiei diferenţei icircntre o frecvenţă teoretică p (icircntr-o populaţie) şi o frecvenţă
observată f pe un eşantion reprezentativ (variabilă calitativă (binare))
Condiţii de aplicare Testul este corect aplicat dacă numărul n al observaţiilor eşantionului este
suficient de mare (n∙p n∙(1-p)gt10
Parametrul
n = volumul eşantionului
Suntem interesaţi de investigarea prevalenţei hepatitei B la personalul care lucrează icircn laboratoarele
clinicilor de boli infecţioase din Transilvania Se ştie din studii anterioare că prevalenţa hepatitei B icircn
populaţia generală din Transilvania este de 9 S-a luat icircn studiu un eşantion de 100 persoane şi s-a
obţinut o prevalenţă a hepatitei B de 6 Există diferenţă semnificativă icircntre frecvenţa hepatitei B la
personalul care lucrează icircn laboratoarele spitalelor de boli infecţioase din Transilvania faţă de
populaţia generală
f = 006 p = 009 n = 100
Ipoteza nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat
faţă de frecvenţa hepatitei B icircn populaţia generală
Ipoteza alternativă test bilateral Există diferenţă semnificativă icircntre frecvenţa hepatitei B la
nivelul eşantionului şi prevalenţa hepatitei B icircn populaţia generală
f = 006 p = 009 n = 100
Pragul de semnificaţie a = 005
Regiunea critică test bilateral (-yen -196 ]Egrave[196 yen)
28
Concluzia testului
Deoarece parametrul statistic calculat al testului nu aparţine regiunii critice se acceptă ipoteza
nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat faţă de
frecvenţa hepatitei B icircn populaţia generală
Testul McNemar
Evaluarea dependenţei variabilelor calitative perechi (dorim să determinăm dacă o anumită
caracteristică este sau nu asociată cu o anumită patologie)
Identificăm n pacienţi care prezintă patologia de interes (eg Cancer bronho-pulmonar) şi n
pacienţi cu aceleaşi caracteristici ca şi primul grup dar care nu o prezintă
Martor = da Martor = nu
Caz = da a b
Caz = nu c d
Testul McNemar - exemplu fumat vs cancer
Martor = da Martor = nu
Cancer = da a = 2 b = 5
Cancer = nu c = 0 d = 3
29
χ2critic(α=005) = 384
32 lt 384 rarr acceptăm ipoteza nulă
Fumatul nu este icircn relaţie cu apariţia cancerului bronho-pulmonar
Inferenţa statistică pe date cantitative
Variabile cantitative continue
Testul z şi Student (t) (o medie sau medii perechi)
Testul z şi Student (t) (testarea a două medii)
ANOVA (ge 3 medii)
Ranguri (variabile cantitative discrete sau cantitative care nu icircndeplinesc condiţia de
normalitate)
Testul sumei rangurilor Wilcoxon
Kruskal-Wallis (ge 3 eşantioane independente)
Friedman (ge 3 eşantioane dependente)
Teste de normalitate variabile cantitative continue
Shapiro-Wilk
Kolmogorov-Smirnov
Shapiro-Wilk
Chi-Square Goodness-of-Fit
Dacă datele urmează o distribuţie normală aplicăm un test parametric
Dacă datele nu urmează o distribuţie normală aplicăm un test de comparare al rangurilor
30
Testul Z de comparare a mediei unui eşantion cu media unei populaţii
Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ
extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie
s2 care se cunoaşte
Condiţii de aplicare
1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru
compararea mediei unui eşantion cu media unei populaţii)
2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal
distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă
3 Talia eşantionului este mare ( ge 30)
Ipoteze
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media
eşantionului şi media populaţiei
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
(-yen -196 ] Egrave [196 yen)
Parametrul testului
n = volumul eşantionului
= media eşantionului
s = deviaţia standard a populaţiei
Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)
Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard
cunoscută
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi
media standard
Condiţii de aplicare
Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se
realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această
condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea
31
Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai
puternic
Numărul de grade de libertate (df) df = n-1
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
Parametrul testului
n = volumul eşantionului
micro0 = media standard
= media eşantionului
s = deviaţia standard a eşantionului
Testul ANOVA compararea mediilor a mai multe eşantioane
H0 = toate mediile sunt egale
H1 = nu toate mediile sunt egale
Condiţii de aplicare
1 Datele sunt independente unele faţă de celelalte
2 Datele fiecărui grup sunt normal distribuite
3 Deviaţia standard este aceeaşi pentru toate grupurile
Id Medicament
A B C D E F
1 5 6 7 10 5 9
2 6 8 8 11 8 8
3 7 7 9 13 6 7
4 8 9 11 12 4 5
32
5 9 10 10 9 7 6
Suma 35 40 45 55 30 35
Media 7 8 9 11 6 7
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =
= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)
Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2
F = (suma pătratelor(icircntre))(suma pătratelor(icircn))
Suma pătratelor (icircntre) = 16times5 = 80
Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60
Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn
interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare
SP df Media pătratelor F = MPicircntreMPicircn
Icircntre 80 5 = 805 = 16 = 1625 = 64
Icircn 60 24 = 6024 = 25
Total 140 29 -
Testul sumei rangurilor Wilcoxon
Aplicat pentru
Un set de observaţii provenite dintr-o valoare ipotetică comună
Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)
Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero
Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace
Suma rangurilor pentru diferenţele negative = 2+3+1 = 6
Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30
33
Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului
egal cu 8 = 0109
Icircnainte După Diferenţa Rang
64 66 -2 2
66 58 8 5
67 68 -1 3
71 65 6 4
72 75 -3 1
76 67 9 6
78 59 19 8
89 74 15 7
Testul Kruskal-Wallis (ge 3 eşantioane independente)
Test de ranguri aplicate pe mai mult de 3 eşantioane
H = parametrul testului
n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)
Tk = suma rangurilor
Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie
pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni
34
df = k-1 (k = numărul de eşantioane)
df = 3-1 = 2
Hcritic(α=005) = 599
H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie
pozitivă şi respectiv biopsie negativă
Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie
a tipului de studiu pe eşantioane perechi)
1 Definirea numărului de tratamente k
2 Obţinerea rangurilor pentru fiecare tratament
3 Sumarea rangurilor fiecărui tratament
4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)
5 Dacă Fr gt Frcritic rarr respingem H0
Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost
măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi
n = 9 k = 3 T12 = 225 T2
2 = 38025 T32 = 38025
Frcritic = 599
Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de
prostată
35
De reţinut
Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei
Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-
of-Fit
Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z
Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t
Compararea mediilor a 3 sau mai multe eşantioane ANOVA
Compararea mediilor a două populaţii (σ) testul Z
Compararea mediilor a două eşantioane (s) testul t
Compararea mediilor a două eşantioane perechi (s) testul t
ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi
cu cel pentru compararea a două eşantioane perechi
Ranguri
Distribuţia datelor nu are importanţă
Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)
Trei sau mai multe eşantioane Kruskal-Wallis
Trei sau mai multe eşantioane perechi Friedman
Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia
Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a
datelor)
Variabile nominale
Un singur eşantion sau eşantioane perechi
Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte
Eşantioane perechi testul Mc Nemar
Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2
Icircn analiza proporţiilor există teste diferite pentru
Compararea unei frecvenţe cu o frecvenţă cunoscută
Compararea a două frecvenţe
Semnificaţia statistică
Valoarea p (p value)
Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor
două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E
posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării
aleatorii
36
Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală
urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii
Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este
probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un
experiment de dimensiunea acestuia
Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că
diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii
diferite
Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca
fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă
ar fi fost adevărată
Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă
1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe
baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De
fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001
2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie
3 Se aplică testul statistic aferent pentru a calcula valoarea p
4 Se compară valoarea p cu valoarea ndash prag
5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe
semnificativă dpdv statisticrdquo
6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e
semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să
conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă
Teste de semnificaţie
Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului
populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)
Testarea ipotezelor implică posibile erori
Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile
sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui
grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul
icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005
ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există
37
nici o diferenţă
Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ
statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de
ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost
ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau
dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă
cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă
semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe
ipotetice variate icircn cazul icircn care ele există
Măsuri ale frecvenţei
Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)
Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate
Generic formula pe care se bazează toate cele trei este
unde x şi y sunt cantităţile de comparat
Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea
unei frecvenţe pe grupe de sex vacircrstă etc
Proporţia implică icircn mod necesar ca x să fie inclus icircn y
Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară
frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp
Pentru calcularea unei rate trebuie ţinut cont de trei aspecte
bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin
bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp
bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo
Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un
tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei
populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei
aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)
38
Indicatori
Rata de incidenţă
Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă
icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii
Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o
perioadă de timp
Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de
timp x
Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei
susceptibili de a dezvolta icircmbolnăvirea studiată
Numitorul poate fi
bull Numărul mediu al populaţiei icircn perioada de timp studiată
bull Mărimea populaţiei icircn mijlocul perioadei de studiu
bull Mărimea populaţiei la icircnceputul studiului
Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă
Este obligatorie menţionarea perioadei de timp
Prevalenţa
Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la
un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă
schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa
momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)
39
Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include
numai cazuri noi respectiv include cazuri noi şi vechi
Rata de atac
Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este
folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp
raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori
Rata persoană-timp
Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din
momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte
migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost
observate
Riscul relativ (RR)
Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment
legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele
prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două
grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la
bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la
bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai
mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo
Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2
Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn
cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă
(Tabelul 1)
Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR
Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la
neexpuşi
40
Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de
culegere a datelor
Odds ratio (OR)
Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin
raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general
studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)
Tabelul 2 Tabelul 2 x 2 pentru calcularea OR
Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală
Rate de mortalitate
Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp
specificată Există mai multe tipuri de rate de mortalitate
o Mortalitate specifică pe sex
o Mortalitate specifică pe rasă
o Mortalitate specifică pe boală
o Mortalitate neonatală
o Mortalitate postneonatală
o Mortalitate infantilă
o Mortalitate maternă
Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP
41
Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de
viaţă şi vacircrsta la care survine decesul dacă este prematur
Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu
Ani de viaţă pierduţi datorat dizabilităţii
Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt
utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru
cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite
grupuri
Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de
risc şi o boală se folosesc riscul relativ şi odds ratio
35 Analiza şi interpretarea datelor
După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date
trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul
Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor
colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului
studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu
plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde
prezenţa biostatisticianului este necesară
Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu
elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat
iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului
iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate
depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori
testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere
clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza
Interpretarea rezultatelor statistice
Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne
motive (număr mic de date) acceptarea ei să fie falsă
Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine
gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia
ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument
de decizie Intervalul de confidenţă
42
Interpretarea statistica ne interpretarea clinică
Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă
Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice
obţinute pe eşantionul studiat
Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare
Ce interpretăm Rezultatele
personale obţinute icircn urma studiului
care au fost prezentate icircn secţiunea bdquoRezultaterdquo
Explicăm rezultatele obţinute
Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale
Interpretarea trebuie să se realizeze icircn
lumina limitelor studiului
contextul cultural social şi educaţional al locului unde s-a realizat cercetarea
contextul a ceea ce se cunoaşte din literatura de specialitate
Interpretăm doar rezultatele personale obţinute icircn urma studiului
Interpretarea statistică nu este tot una cu interpretarea clinică
Interpretarea statistică este importantă
Interpretarea clinică este foarte importantă
Intervalul de confidenţă
Media calculată pe baza unui eşantion nu va echivala media populaţiei
Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului
Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a
populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a
populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)
pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru
orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare
dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de
confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de
date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de
5
Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel
Dacă valoarea p este mică
Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare
aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o
medie diferită Diferenţa este semnificativă dpdv statistic
43
Icircn continuare
Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa
reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică
pentru a fi interesante din punct de vedere ştiinţific
Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC
oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care
este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a
obţine o concluzie clară
Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o
diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că
datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din
punct de vedere ştiinţific
Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul
detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat
Erorile studiilor medicale
Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura
anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară
caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea
asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri
legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias
Erorile potenţiale icircn studiile epidemiologice
1 Erori icircntacircmplătoare
2 Erori sistematice
3 Confuzia
4 Validitatea
1 Erori icircntacircmplătoare
Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a
parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel
de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot
fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii
(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor
de măsură (eroarea de măsurare)
44
2 Erori sistematice
Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate
care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu
acurateţe mare Acurateţea nu este afectată de mărimea eşantionului
Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de
experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea
dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus
şi greu de cuantificat (consum de alcool personalitate etc)
Principalele tipuri de erori din această categorie sunt
bull Biasul de selecţie
bull Biasul de informaţie
Biasul de selecţie
Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul
trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion
inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale
persoanelor incluse
Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se
ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia
Biasul de informaţie
Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de
instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze
expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere
nesemnificativă sau chiar să nu şi-o amintească de loc
3 Confuzia
Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune
prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este
cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă
de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte
important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor
protector
4 Validitatea
Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă
Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte
estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional
Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă
45
conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se
demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)
Validitatea externă se poate realiza numai dacă studiul este valid intern
Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii
studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de
studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt
laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi
validă din punct de vedere intern)
3 6 Prezentarea rezultatelor
După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite
Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor
icircntr-o formă bdquodigerabilărdquo este necesară
Scopul prezentării datelor
1 Transmiterea concluziilor studiului
a Datele corecte şi importante merită comunicate
b Datele trebuie să confirme sau să infirme ipoteza studiului
c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală
2 Acordarea posibilităţii altor cercetători să aprecieze studiul
a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti
b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor
prezentate
Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru
fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie
statistică
Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de
valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras
(Tabel 3)
Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)
46
Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct
numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor
precum şi prezentarea acestora sub formă inteligibilă
Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care
convin cercetătorului
Prezentarea datelor se poate face
1 Figuri şi tabele icircn articole scrise
2 Figuri şi tabele icircn prezentări orale
3 Figuri şi tabele icircn postere
4 Text scris sau incluse icircn text
5 Site-uri de WEB
Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor
Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie
Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele
exprimacircnd exact ceea ce acestea exprimă
Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate
anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel
să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se
acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca
mai sus sugestive sunt formatele simple şi puţin icircncărcate
Dacă nu există reguli impuse se respectă
1 Mesaj simplu fără falsificarea datelor
2 De obicei este necesar atacirct tabelul cacirct şi graficul
3 Să fie simplu şi clar
Tabele
Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile
coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică
elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de
1 Se folosesc doar linii orizontale
2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn
evidenţi prin linie de separare (Tabelul 4)
Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland
Noua Zeelandă)
(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)
47
3 Numerele sunt aliniate icircn funcţie de virgulă
4 Indicii statistici sunt explicaţi sub tabel
5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană
6 Abrevierile pot fi folosite
7 Numărul de zecimale trebuie limitat la maxim două
8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel
9 Plasarea legendei este obligatorie sub tabel
10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)
Icircn cazul prezentărilor orale sau a posterelor este indicat ca
1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării
2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte
3 Folosirea de simboluri este permisă
Clasificarea tabelelor
Tabelele se clasifică după
i) conţinut
bull cu distribuţii de frecvenţe
bull de clase de frecvenţe
bull de contingenţă
ii) structura
bull cu doua coloane
bull cu subclasificări
bull ldquomasterrdquo
Tabele ce conţin distribuţii de frecvenţe
O modalitate comodă de a prezenta o mulţime de date brute este
1 Se ordonează datele in ordine crescătoare
2 Se determine frecvenţa fiecărei valori
3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane
(Tabelul 5)
Tabelul 5 Distribuţii de frecvenţă absolută
48
Tabelul claselor de frecvenţe
1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă
2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)
Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)
Tabele de contingenţă
1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a
tabelelor de contingenţă
2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a
combinaţiilor de perechi ordonate de valori
3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre
a factor de risc si
b starea sănătăţii
4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)
5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)
Tabelul 7 Tabel de contingenţă 2 x 2
49
Grafice
Există două categorii de moduri grafice sub care se pot prezenta datele
1 Ilustraţii şi fotografii
2 Grafice
1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă
pentru lucrare
2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit
Putem vorbi despre mai multe tipuri de grafice
bull Grafice pentru reprezentarea datelor cantitative
1048707 Grafic cartezian (X Y)
1048707 Histograma
1048707 Poligonul de frecvenţe
1048707 Diagrama bdquoscatterrdquo
bull Grafice pentru reprezentarea datelor calitative
1048707 Grafic cu bare
1048707 Diagrama tip bdquoboxplotrdquo
1048707 Diagrama bdquopierdquo
1048707 Cartograma
Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi
dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)
Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)
Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie
Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)
Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)
50
Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir
de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele
două variabile studiate (Figura 6)
Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2
(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2
rămacircne aproximativ constantă)
Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea
comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea
comparativă a mai multor variabile
Figura 7 Grafic calitativ cu bare
51
Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo
Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două
posibilităţi reprezentate grafic este mai frecventă (Figura 8)
Figura 8 Reprezentare tip bdquopierdquo
Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli
sau a oricărui element comparativ Se foloseşte de epidemiologi
Rezultate
Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare
Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o
manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu
explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția
bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la
ilustraţii tabele grafice
Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi
nici rezultatele care invalidează eventual ipoteza
Discuţii
Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd
cultura ştiinţifică şi inteligenţa autorilor
Acest capitol răspunde la trei obiective
Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia
calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de
selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează
rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv
52
este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn
care a fost abordată problema fără a face o revistă a literaturii
Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea
rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul
Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor
afirmaţii nesusţinute de conţinutul lucrării
Concluzii
Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate
să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie
Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de
concluzii va scădea valoarea lucrării
Bibliografia (lista referinţelor citarea icircn text)
Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn
lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente
Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli
- să conţină cele mai importante şi recente lucrări
- să includă numai lucrări publicate
- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate
Bibliografie
Elisabeta Jaba ndash Statistică Ed Economică 1998
Mihai Ţarcă ndash Statistică volI Ed UAIC 1979
Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale
Ed University Press 2009
Sorana Daniela Bolboacă ndash Metodologia cercetării curs
53
Concluzia testului
Deoarece parametrul statistic calculat al testului nu aparţine regiunii critice se acceptă ipoteza
nulă Nu există diferenţă semnificativă icircntre frecvenţa hepatitei B la eşantionul studiat faţă de
frecvenţa hepatitei B icircn populaţia generală
Testul McNemar
Evaluarea dependenţei variabilelor calitative perechi (dorim să determinăm dacă o anumită
caracteristică este sau nu asociată cu o anumită patologie)
Identificăm n pacienţi care prezintă patologia de interes (eg Cancer bronho-pulmonar) şi n
pacienţi cu aceleaşi caracteristici ca şi primul grup dar care nu o prezintă
Martor = da Martor = nu
Caz = da a b
Caz = nu c d
Testul McNemar - exemplu fumat vs cancer
Martor = da Martor = nu
Cancer = da a = 2 b = 5
Cancer = nu c = 0 d = 3
29
χ2critic(α=005) = 384
32 lt 384 rarr acceptăm ipoteza nulă
Fumatul nu este icircn relaţie cu apariţia cancerului bronho-pulmonar
Inferenţa statistică pe date cantitative
Variabile cantitative continue
Testul z şi Student (t) (o medie sau medii perechi)
Testul z şi Student (t) (testarea a două medii)
ANOVA (ge 3 medii)
Ranguri (variabile cantitative discrete sau cantitative care nu icircndeplinesc condiţia de
normalitate)
Testul sumei rangurilor Wilcoxon
Kruskal-Wallis (ge 3 eşantioane independente)
Friedman (ge 3 eşantioane dependente)
Teste de normalitate variabile cantitative continue
Shapiro-Wilk
Kolmogorov-Smirnov
Shapiro-Wilk
Chi-Square Goodness-of-Fit
Dacă datele urmează o distribuţie normală aplicăm un test parametric
Dacă datele nu urmează o distribuţie normală aplicăm un test de comparare al rangurilor
30
Testul Z de comparare a mediei unui eşantion cu media unei populaţii
Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ
extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie
s2 care se cunoaşte
Condiţii de aplicare
1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru
compararea mediei unui eşantion cu media unei populaţii)
2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal
distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă
3 Talia eşantionului este mare ( ge 30)
Ipoteze
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media
eşantionului şi media populaţiei
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
(-yen -196 ] Egrave [196 yen)
Parametrul testului
n = volumul eşantionului
= media eşantionului
s = deviaţia standard a populaţiei
Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)
Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard
cunoscută
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi
media standard
Condiţii de aplicare
Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se
realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această
condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea
31
Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai
puternic
Numărul de grade de libertate (df) df = n-1
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
Parametrul testului
n = volumul eşantionului
micro0 = media standard
= media eşantionului
s = deviaţia standard a eşantionului
Testul ANOVA compararea mediilor a mai multe eşantioane
H0 = toate mediile sunt egale
H1 = nu toate mediile sunt egale
Condiţii de aplicare
1 Datele sunt independente unele faţă de celelalte
2 Datele fiecărui grup sunt normal distribuite
3 Deviaţia standard este aceeaşi pentru toate grupurile
Id Medicament
A B C D E F
1 5 6 7 10 5 9
2 6 8 8 11 8 8
3 7 7 9 13 6 7
4 8 9 11 12 4 5
32
5 9 10 10 9 7 6
Suma 35 40 45 55 30 35
Media 7 8 9 11 6 7
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =
= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)
Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2
F = (suma pătratelor(icircntre))(suma pătratelor(icircn))
Suma pătratelor (icircntre) = 16times5 = 80
Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60
Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn
interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare
SP df Media pătratelor F = MPicircntreMPicircn
Icircntre 80 5 = 805 = 16 = 1625 = 64
Icircn 60 24 = 6024 = 25
Total 140 29 -
Testul sumei rangurilor Wilcoxon
Aplicat pentru
Un set de observaţii provenite dintr-o valoare ipotetică comună
Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)
Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero
Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace
Suma rangurilor pentru diferenţele negative = 2+3+1 = 6
Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30
33
Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului
egal cu 8 = 0109
Icircnainte După Diferenţa Rang
64 66 -2 2
66 58 8 5
67 68 -1 3
71 65 6 4
72 75 -3 1
76 67 9 6
78 59 19 8
89 74 15 7
Testul Kruskal-Wallis (ge 3 eşantioane independente)
Test de ranguri aplicate pe mai mult de 3 eşantioane
H = parametrul testului
n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)
Tk = suma rangurilor
Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie
pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni
34
df = k-1 (k = numărul de eşantioane)
df = 3-1 = 2
Hcritic(α=005) = 599
H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie
pozitivă şi respectiv biopsie negativă
Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie
a tipului de studiu pe eşantioane perechi)
1 Definirea numărului de tratamente k
2 Obţinerea rangurilor pentru fiecare tratament
3 Sumarea rangurilor fiecărui tratament
4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)
5 Dacă Fr gt Frcritic rarr respingem H0
Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost
măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi
n = 9 k = 3 T12 = 225 T2
2 = 38025 T32 = 38025
Frcritic = 599
Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de
prostată
35
De reţinut
Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei
Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-
of-Fit
Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z
Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t
Compararea mediilor a 3 sau mai multe eşantioane ANOVA
Compararea mediilor a două populaţii (σ) testul Z
Compararea mediilor a două eşantioane (s) testul t
Compararea mediilor a două eşantioane perechi (s) testul t
ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi
cu cel pentru compararea a două eşantioane perechi
Ranguri
Distribuţia datelor nu are importanţă
Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)
Trei sau mai multe eşantioane Kruskal-Wallis
Trei sau mai multe eşantioane perechi Friedman
Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia
Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a
datelor)
Variabile nominale
Un singur eşantion sau eşantioane perechi
Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte
Eşantioane perechi testul Mc Nemar
Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2
Icircn analiza proporţiilor există teste diferite pentru
Compararea unei frecvenţe cu o frecvenţă cunoscută
Compararea a două frecvenţe
Semnificaţia statistică
Valoarea p (p value)
Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor
două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E
posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării
aleatorii
36
Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală
urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii
Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este
probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un
experiment de dimensiunea acestuia
Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că
diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii
diferite
Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca
fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă
ar fi fost adevărată
Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă
1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe
baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De
fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001
2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie
3 Se aplică testul statistic aferent pentru a calcula valoarea p
4 Se compară valoarea p cu valoarea ndash prag
5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe
semnificativă dpdv statisticrdquo
6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e
semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să
conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă
Teste de semnificaţie
Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului
populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)
Testarea ipotezelor implică posibile erori
Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile
sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui
grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul
icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005
ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există
37
nici o diferenţă
Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ
statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de
ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost
ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau
dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă
cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă
semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe
ipotetice variate icircn cazul icircn care ele există
Măsuri ale frecvenţei
Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)
Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate
Generic formula pe care se bazează toate cele trei este
unde x şi y sunt cantităţile de comparat
Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea
unei frecvenţe pe grupe de sex vacircrstă etc
Proporţia implică icircn mod necesar ca x să fie inclus icircn y
Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară
frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp
Pentru calcularea unei rate trebuie ţinut cont de trei aspecte
bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin
bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp
bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo
Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un
tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei
populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei
aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)
38
Indicatori
Rata de incidenţă
Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă
icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii
Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o
perioadă de timp
Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de
timp x
Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei
susceptibili de a dezvolta icircmbolnăvirea studiată
Numitorul poate fi
bull Numărul mediu al populaţiei icircn perioada de timp studiată
bull Mărimea populaţiei icircn mijlocul perioadei de studiu
bull Mărimea populaţiei la icircnceputul studiului
Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă
Este obligatorie menţionarea perioadei de timp
Prevalenţa
Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la
un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă
schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa
momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)
39
Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include
numai cazuri noi respectiv include cazuri noi şi vechi
Rata de atac
Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este
folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp
raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori
Rata persoană-timp
Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din
momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte
migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost
observate
Riscul relativ (RR)
Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment
legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele
prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două
grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la
bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la
bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai
mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo
Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2
Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn
cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă
(Tabelul 1)
Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR
Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la
neexpuşi
40
Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de
culegere a datelor
Odds ratio (OR)
Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin
raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general
studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)
Tabelul 2 Tabelul 2 x 2 pentru calcularea OR
Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală
Rate de mortalitate
Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp
specificată Există mai multe tipuri de rate de mortalitate
o Mortalitate specifică pe sex
o Mortalitate specifică pe rasă
o Mortalitate specifică pe boală
o Mortalitate neonatală
o Mortalitate postneonatală
o Mortalitate infantilă
o Mortalitate maternă
Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP
41
Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de
viaţă şi vacircrsta la care survine decesul dacă este prematur
Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu
Ani de viaţă pierduţi datorat dizabilităţii
Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt
utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru
cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite
grupuri
Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de
risc şi o boală se folosesc riscul relativ şi odds ratio
35 Analiza şi interpretarea datelor
După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date
trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul
Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor
colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului
studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu
plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde
prezenţa biostatisticianului este necesară
Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu
elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat
iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului
iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate
depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori
testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere
clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza
Interpretarea rezultatelor statistice
Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne
motive (număr mic de date) acceptarea ei să fie falsă
Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine
gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia
ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument
de decizie Intervalul de confidenţă
42
Interpretarea statistica ne interpretarea clinică
Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă
Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice
obţinute pe eşantionul studiat
Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare
Ce interpretăm Rezultatele
personale obţinute icircn urma studiului
care au fost prezentate icircn secţiunea bdquoRezultaterdquo
Explicăm rezultatele obţinute
Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale
Interpretarea trebuie să se realizeze icircn
lumina limitelor studiului
contextul cultural social şi educaţional al locului unde s-a realizat cercetarea
contextul a ceea ce se cunoaşte din literatura de specialitate
Interpretăm doar rezultatele personale obţinute icircn urma studiului
Interpretarea statistică nu este tot una cu interpretarea clinică
Interpretarea statistică este importantă
Interpretarea clinică este foarte importantă
Intervalul de confidenţă
Media calculată pe baza unui eşantion nu va echivala media populaţiei
Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului
Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a
populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a
populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)
pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru
orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare
dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de
confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de
date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de
5
Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel
Dacă valoarea p este mică
Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare
aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o
medie diferită Diferenţa este semnificativă dpdv statistic
43
Icircn continuare
Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa
reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică
pentru a fi interesante din punct de vedere ştiinţific
Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC
oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care
este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a
obţine o concluzie clară
Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o
diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că
datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din
punct de vedere ştiinţific
Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul
detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat
Erorile studiilor medicale
Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura
anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară
caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea
asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri
legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias
Erorile potenţiale icircn studiile epidemiologice
1 Erori icircntacircmplătoare
2 Erori sistematice
3 Confuzia
4 Validitatea
1 Erori icircntacircmplătoare
Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a
parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel
de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot
fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii
(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor
de măsură (eroarea de măsurare)
44
2 Erori sistematice
Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate
care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu
acurateţe mare Acurateţea nu este afectată de mărimea eşantionului
Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de
experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea
dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus
şi greu de cuantificat (consum de alcool personalitate etc)
Principalele tipuri de erori din această categorie sunt
bull Biasul de selecţie
bull Biasul de informaţie
Biasul de selecţie
Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul
trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion
inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale
persoanelor incluse
Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se
ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia
Biasul de informaţie
Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de
instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze
expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere
nesemnificativă sau chiar să nu şi-o amintească de loc
3 Confuzia
Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune
prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este
cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă
de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte
important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor
protector
4 Validitatea
Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă
Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte
estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional
Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă
45
conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se
demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)
Validitatea externă se poate realiza numai dacă studiul este valid intern
Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii
studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de
studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt
laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi
validă din punct de vedere intern)
3 6 Prezentarea rezultatelor
După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite
Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor
icircntr-o formă bdquodigerabilărdquo este necesară
Scopul prezentării datelor
1 Transmiterea concluziilor studiului
a Datele corecte şi importante merită comunicate
b Datele trebuie să confirme sau să infirme ipoteza studiului
c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală
2 Acordarea posibilităţii altor cercetători să aprecieze studiul
a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti
b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor
prezentate
Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru
fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie
statistică
Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de
valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras
(Tabel 3)
Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)
46
Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct
numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor
precum şi prezentarea acestora sub formă inteligibilă
Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care
convin cercetătorului
Prezentarea datelor se poate face
1 Figuri şi tabele icircn articole scrise
2 Figuri şi tabele icircn prezentări orale
3 Figuri şi tabele icircn postere
4 Text scris sau incluse icircn text
5 Site-uri de WEB
Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor
Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie
Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele
exprimacircnd exact ceea ce acestea exprimă
Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate
anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel
să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se
acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca
mai sus sugestive sunt formatele simple şi puţin icircncărcate
Dacă nu există reguli impuse se respectă
1 Mesaj simplu fără falsificarea datelor
2 De obicei este necesar atacirct tabelul cacirct şi graficul
3 Să fie simplu şi clar
Tabele
Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile
coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică
elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de
1 Se folosesc doar linii orizontale
2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn
evidenţi prin linie de separare (Tabelul 4)
Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland
Noua Zeelandă)
(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)
47
3 Numerele sunt aliniate icircn funcţie de virgulă
4 Indicii statistici sunt explicaţi sub tabel
5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană
6 Abrevierile pot fi folosite
7 Numărul de zecimale trebuie limitat la maxim două
8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel
9 Plasarea legendei este obligatorie sub tabel
10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)
Icircn cazul prezentărilor orale sau a posterelor este indicat ca
1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării
2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte
3 Folosirea de simboluri este permisă
Clasificarea tabelelor
Tabelele se clasifică după
i) conţinut
bull cu distribuţii de frecvenţe
bull de clase de frecvenţe
bull de contingenţă
ii) structura
bull cu doua coloane
bull cu subclasificări
bull ldquomasterrdquo
Tabele ce conţin distribuţii de frecvenţe
O modalitate comodă de a prezenta o mulţime de date brute este
1 Se ordonează datele in ordine crescătoare
2 Se determine frecvenţa fiecărei valori
3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane
(Tabelul 5)
Tabelul 5 Distribuţii de frecvenţă absolută
48
Tabelul claselor de frecvenţe
1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă
2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)
Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)
Tabele de contingenţă
1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a
tabelelor de contingenţă
2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a
combinaţiilor de perechi ordonate de valori
3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre
a factor de risc si
b starea sănătăţii
4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)
5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)
Tabelul 7 Tabel de contingenţă 2 x 2
49
Grafice
Există două categorii de moduri grafice sub care se pot prezenta datele
1 Ilustraţii şi fotografii
2 Grafice
1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă
pentru lucrare
2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit
Putem vorbi despre mai multe tipuri de grafice
bull Grafice pentru reprezentarea datelor cantitative
1048707 Grafic cartezian (X Y)
1048707 Histograma
1048707 Poligonul de frecvenţe
1048707 Diagrama bdquoscatterrdquo
bull Grafice pentru reprezentarea datelor calitative
1048707 Grafic cu bare
1048707 Diagrama tip bdquoboxplotrdquo
1048707 Diagrama bdquopierdquo
1048707 Cartograma
Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi
dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)
Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)
Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie
Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)
Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)
50
Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir
de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele
două variabile studiate (Figura 6)
Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2
(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2
rămacircne aproximativ constantă)
Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea
comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea
comparativă a mai multor variabile
Figura 7 Grafic calitativ cu bare
51
Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo
Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două
posibilităţi reprezentate grafic este mai frecventă (Figura 8)
Figura 8 Reprezentare tip bdquopierdquo
Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli
sau a oricărui element comparativ Se foloseşte de epidemiologi
Rezultate
Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare
Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o
manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu
explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția
bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la
ilustraţii tabele grafice
Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi
nici rezultatele care invalidează eventual ipoteza
Discuţii
Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd
cultura ştiinţifică şi inteligenţa autorilor
Acest capitol răspunde la trei obiective
Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia
calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de
selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează
rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv
52
este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn
care a fost abordată problema fără a face o revistă a literaturii
Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea
rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul
Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor
afirmaţii nesusţinute de conţinutul lucrării
Concluzii
Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate
să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie
Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de
concluzii va scădea valoarea lucrării
Bibliografia (lista referinţelor citarea icircn text)
Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn
lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente
Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli
- să conţină cele mai importante şi recente lucrări
- să includă numai lucrări publicate
- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate
Bibliografie
Elisabeta Jaba ndash Statistică Ed Economică 1998
Mihai Ţarcă ndash Statistică volI Ed UAIC 1979
Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale
Ed University Press 2009
Sorana Daniela Bolboacă ndash Metodologia cercetării curs
53
χ2critic(α=005) = 384
32 lt 384 rarr acceptăm ipoteza nulă
Fumatul nu este icircn relaţie cu apariţia cancerului bronho-pulmonar
Inferenţa statistică pe date cantitative
Variabile cantitative continue
Testul z şi Student (t) (o medie sau medii perechi)
Testul z şi Student (t) (testarea a două medii)
ANOVA (ge 3 medii)
Ranguri (variabile cantitative discrete sau cantitative care nu icircndeplinesc condiţia de
normalitate)
Testul sumei rangurilor Wilcoxon
Kruskal-Wallis (ge 3 eşantioane independente)
Friedman (ge 3 eşantioane dependente)
Teste de normalitate variabile cantitative continue
Shapiro-Wilk
Kolmogorov-Smirnov
Shapiro-Wilk
Chi-Square Goodness-of-Fit
Dacă datele urmează o distribuţie normală aplicăm un test parametric
Dacă datele nu urmează o distribuţie normală aplicăm un test de comparare al rangurilor
30
Testul Z de comparare a mediei unui eşantion cu media unei populaţii
Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ
extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie
s2 care se cunoaşte
Condiţii de aplicare
1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru
compararea mediei unui eşantion cu media unei populaţii)
2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal
distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă
3 Talia eşantionului este mare ( ge 30)
Ipoteze
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media
eşantionului şi media populaţiei
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
(-yen -196 ] Egrave [196 yen)
Parametrul testului
n = volumul eşantionului
= media eşantionului
s = deviaţia standard a populaţiei
Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)
Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard
cunoscută
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi
media standard
Condiţii de aplicare
Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se
realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această
condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea
31
Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai
puternic
Numărul de grade de libertate (df) df = n-1
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
Parametrul testului
n = volumul eşantionului
micro0 = media standard
= media eşantionului
s = deviaţia standard a eşantionului
Testul ANOVA compararea mediilor a mai multe eşantioane
H0 = toate mediile sunt egale
H1 = nu toate mediile sunt egale
Condiţii de aplicare
1 Datele sunt independente unele faţă de celelalte
2 Datele fiecărui grup sunt normal distribuite
3 Deviaţia standard este aceeaşi pentru toate grupurile
Id Medicament
A B C D E F
1 5 6 7 10 5 9
2 6 8 8 11 8 8
3 7 7 9 13 6 7
4 8 9 11 12 4 5
32
5 9 10 10 9 7 6
Suma 35 40 45 55 30 35
Media 7 8 9 11 6 7
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =
= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)
Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2
F = (suma pătratelor(icircntre))(suma pătratelor(icircn))
Suma pătratelor (icircntre) = 16times5 = 80
Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60
Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn
interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare
SP df Media pătratelor F = MPicircntreMPicircn
Icircntre 80 5 = 805 = 16 = 1625 = 64
Icircn 60 24 = 6024 = 25
Total 140 29 -
Testul sumei rangurilor Wilcoxon
Aplicat pentru
Un set de observaţii provenite dintr-o valoare ipotetică comună
Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)
Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero
Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace
Suma rangurilor pentru diferenţele negative = 2+3+1 = 6
Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30
33
Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului
egal cu 8 = 0109
Icircnainte După Diferenţa Rang
64 66 -2 2
66 58 8 5
67 68 -1 3
71 65 6 4
72 75 -3 1
76 67 9 6
78 59 19 8
89 74 15 7
Testul Kruskal-Wallis (ge 3 eşantioane independente)
Test de ranguri aplicate pe mai mult de 3 eşantioane
H = parametrul testului
n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)
Tk = suma rangurilor
Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie
pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni
34
df = k-1 (k = numărul de eşantioane)
df = 3-1 = 2
Hcritic(α=005) = 599
H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie
pozitivă şi respectiv biopsie negativă
Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie
a tipului de studiu pe eşantioane perechi)
1 Definirea numărului de tratamente k
2 Obţinerea rangurilor pentru fiecare tratament
3 Sumarea rangurilor fiecărui tratament
4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)
5 Dacă Fr gt Frcritic rarr respingem H0
Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost
măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi
n = 9 k = 3 T12 = 225 T2
2 = 38025 T32 = 38025
Frcritic = 599
Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de
prostată
35
De reţinut
Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei
Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-
of-Fit
Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z
Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t
Compararea mediilor a 3 sau mai multe eşantioane ANOVA
Compararea mediilor a două populaţii (σ) testul Z
Compararea mediilor a două eşantioane (s) testul t
Compararea mediilor a două eşantioane perechi (s) testul t
ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi
cu cel pentru compararea a două eşantioane perechi
Ranguri
Distribuţia datelor nu are importanţă
Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)
Trei sau mai multe eşantioane Kruskal-Wallis
Trei sau mai multe eşantioane perechi Friedman
Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia
Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a
datelor)
Variabile nominale
Un singur eşantion sau eşantioane perechi
Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte
Eşantioane perechi testul Mc Nemar
Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2
Icircn analiza proporţiilor există teste diferite pentru
Compararea unei frecvenţe cu o frecvenţă cunoscută
Compararea a două frecvenţe
Semnificaţia statistică
Valoarea p (p value)
Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor
două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E
posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării
aleatorii
36
Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală
urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii
Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este
probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un
experiment de dimensiunea acestuia
Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că
diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii
diferite
Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca
fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă
ar fi fost adevărată
Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă
1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe
baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De
fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001
2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie
3 Se aplică testul statistic aferent pentru a calcula valoarea p
4 Se compară valoarea p cu valoarea ndash prag
5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe
semnificativă dpdv statisticrdquo
6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e
semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să
conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă
Teste de semnificaţie
Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului
populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)
Testarea ipotezelor implică posibile erori
Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile
sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui
grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul
icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005
ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există
37
nici o diferenţă
Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ
statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de
ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost
ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau
dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă
cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă
semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe
ipotetice variate icircn cazul icircn care ele există
Măsuri ale frecvenţei
Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)
Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate
Generic formula pe care se bazează toate cele trei este
unde x şi y sunt cantităţile de comparat
Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea
unei frecvenţe pe grupe de sex vacircrstă etc
Proporţia implică icircn mod necesar ca x să fie inclus icircn y
Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară
frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp
Pentru calcularea unei rate trebuie ţinut cont de trei aspecte
bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin
bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp
bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo
Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un
tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei
populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei
aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)
38
Indicatori
Rata de incidenţă
Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă
icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii
Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o
perioadă de timp
Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de
timp x
Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei
susceptibili de a dezvolta icircmbolnăvirea studiată
Numitorul poate fi
bull Numărul mediu al populaţiei icircn perioada de timp studiată
bull Mărimea populaţiei icircn mijlocul perioadei de studiu
bull Mărimea populaţiei la icircnceputul studiului
Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă
Este obligatorie menţionarea perioadei de timp
Prevalenţa
Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la
un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă
schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa
momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)
39
Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include
numai cazuri noi respectiv include cazuri noi şi vechi
Rata de atac
Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este
folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp
raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori
Rata persoană-timp
Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din
momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte
migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost
observate
Riscul relativ (RR)
Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment
legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele
prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două
grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la
bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la
bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai
mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo
Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2
Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn
cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă
(Tabelul 1)
Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR
Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la
neexpuşi
40
Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de
culegere a datelor
Odds ratio (OR)
Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin
raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general
studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)
Tabelul 2 Tabelul 2 x 2 pentru calcularea OR
Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală
Rate de mortalitate
Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp
specificată Există mai multe tipuri de rate de mortalitate
o Mortalitate specifică pe sex
o Mortalitate specifică pe rasă
o Mortalitate specifică pe boală
o Mortalitate neonatală
o Mortalitate postneonatală
o Mortalitate infantilă
o Mortalitate maternă
Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP
41
Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de
viaţă şi vacircrsta la care survine decesul dacă este prematur
Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu
Ani de viaţă pierduţi datorat dizabilităţii
Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt
utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru
cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite
grupuri
Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de
risc şi o boală se folosesc riscul relativ şi odds ratio
35 Analiza şi interpretarea datelor
După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date
trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul
Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor
colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului
studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu
plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde
prezenţa biostatisticianului este necesară
Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu
elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat
iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului
iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate
depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori
testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere
clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza
Interpretarea rezultatelor statistice
Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne
motive (număr mic de date) acceptarea ei să fie falsă
Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine
gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia
ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument
de decizie Intervalul de confidenţă
42
Interpretarea statistica ne interpretarea clinică
Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă
Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice
obţinute pe eşantionul studiat
Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare
Ce interpretăm Rezultatele
personale obţinute icircn urma studiului
care au fost prezentate icircn secţiunea bdquoRezultaterdquo
Explicăm rezultatele obţinute
Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale
Interpretarea trebuie să se realizeze icircn
lumina limitelor studiului
contextul cultural social şi educaţional al locului unde s-a realizat cercetarea
contextul a ceea ce se cunoaşte din literatura de specialitate
Interpretăm doar rezultatele personale obţinute icircn urma studiului
Interpretarea statistică nu este tot una cu interpretarea clinică
Interpretarea statistică este importantă
Interpretarea clinică este foarte importantă
Intervalul de confidenţă
Media calculată pe baza unui eşantion nu va echivala media populaţiei
Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului
Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a
populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a
populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)
pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru
orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare
dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de
confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de
date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de
5
Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel
Dacă valoarea p este mică
Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare
aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o
medie diferită Diferenţa este semnificativă dpdv statistic
43
Icircn continuare
Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa
reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică
pentru a fi interesante din punct de vedere ştiinţific
Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC
oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care
este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a
obţine o concluzie clară
Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o
diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că
datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din
punct de vedere ştiinţific
Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul
detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat
Erorile studiilor medicale
Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura
anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară
caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea
asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri
legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias
Erorile potenţiale icircn studiile epidemiologice
1 Erori icircntacircmplătoare
2 Erori sistematice
3 Confuzia
4 Validitatea
1 Erori icircntacircmplătoare
Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a
parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel
de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot
fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii
(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor
de măsură (eroarea de măsurare)
44
2 Erori sistematice
Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate
care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu
acurateţe mare Acurateţea nu este afectată de mărimea eşantionului
Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de
experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea
dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus
şi greu de cuantificat (consum de alcool personalitate etc)
Principalele tipuri de erori din această categorie sunt
bull Biasul de selecţie
bull Biasul de informaţie
Biasul de selecţie
Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul
trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion
inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale
persoanelor incluse
Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se
ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia
Biasul de informaţie
Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de
instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze
expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere
nesemnificativă sau chiar să nu şi-o amintească de loc
3 Confuzia
Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune
prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este
cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă
de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte
important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor
protector
4 Validitatea
Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă
Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte
estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional
Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă
45
conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se
demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)
Validitatea externă se poate realiza numai dacă studiul este valid intern
Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii
studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de
studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt
laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi
validă din punct de vedere intern)
3 6 Prezentarea rezultatelor
După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite
Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor
icircntr-o formă bdquodigerabilărdquo este necesară
Scopul prezentării datelor
1 Transmiterea concluziilor studiului
a Datele corecte şi importante merită comunicate
b Datele trebuie să confirme sau să infirme ipoteza studiului
c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală
2 Acordarea posibilităţii altor cercetători să aprecieze studiul
a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti
b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor
prezentate
Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru
fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie
statistică
Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de
valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras
(Tabel 3)
Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)
46
Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct
numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor
precum şi prezentarea acestora sub formă inteligibilă
Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care
convin cercetătorului
Prezentarea datelor se poate face
1 Figuri şi tabele icircn articole scrise
2 Figuri şi tabele icircn prezentări orale
3 Figuri şi tabele icircn postere
4 Text scris sau incluse icircn text
5 Site-uri de WEB
Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor
Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie
Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele
exprimacircnd exact ceea ce acestea exprimă
Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate
anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel
să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se
acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca
mai sus sugestive sunt formatele simple şi puţin icircncărcate
Dacă nu există reguli impuse se respectă
1 Mesaj simplu fără falsificarea datelor
2 De obicei este necesar atacirct tabelul cacirct şi graficul
3 Să fie simplu şi clar
Tabele
Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile
coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică
elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de
1 Se folosesc doar linii orizontale
2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn
evidenţi prin linie de separare (Tabelul 4)
Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland
Noua Zeelandă)
(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)
47
3 Numerele sunt aliniate icircn funcţie de virgulă
4 Indicii statistici sunt explicaţi sub tabel
5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană
6 Abrevierile pot fi folosite
7 Numărul de zecimale trebuie limitat la maxim două
8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel
9 Plasarea legendei este obligatorie sub tabel
10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)
Icircn cazul prezentărilor orale sau a posterelor este indicat ca
1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării
2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte
3 Folosirea de simboluri este permisă
Clasificarea tabelelor
Tabelele se clasifică după
i) conţinut
bull cu distribuţii de frecvenţe
bull de clase de frecvenţe
bull de contingenţă
ii) structura
bull cu doua coloane
bull cu subclasificări
bull ldquomasterrdquo
Tabele ce conţin distribuţii de frecvenţe
O modalitate comodă de a prezenta o mulţime de date brute este
1 Se ordonează datele in ordine crescătoare
2 Se determine frecvenţa fiecărei valori
3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane
(Tabelul 5)
Tabelul 5 Distribuţii de frecvenţă absolută
48
Tabelul claselor de frecvenţe
1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă
2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)
Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)
Tabele de contingenţă
1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a
tabelelor de contingenţă
2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a
combinaţiilor de perechi ordonate de valori
3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre
a factor de risc si
b starea sănătăţii
4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)
5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)
Tabelul 7 Tabel de contingenţă 2 x 2
49
Grafice
Există două categorii de moduri grafice sub care se pot prezenta datele
1 Ilustraţii şi fotografii
2 Grafice
1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă
pentru lucrare
2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit
Putem vorbi despre mai multe tipuri de grafice
bull Grafice pentru reprezentarea datelor cantitative
1048707 Grafic cartezian (X Y)
1048707 Histograma
1048707 Poligonul de frecvenţe
1048707 Diagrama bdquoscatterrdquo
bull Grafice pentru reprezentarea datelor calitative
1048707 Grafic cu bare
1048707 Diagrama tip bdquoboxplotrdquo
1048707 Diagrama bdquopierdquo
1048707 Cartograma
Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi
dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)
Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)
Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie
Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)
Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)
50
Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir
de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele
două variabile studiate (Figura 6)
Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2
(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2
rămacircne aproximativ constantă)
Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea
comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea
comparativă a mai multor variabile
Figura 7 Grafic calitativ cu bare
51
Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo
Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două
posibilităţi reprezentate grafic este mai frecventă (Figura 8)
Figura 8 Reprezentare tip bdquopierdquo
Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli
sau a oricărui element comparativ Se foloseşte de epidemiologi
Rezultate
Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare
Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o
manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu
explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția
bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la
ilustraţii tabele grafice
Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi
nici rezultatele care invalidează eventual ipoteza
Discuţii
Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd
cultura ştiinţifică şi inteligenţa autorilor
Acest capitol răspunde la trei obiective
Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia
calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de
selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează
rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv
52
este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn
care a fost abordată problema fără a face o revistă a literaturii
Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea
rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul
Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor
afirmaţii nesusţinute de conţinutul lucrării
Concluzii
Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate
să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie
Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de
concluzii va scădea valoarea lucrării
Bibliografia (lista referinţelor citarea icircn text)
Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn
lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente
Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli
- să conţină cele mai importante şi recente lucrări
- să includă numai lucrări publicate
- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate
Bibliografie
Elisabeta Jaba ndash Statistică Ed Economică 1998
Mihai Ţarcă ndash Statistică volI Ed UAIC 1979
Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale
Ed University Press 2009
Sorana Daniela Bolboacă ndash Metodologia cercetării curs
53
Testul Z de comparare a mediei unui eşantion cu media unei populaţii
Scopul testului compararea mediei unei variabile cantitative continue pe un eşantion reprezentativ
extras dintr-o populaţie cu o medie cunoscută Se presupune că cele două populaţii au aceiaşi variaţie
s2 care se cunoaşte
Condiţii de aplicare
1 Este necesar să cunoaştem variaţia populaţiei (dacă nu o cunoaştem aplicăm testul Student pentru
compararea mediei unui eşantion cu media unei populaţii)
2 Testul este corect aplicat dacă populaţia este normal distribuită Dacă populaţia nu este normal
distribuită iar talia eşantionului este mică (lt 30) testul dă o valoare orientativă
3 Talia eşantionului este mare ( ge 30)
Ipoteze
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media populaţiei
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media
eşantionului şi media populaţiei
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
(-yen -196 ] Egrave [196 yen)
Parametrul testului
n = volumul eşantionului
= media eşantionului
s = deviaţia standard a populaţiei
Testul Student (t) de comparare a unei medii cu o medie cunoscută (variaţii necunoscute)
Scopul testului este investigarea semnificaţiei diferenţei dintre media unui eşantion şi o medie standard
cunoscută
Ipoteza nulă nu există diferenţă semnificativă icircntre media eşantionului şi media standard
Ipoteza alternativă pentru testul bilateral există diferenţă semnificativă icircntre media eşantionului şi
media standard
Condiţii de aplicare
Testul se poate aplica atunci cacircnd variaţia s2 nu este cunoscută iar estimarea s2 a acesteia se
realizează pentru un eşantion mic (n lt 30) care respectă o distribuţie normală Dacă această
condiţie de normalitate nu este satisfăcută atunci testul icircşi pierde validitatea
31
Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai
puternic
Numărul de grade de libertate (df) df = n-1
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
Parametrul testului
n = volumul eşantionului
micro0 = media standard
= media eşantionului
s = deviaţia standard a eşantionului
Testul ANOVA compararea mediilor a mai multe eşantioane
H0 = toate mediile sunt egale
H1 = nu toate mediile sunt egale
Condiţii de aplicare
1 Datele sunt independente unele faţă de celelalte
2 Datele fiecărui grup sunt normal distribuite
3 Deviaţia standard este aceeaşi pentru toate grupurile
Id Medicament
A B C D E F
1 5 6 7 10 5 9
2 6 8 8 11 8 8
3 7 7 9 13 6 7
4 8 9 11 12 4 5
32
5 9 10 10 9 7 6
Suma 35 40 45 55 30 35
Media 7 8 9 11 6 7
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =
= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)
Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2
F = (suma pătratelor(icircntre))(suma pătratelor(icircn))
Suma pătratelor (icircntre) = 16times5 = 80
Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60
Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn
interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare
SP df Media pătratelor F = MPicircntreMPicircn
Icircntre 80 5 = 805 = 16 = 1625 = 64
Icircn 60 24 = 6024 = 25
Total 140 29 -
Testul sumei rangurilor Wilcoxon
Aplicat pentru
Un set de observaţii provenite dintr-o valoare ipotetică comună
Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)
Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero
Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace
Suma rangurilor pentru diferenţele negative = 2+3+1 = 6
Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30
33
Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului
egal cu 8 = 0109
Icircnainte După Diferenţa Rang
64 66 -2 2
66 58 8 5
67 68 -1 3
71 65 6 4
72 75 -3 1
76 67 9 6
78 59 19 8
89 74 15 7
Testul Kruskal-Wallis (ge 3 eşantioane independente)
Test de ranguri aplicate pe mai mult de 3 eşantioane
H = parametrul testului
n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)
Tk = suma rangurilor
Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie
pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni
34
df = k-1 (k = numărul de eşantioane)
df = 3-1 = 2
Hcritic(α=005) = 599
H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie
pozitivă şi respectiv biopsie negativă
Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie
a tipului de studiu pe eşantioane perechi)
1 Definirea numărului de tratamente k
2 Obţinerea rangurilor pentru fiecare tratament
3 Sumarea rangurilor fiecărui tratament
4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)
5 Dacă Fr gt Frcritic rarr respingem H0
Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost
măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi
n = 9 k = 3 T12 = 225 T2
2 = 38025 T32 = 38025
Frcritic = 599
Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de
prostată
35
De reţinut
Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei
Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-
of-Fit
Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z
Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t
Compararea mediilor a 3 sau mai multe eşantioane ANOVA
Compararea mediilor a două populaţii (σ) testul Z
Compararea mediilor a două eşantioane (s) testul t
Compararea mediilor a două eşantioane perechi (s) testul t
ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi
cu cel pentru compararea a două eşantioane perechi
Ranguri
Distribuţia datelor nu are importanţă
Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)
Trei sau mai multe eşantioane Kruskal-Wallis
Trei sau mai multe eşantioane perechi Friedman
Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia
Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a
datelor)
Variabile nominale
Un singur eşantion sau eşantioane perechi
Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte
Eşantioane perechi testul Mc Nemar
Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2
Icircn analiza proporţiilor există teste diferite pentru
Compararea unei frecvenţe cu o frecvenţă cunoscută
Compararea a două frecvenţe
Semnificaţia statistică
Valoarea p (p value)
Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor
două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E
posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării
aleatorii
36
Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală
urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii
Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este
probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un
experiment de dimensiunea acestuia
Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că
diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii
diferite
Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca
fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă
ar fi fost adevărată
Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă
1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe
baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De
fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001
2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie
3 Se aplică testul statistic aferent pentru a calcula valoarea p
4 Se compară valoarea p cu valoarea ndash prag
5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe
semnificativă dpdv statisticrdquo
6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e
semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să
conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă
Teste de semnificaţie
Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului
populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)
Testarea ipotezelor implică posibile erori
Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile
sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui
grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul
icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005
ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există
37
nici o diferenţă
Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ
statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de
ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost
ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau
dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă
cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă
semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe
ipotetice variate icircn cazul icircn care ele există
Măsuri ale frecvenţei
Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)
Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate
Generic formula pe care se bazează toate cele trei este
unde x şi y sunt cantităţile de comparat
Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea
unei frecvenţe pe grupe de sex vacircrstă etc
Proporţia implică icircn mod necesar ca x să fie inclus icircn y
Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară
frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp
Pentru calcularea unei rate trebuie ţinut cont de trei aspecte
bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin
bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp
bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo
Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un
tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei
populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei
aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)
38
Indicatori
Rata de incidenţă
Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă
icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii
Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o
perioadă de timp
Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de
timp x
Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei
susceptibili de a dezvolta icircmbolnăvirea studiată
Numitorul poate fi
bull Numărul mediu al populaţiei icircn perioada de timp studiată
bull Mărimea populaţiei icircn mijlocul perioadei de studiu
bull Mărimea populaţiei la icircnceputul studiului
Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă
Este obligatorie menţionarea perioadei de timp
Prevalenţa
Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la
un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă
schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa
momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)
39
Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include
numai cazuri noi respectiv include cazuri noi şi vechi
Rata de atac
Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este
folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp
raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori
Rata persoană-timp
Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din
momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte
migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost
observate
Riscul relativ (RR)
Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment
legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele
prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două
grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la
bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la
bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai
mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo
Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2
Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn
cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă
(Tabelul 1)
Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR
Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la
neexpuşi
40
Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de
culegere a datelor
Odds ratio (OR)
Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin
raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general
studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)
Tabelul 2 Tabelul 2 x 2 pentru calcularea OR
Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală
Rate de mortalitate
Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp
specificată Există mai multe tipuri de rate de mortalitate
o Mortalitate specifică pe sex
o Mortalitate specifică pe rasă
o Mortalitate specifică pe boală
o Mortalitate neonatală
o Mortalitate postneonatală
o Mortalitate infantilă
o Mortalitate maternă
Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP
41
Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de
viaţă şi vacircrsta la care survine decesul dacă este prematur
Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu
Ani de viaţă pierduţi datorat dizabilităţii
Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt
utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru
cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite
grupuri
Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de
risc şi o boală se folosesc riscul relativ şi odds ratio
35 Analiza şi interpretarea datelor
După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date
trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul
Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor
colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului
studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu
plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde
prezenţa biostatisticianului este necesară
Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu
elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat
iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului
iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate
depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori
testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere
clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza
Interpretarea rezultatelor statistice
Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne
motive (număr mic de date) acceptarea ei să fie falsă
Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine
gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia
ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument
de decizie Intervalul de confidenţă
42
Interpretarea statistica ne interpretarea clinică
Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă
Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice
obţinute pe eşantionul studiat
Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare
Ce interpretăm Rezultatele
personale obţinute icircn urma studiului
care au fost prezentate icircn secţiunea bdquoRezultaterdquo
Explicăm rezultatele obţinute
Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale
Interpretarea trebuie să se realizeze icircn
lumina limitelor studiului
contextul cultural social şi educaţional al locului unde s-a realizat cercetarea
contextul a ceea ce se cunoaşte din literatura de specialitate
Interpretăm doar rezultatele personale obţinute icircn urma studiului
Interpretarea statistică nu este tot una cu interpretarea clinică
Interpretarea statistică este importantă
Interpretarea clinică este foarte importantă
Intervalul de confidenţă
Media calculată pe baza unui eşantion nu va echivala media populaţiei
Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului
Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a
populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a
populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)
pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru
orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare
dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de
confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de
date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de
5
Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel
Dacă valoarea p este mică
Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare
aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o
medie diferită Diferenţa este semnificativă dpdv statistic
43
Icircn continuare
Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa
reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică
pentru a fi interesante din punct de vedere ştiinţific
Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC
oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care
este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a
obţine o concluzie clară
Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o
diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că
datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din
punct de vedere ştiinţific
Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul
detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat
Erorile studiilor medicale
Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura
anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară
caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea
asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri
legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias
Erorile potenţiale icircn studiile epidemiologice
1 Erori icircntacircmplătoare
2 Erori sistematice
3 Confuzia
4 Validitatea
1 Erori icircntacircmplătoare
Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a
parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel
de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot
fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii
(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor
de măsură (eroarea de măsurare)
44
2 Erori sistematice
Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate
care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu
acurateţe mare Acurateţea nu este afectată de mărimea eşantionului
Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de
experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea
dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus
şi greu de cuantificat (consum de alcool personalitate etc)
Principalele tipuri de erori din această categorie sunt
bull Biasul de selecţie
bull Biasul de informaţie
Biasul de selecţie
Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul
trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion
inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale
persoanelor incluse
Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se
ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia
Biasul de informaţie
Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de
instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze
expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere
nesemnificativă sau chiar să nu şi-o amintească de loc
3 Confuzia
Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune
prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este
cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă
de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte
important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor
protector
4 Validitatea
Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă
Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte
estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional
Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă
45
conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se
demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)
Validitatea externă se poate realiza numai dacă studiul este valid intern
Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii
studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de
studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt
laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi
validă din punct de vedere intern)
3 6 Prezentarea rezultatelor
După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite
Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor
icircntr-o formă bdquodigerabilărdquo este necesară
Scopul prezentării datelor
1 Transmiterea concluziilor studiului
a Datele corecte şi importante merită comunicate
b Datele trebuie să confirme sau să infirme ipoteza studiului
c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală
2 Acordarea posibilităţii altor cercetători să aprecieze studiul
a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti
b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor
prezentate
Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru
fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie
statistică
Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de
valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras
(Tabel 3)
Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)
46
Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct
numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor
precum şi prezentarea acestora sub formă inteligibilă
Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care
convin cercetătorului
Prezentarea datelor se poate face
1 Figuri şi tabele icircn articole scrise
2 Figuri şi tabele icircn prezentări orale
3 Figuri şi tabele icircn postere
4 Text scris sau incluse icircn text
5 Site-uri de WEB
Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor
Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie
Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele
exprimacircnd exact ceea ce acestea exprimă
Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate
anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel
să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se
acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca
mai sus sugestive sunt formatele simple şi puţin icircncărcate
Dacă nu există reguli impuse se respectă
1 Mesaj simplu fără falsificarea datelor
2 De obicei este necesar atacirct tabelul cacirct şi graficul
3 Să fie simplu şi clar
Tabele
Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile
coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică
elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de
1 Se folosesc doar linii orizontale
2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn
evidenţi prin linie de separare (Tabelul 4)
Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland
Noua Zeelandă)
(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)
47
3 Numerele sunt aliniate icircn funcţie de virgulă
4 Indicii statistici sunt explicaţi sub tabel
5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană
6 Abrevierile pot fi folosite
7 Numărul de zecimale trebuie limitat la maxim două
8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel
9 Plasarea legendei este obligatorie sub tabel
10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)
Icircn cazul prezentărilor orale sau a posterelor este indicat ca
1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării
2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte
3 Folosirea de simboluri este permisă
Clasificarea tabelelor
Tabelele se clasifică după
i) conţinut
bull cu distribuţii de frecvenţe
bull de clase de frecvenţe
bull de contingenţă
ii) structura
bull cu doua coloane
bull cu subclasificări
bull ldquomasterrdquo
Tabele ce conţin distribuţii de frecvenţe
O modalitate comodă de a prezenta o mulţime de date brute este
1 Se ordonează datele in ordine crescătoare
2 Se determine frecvenţa fiecărei valori
3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane
(Tabelul 5)
Tabelul 5 Distribuţii de frecvenţă absolută
48
Tabelul claselor de frecvenţe
1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă
2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)
Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)
Tabele de contingenţă
1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a
tabelelor de contingenţă
2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a
combinaţiilor de perechi ordonate de valori
3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre
a factor de risc si
b starea sănătăţii
4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)
5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)
Tabelul 7 Tabel de contingenţă 2 x 2
49
Grafice
Există două categorii de moduri grafice sub care se pot prezenta datele
1 Ilustraţii şi fotografii
2 Grafice
1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă
pentru lucrare
2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit
Putem vorbi despre mai multe tipuri de grafice
bull Grafice pentru reprezentarea datelor cantitative
1048707 Grafic cartezian (X Y)
1048707 Histograma
1048707 Poligonul de frecvenţe
1048707 Diagrama bdquoscatterrdquo
bull Grafice pentru reprezentarea datelor calitative
1048707 Grafic cu bare
1048707 Diagrama tip bdquoboxplotrdquo
1048707 Diagrama bdquopierdquo
1048707 Cartograma
Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi
dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)
Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)
Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie
Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)
Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)
50
Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir
de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele
două variabile studiate (Figura 6)
Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2
(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2
rămacircne aproximativ constantă)
Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea
comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea
comparativă a mai multor variabile
Figura 7 Grafic calitativ cu bare
51
Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo
Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două
posibilităţi reprezentate grafic este mai frecventă (Figura 8)
Figura 8 Reprezentare tip bdquopierdquo
Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli
sau a oricărui element comparativ Se foloseşte de epidemiologi
Rezultate
Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare
Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o
manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu
explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția
bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la
ilustraţii tabele grafice
Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi
nici rezultatele care invalidează eventual ipoteza
Discuţii
Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd
cultura ştiinţifică şi inteligenţa autorilor
Acest capitol răspunde la trei obiective
Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia
calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de
selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează
rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv
52
este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn
care a fost abordată problema fără a face o revistă a literaturii
Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea
rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul
Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor
afirmaţii nesusţinute de conţinutul lucrării
Concluzii
Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate
să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie
Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de
concluzii va scădea valoarea lucrării
Bibliografia (lista referinţelor citarea icircn text)
Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn
lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente
Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli
- să conţină cele mai importante şi recente lucrări
- să includă numai lucrări publicate
- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate
Bibliografie
Elisabeta Jaba ndash Statistică Ed Economică 1998
Mihai Ţarcă ndash Statistică volI Ed UAIC 1979
Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale
Ed University Press 2009
Sorana Daniela Bolboacă ndash Metodologia cercetării curs
53
Dacă se cunoaşte variaţia populaţiei s2 şi n ge 30 se aplică testul Z care este un test mult mai
puternic
Numărul de grade de libertate (df) df = n-1
Pragul de semnificaţie a = 005
Regiunea critică pentru testul bilateral este
Parametrul testului
n = volumul eşantionului
micro0 = media standard
= media eşantionului
s = deviaţia standard a eşantionului
Testul ANOVA compararea mediilor a mai multe eşantioane
H0 = toate mediile sunt egale
H1 = nu toate mediile sunt egale
Condiţii de aplicare
1 Datele sunt independente unele faţă de celelalte
2 Datele fiecărui grup sunt normal distribuite
3 Deviaţia standard este aceeaşi pentru toate grupurile
Id Medicament
A B C D E F
1 5 6 7 10 5 9
2 6 8 8 11 8 8
3 7 7 9 13 6 7
4 8 9 11 12 4 5
32
5 9 10 10 9 7 6
Suma 35 40 45 55 30 35
Media 7 8 9 11 6 7
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =
= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)
Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2
F = (suma pătratelor(icircntre))(suma pătratelor(icircn))
Suma pătratelor (icircntre) = 16times5 = 80
Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60
Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn
interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare
SP df Media pătratelor F = MPicircntreMPicircn
Icircntre 80 5 = 805 = 16 = 1625 = 64
Icircn 60 24 = 6024 = 25
Total 140 29 -
Testul sumei rangurilor Wilcoxon
Aplicat pentru
Un set de observaţii provenite dintr-o valoare ipotetică comună
Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)
Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero
Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace
Suma rangurilor pentru diferenţele negative = 2+3+1 = 6
Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30
33
Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului
egal cu 8 = 0109
Icircnainte După Diferenţa Rang
64 66 -2 2
66 58 8 5
67 68 -1 3
71 65 6 4
72 75 -3 1
76 67 9 6
78 59 19 8
89 74 15 7
Testul Kruskal-Wallis (ge 3 eşantioane independente)
Test de ranguri aplicate pe mai mult de 3 eşantioane
H = parametrul testului
n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)
Tk = suma rangurilor
Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie
pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni
34
df = k-1 (k = numărul de eşantioane)
df = 3-1 = 2
Hcritic(α=005) = 599
H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie
pozitivă şi respectiv biopsie negativă
Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie
a tipului de studiu pe eşantioane perechi)
1 Definirea numărului de tratamente k
2 Obţinerea rangurilor pentru fiecare tratament
3 Sumarea rangurilor fiecărui tratament
4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)
5 Dacă Fr gt Frcritic rarr respingem H0
Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost
măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi
n = 9 k = 3 T12 = 225 T2
2 = 38025 T32 = 38025
Frcritic = 599
Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de
prostată
35
De reţinut
Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei
Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-
of-Fit
Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z
Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t
Compararea mediilor a 3 sau mai multe eşantioane ANOVA
Compararea mediilor a două populaţii (σ) testul Z
Compararea mediilor a două eşantioane (s) testul t
Compararea mediilor a două eşantioane perechi (s) testul t
ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi
cu cel pentru compararea a două eşantioane perechi
Ranguri
Distribuţia datelor nu are importanţă
Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)
Trei sau mai multe eşantioane Kruskal-Wallis
Trei sau mai multe eşantioane perechi Friedman
Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia
Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a
datelor)
Variabile nominale
Un singur eşantion sau eşantioane perechi
Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte
Eşantioane perechi testul Mc Nemar
Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2
Icircn analiza proporţiilor există teste diferite pentru
Compararea unei frecvenţe cu o frecvenţă cunoscută
Compararea a două frecvenţe
Semnificaţia statistică
Valoarea p (p value)
Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor
două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E
posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării
aleatorii
36
Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală
urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii
Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este
probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un
experiment de dimensiunea acestuia
Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că
diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii
diferite
Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca
fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă
ar fi fost adevărată
Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă
1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe
baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De
fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001
2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie
3 Se aplică testul statistic aferent pentru a calcula valoarea p
4 Se compară valoarea p cu valoarea ndash prag
5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe
semnificativă dpdv statisticrdquo
6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e
semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să
conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă
Teste de semnificaţie
Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului
populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)
Testarea ipotezelor implică posibile erori
Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile
sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui
grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul
icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005
ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există
37
nici o diferenţă
Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ
statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de
ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost
ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau
dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă
cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă
semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe
ipotetice variate icircn cazul icircn care ele există
Măsuri ale frecvenţei
Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)
Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate
Generic formula pe care se bazează toate cele trei este
unde x şi y sunt cantităţile de comparat
Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea
unei frecvenţe pe grupe de sex vacircrstă etc
Proporţia implică icircn mod necesar ca x să fie inclus icircn y
Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară
frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp
Pentru calcularea unei rate trebuie ţinut cont de trei aspecte
bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin
bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp
bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo
Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un
tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei
populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei
aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)
38
Indicatori
Rata de incidenţă
Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă
icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii
Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o
perioadă de timp
Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de
timp x
Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei
susceptibili de a dezvolta icircmbolnăvirea studiată
Numitorul poate fi
bull Numărul mediu al populaţiei icircn perioada de timp studiată
bull Mărimea populaţiei icircn mijlocul perioadei de studiu
bull Mărimea populaţiei la icircnceputul studiului
Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă
Este obligatorie menţionarea perioadei de timp
Prevalenţa
Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la
un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă
schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa
momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)
39
Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include
numai cazuri noi respectiv include cazuri noi şi vechi
Rata de atac
Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este
folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp
raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori
Rata persoană-timp
Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din
momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte
migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost
observate
Riscul relativ (RR)
Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment
legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele
prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două
grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la
bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la
bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai
mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo
Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2
Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn
cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă
(Tabelul 1)
Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR
Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la
neexpuşi
40
Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de
culegere a datelor
Odds ratio (OR)
Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin
raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general
studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)
Tabelul 2 Tabelul 2 x 2 pentru calcularea OR
Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală
Rate de mortalitate
Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp
specificată Există mai multe tipuri de rate de mortalitate
o Mortalitate specifică pe sex
o Mortalitate specifică pe rasă
o Mortalitate specifică pe boală
o Mortalitate neonatală
o Mortalitate postneonatală
o Mortalitate infantilă
o Mortalitate maternă
Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP
41
Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de
viaţă şi vacircrsta la care survine decesul dacă este prematur
Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu
Ani de viaţă pierduţi datorat dizabilităţii
Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt
utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru
cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite
grupuri
Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de
risc şi o boală se folosesc riscul relativ şi odds ratio
35 Analiza şi interpretarea datelor
După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date
trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul
Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor
colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului
studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu
plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde
prezenţa biostatisticianului este necesară
Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu
elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat
iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului
iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate
depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori
testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere
clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza
Interpretarea rezultatelor statistice
Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne
motive (număr mic de date) acceptarea ei să fie falsă
Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine
gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia
ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument
de decizie Intervalul de confidenţă
42
Interpretarea statistica ne interpretarea clinică
Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă
Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice
obţinute pe eşantionul studiat
Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare
Ce interpretăm Rezultatele
personale obţinute icircn urma studiului
care au fost prezentate icircn secţiunea bdquoRezultaterdquo
Explicăm rezultatele obţinute
Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale
Interpretarea trebuie să se realizeze icircn
lumina limitelor studiului
contextul cultural social şi educaţional al locului unde s-a realizat cercetarea
contextul a ceea ce se cunoaşte din literatura de specialitate
Interpretăm doar rezultatele personale obţinute icircn urma studiului
Interpretarea statistică nu este tot una cu interpretarea clinică
Interpretarea statistică este importantă
Interpretarea clinică este foarte importantă
Intervalul de confidenţă
Media calculată pe baza unui eşantion nu va echivala media populaţiei
Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului
Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a
populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a
populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)
pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru
orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare
dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de
confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de
date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de
5
Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel
Dacă valoarea p este mică
Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare
aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o
medie diferită Diferenţa este semnificativă dpdv statistic
43
Icircn continuare
Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa
reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică
pentru a fi interesante din punct de vedere ştiinţific
Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC
oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care
este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a
obţine o concluzie clară
Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o
diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că
datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din
punct de vedere ştiinţific
Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul
detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat
Erorile studiilor medicale
Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura
anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară
caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea
asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri
legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias
Erorile potenţiale icircn studiile epidemiologice
1 Erori icircntacircmplătoare
2 Erori sistematice
3 Confuzia
4 Validitatea
1 Erori icircntacircmplătoare
Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a
parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel
de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot
fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii
(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor
de măsură (eroarea de măsurare)
44
2 Erori sistematice
Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate
care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu
acurateţe mare Acurateţea nu este afectată de mărimea eşantionului
Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de
experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea
dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus
şi greu de cuantificat (consum de alcool personalitate etc)
Principalele tipuri de erori din această categorie sunt
bull Biasul de selecţie
bull Biasul de informaţie
Biasul de selecţie
Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul
trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion
inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale
persoanelor incluse
Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se
ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia
Biasul de informaţie
Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de
instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze
expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere
nesemnificativă sau chiar să nu şi-o amintească de loc
3 Confuzia
Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune
prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este
cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă
de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte
important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor
protector
4 Validitatea
Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă
Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte
estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional
Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă
45
conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se
demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)
Validitatea externă se poate realiza numai dacă studiul este valid intern
Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii
studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de
studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt
laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi
validă din punct de vedere intern)
3 6 Prezentarea rezultatelor
După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite
Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor
icircntr-o formă bdquodigerabilărdquo este necesară
Scopul prezentării datelor
1 Transmiterea concluziilor studiului
a Datele corecte şi importante merită comunicate
b Datele trebuie să confirme sau să infirme ipoteza studiului
c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală
2 Acordarea posibilităţii altor cercetători să aprecieze studiul
a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti
b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor
prezentate
Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru
fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie
statistică
Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de
valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras
(Tabel 3)
Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)
46
Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct
numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor
precum şi prezentarea acestora sub formă inteligibilă
Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care
convin cercetătorului
Prezentarea datelor se poate face
1 Figuri şi tabele icircn articole scrise
2 Figuri şi tabele icircn prezentări orale
3 Figuri şi tabele icircn postere
4 Text scris sau incluse icircn text
5 Site-uri de WEB
Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor
Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie
Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele
exprimacircnd exact ceea ce acestea exprimă
Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate
anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel
să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se
acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca
mai sus sugestive sunt formatele simple şi puţin icircncărcate
Dacă nu există reguli impuse se respectă
1 Mesaj simplu fără falsificarea datelor
2 De obicei este necesar atacirct tabelul cacirct şi graficul
3 Să fie simplu şi clar
Tabele
Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile
coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică
elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de
1 Se folosesc doar linii orizontale
2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn
evidenţi prin linie de separare (Tabelul 4)
Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland
Noua Zeelandă)
(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)
47
3 Numerele sunt aliniate icircn funcţie de virgulă
4 Indicii statistici sunt explicaţi sub tabel
5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană
6 Abrevierile pot fi folosite
7 Numărul de zecimale trebuie limitat la maxim două
8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel
9 Plasarea legendei este obligatorie sub tabel
10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)
Icircn cazul prezentărilor orale sau a posterelor este indicat ca
1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării
2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte
3 Folosirea de simboluri este permisă
Clasificarea tabelelor
Tabelele se clasifică după
i) conţinut
bull cu distribuţii de frecvenţe
bull de clase de frecvenţe
bull de contingenţă
ii) structura
bull cu doua coloane
bull cu subclasificări
bull ldquomasterrdquo
Tabele ce conţin distribuţii de frecvenţe
O modalitate comodă de a prezenta o mulţime de date brute este
1 Se ordonează datele in ordine crescătoare
2 Se determine frecvenţa fiecărei valori
3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane
(Tabelul 5)
Tabelul 5 Distribuţii de frecvenţă absolută
48
Tabelul claselor de frecvenţe
1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă
2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)
Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)
Tabele de contingenţă
1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a
tabelelor de contingenţă
2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a
combinaţiilor de perechi ordonate de valori
3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre
a factor de risc si
b starea sănătăţii
4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)
5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)
Tabelul 7 Tabel de contingenţă 2 x 2
49
Grafice
Există două categorii de moduri grafice sub care se pot prezenta datele
1 Ilustraţii şi fotografii
2 Grafice
1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă
pentru lucrare
2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit
Putem vorbi despre mai multe tipuri de grafice
bull Grafice pentru reprezentarea datelor cantitative
1048707 Grafic cartezian (X Y)
1048707 Histograma
1048707 Poligonul de frecvenţe
1048707 Diagrama bdquoscatterrdquo
bull Grafice pentru reprezentarea datelor calitative
1048707 Grafic cu bare
1048707 Diagrama tip bdquoboxplotrdquo
1048707 Diagrama bdquopierdquo
1048707 Cartograma
Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi
dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)
Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)
Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie
Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)
Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)
50
Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir
de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele
două variabile studiate (Figura 6)
Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2
(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2
rămacircne aproximativ constantă)
Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea
comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea
comparativă a mai multor variabile
Figura 7 Grafic calitativ cu bare
51
Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo
Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două
posibilităţi reprezentate grafic este mai frecventă (Figura 8)
Figura 8 Reprezentare tip bdquopierdquo
Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli
sau a oricărui element comparativ Se foloseşte de epidemiologi
Rezultate
Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare
Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o
manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu
explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția
bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la
ilustraţii tabele grafice
Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi
nici rezultatele care invalidează eventual ipoteza
Discuţii
Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd
cultura ştiinţifică şi inteligenţa autorilor
Acest capitol răspunde la trei obiective
Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia
calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de
selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează
rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv
52
este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn
care a fost abordată problema fără a face o revistă a literaturii
Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea
rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul
Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor
afirmaţii nesusţinute de conţinutul lucrării
Concluzii
Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate
să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie
Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de
concluzii va scădea valoarea lucrării
Bibliografia (lista referinţelor citarea icircn text)
Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn
lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente
Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli
- să conţină cele mai importante şi recente lucrări
- să includă numai lucrări publicate
- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate
Bibliografie
Elisabeta Jaba ndash Statistică Ed Economică 1998
Mihai Ţarcă ndash Statistică volI Ed UAIC 1979
Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale
Ed University Press 2009
Sorana Daniela Bolboacă ndash Metodologia cercetării curs
53
5 9 10 10 9 7 6
Suma 35 40 45 55 30 35
Media 7 8 9 11 6 7
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 = (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
m=(7+8+9+11+6+7)6
m=8
(7-8)2+ (8-8)2+ (9-8)2+ (11-8)2+ (6-8)2+ (7-8)2 =
= (-1)2+ 02+ 12+ 32+ (-2)2+ (-1)2 = 1 + 0 + 1 + 9 + 4 = 16
Suma pătratelor (icircntre) = sum(media grupului ndash media generală)2timesN(numărul de grupuri)
Suma pătratelor (icircn) = sum(valoarea individuală ndash media grupului)2
F = (suma pătratelor(icircntre))(suma pătratelor(icircn))
Suma pătratelor (icircntre) = 16times5 = 80
Suma pătratelor (icircn) = (5-7)2+(6-7)2+(7-7)2+(8-7)2+(9-7)2++(9-7)2+(8-7)2+(7-7)2+(5-7)2+(6-7)2 = 60
Cu cacirct diferenţa dintre suma pătratelor icircntre grupuri este mai mare comparativ cu suma pătratelor icircn
interiorul fiecărui grup cu atacirct diferenţa icircntre grupurile investigate e mai mare
SP df Media pătratelor F = MPicircntreMPicircn
Icircntre 80 5 = 805 = 16 = 1625 = 64
Icircn 60 24 = 6024 = 25
Total 140 29 -
Testul sumei rangurilor Wilcoxon
Aplicat pentru
Un set de observaţii provenite dintr-o valoare ipotetică comună
Perechi de observaţii pe aceiaşi indivizi (icircnainte şi după)
Utilizat şi pentru a verifica dacă distribuţia diferenţelor are mediana egală sau nu cu zero
Medicaţia intraoculară determină modificarea semnificativă a bătăilor cardiace
Suma rangurilor pentru diferenţele negative = 2+3+1 = 6
Suma rangurilor pentru diferenţele pozitive = 5+4+6+8+7 = 30
33
Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului
egal cu 8 = 0109
Icircnainte După Diferenţa Rang
64 66 -2 2
66 58 8 5
67 68 -1 3
71 65 6 4
72 75 -3 1
76 67 9 6
78 59 19 8
89 74 15 7
Testul Kruskal-Wallis (ge 3 eşantioane independente)
Test de ranguri aplicate pe mai mult de 3 eşantioane
H = parametrul testului
n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)
Tk = suma rangurilor
Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie
pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni
34
df = k-1 (k = numărul de eşantioane)
df = 3-1 = 2
Hcritic(α=005) = 599
H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie
pozitivă şi respectiv biopsie negativă
Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie
a tipului de studiu pe eşantioane perechi)
1 Definirea numărului de tratamente k
2 Obţinerea rangurilor pentru fiecare tratament
3 Sumarea rangurilor fiecărui tratament
4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)
5 Dacă Fr gt Frcritic rarr respingem H0
Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost
măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi
n = 9 k = 3 T12 = 225 T2
2 = 38025 T32 = 38025
Frcritic = 599
Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de
prostată
35
De reţinut
Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei
Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-
of-Fit
Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z
Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t
Compararea mediilor a 3 sau mai multe eşantioane ANOVA
Compararea mediilor a două populaţii (σ) testul Z
Compararea mediilor a două eşantioane (s) testul t
Compararea mediilor a două eşantioane perechi (s) testul t
ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi
cu cel pentru compararea a două eşantioane perechi
Ranguri
Distribuţia datelor nu are importanţă
Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)
Trei sau mai multe eşantioane Kruskal-Wallis
Trei sau mai multe eşantioane perechi Friedman
Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia
Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a
datelor)
Variabile nominale
Un singur eşantion sau eşantioane perechi
Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte
Eşantioane perechi testul Mc Nemar
Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2
Icircn analiza proporţiilor există teste diferite pentru
Compararea unei frecvenţe cu o frecvenţă cunoscută
Compararea a două frecvenţe
Semnificaţia statistică
Valoarea p (p value)
Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor
două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E
posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării
aleatorii
36
Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală
urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii
Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este
probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un
experiment de dimensiunea acestuia
Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că
diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii
diferite
Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca
fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă
ar fi fost adevărată
Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă
1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe
baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De
fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001
2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie
3 Se aplică testul statistic aferent pentru a calcula valoarea p
4 Se compară valoarea p cu valoarea ndash prag
5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe
semnificativă dpdv statisticrdquo
6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e
semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să
conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă
Teste de semnificaţie
Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului
populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)
Testarea ipotezelor implică posibile erori
Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile
sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui
grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul
icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005
ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există
37
nici o diferenţă
Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ
statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de
ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost
ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau
dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă
cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă
semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe
ipotetice variate icircn cazul icircn care ele există
Măsuri ale frecvenţei
Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)
Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate
Generic formula pe care se bazează toate cele trei este
unde x şi y sunt cantităţile de comparat
Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea
unei frecvenţe pe grupe de sex vacircrstă etc
Proporţia implică icircn mod necesar ca x să fie inclus icircn y
Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară
frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp
Pentru calcularea unei rate trebuie ţinut cont de trei aspecte
bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin
bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp
bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo
Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un
tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei
populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei
aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)
38
Indicatori
Rata de incidenţă
Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă
icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii
Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o
perioadă de timp
Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de
timp x
Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei
susceptibili de a dezvolta icircmbolnăvirea studiată
Numitorul poate fi
bull Numărul mediu al populaţiei icircn perioada de timp studiată
bull Mărimea populaţiei icircn mijlocul perioadei de studiu
bull Mărimea populaţiei la icircnceputul studiului
Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă
Este obligatorie menţionarea perioadei de timp
Prevalenţa
Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la
un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă
schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa
momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)
39
Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include
numai cazuri noi respectiv include cazuri noi şi vechi
Rata de atac
Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este
folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp
raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori
Rata persoană-timp
Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din
momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte
migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost
observate
Riscul relativ (RR)
Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment
legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele
prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două
grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la
bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la
bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai
mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo
Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2
Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn
cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă
(Tabelul 1)
Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR
Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la
neexpuşi
40
Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de
culegere a datelor
Odds ratio (OR)
Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin
raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general
studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)
Tabelul 2 Tabelul 2 x 2 pentru calcularea OR
Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală
Rate de mortalitate
Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp
specificată Există mai multe tipuri de rate de mortalitate
o Mortalitate specifică pe sex
o Mortalitate specifică pe rasă
o Mortalitate specifică pe boală
o Mortalitate neonatală
o Mortalitate postneonatală
o Mortalitate infantilă
o Mortalitate maternă
Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP
41
Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de
viaţă şi vacircrsta la care survine decesul dacă este prematur
Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu
Ani de viaţă pierduţi datorat dizabilităţii
Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt
utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru
cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite
grupuri
Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de
risc şi o boală se folosesc riscul relativ şi odds ratio
35 Analiza şi interpretarea datelor
După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date
trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul
Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor
colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului
studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu
plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde
prezenţa biostatisticianului este necesară
Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu
elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat
iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului
iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate
depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori
testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere
clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza
Interpretarea rezultatelor statistice
Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne
motive (număr mic de date) acceptarea ei să fie falsă
Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine
gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia
ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument
de decizie Intervalul de confidenţă
42
Interpretarea statistica ne interpretarea clinică
Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă
Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice
obţinute pe eşantionul studiat
Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare
Ce interpretăm Rezultatele
personale obţinute icircn urma studiului
care au fost prezentate icircn secţiunea bdquoRezultaterdquo
Explicăm rezultatele obţinute
Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale
Interpretarea trebuie să se realizeze icircn
lumina limitelor studiului
contextul cultural social şi educaţional al locului unde s-a realizat cercetarea
contextul a ceea ce se cunoaşte din literatura de specialitate
Interpretăm doar rezultatele personale obţinute icircn urma studiului
Interpretarea statistică nu este tot una cu interpretarea clinică
Interpretarea statistică este importantă
Interpretarea clinică este foarte importantă
Intervalul de confidenţă
Media calculată pe baza unui eşantion nu va echivala media populaţiei
Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului
Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a
populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a
populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)
pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru
orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare
dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de
confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de
date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de
5
Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel
Dacă valoarea p este mică
Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare
aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o
medie diferită Diferenţa este semnificativă dpdv statistic
43
Icircn continuare
Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa
reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică
pentru a fi interesante din punct de vedere ştiinţific
Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC
oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care
este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a
obţine o concluzie clară
Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o
diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că
datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din
punct de vedere ştiinţific
Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul
detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat
Erorile studiilor medicale
Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura
anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară
caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea
asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri
legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias
Erorile potenţiale icircn studiile epidemiologice
1 Erori icircntacircmplătoare
2 Erori sistematice
3 Confuzia
4 Validitatea
1 Erori icircntacircmplătoare
Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a
parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel
de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot
fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii
(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor
de măsură (eroarea de măsurare)
44
2 Erori sistematice
Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate
care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu
acurateţe mare Acurateţea nu este afectată de mărimea eşantionului
Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de
experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea
dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus
şi greu de cuantificat (consum de alcool personalitate etc)
Principalele tipuri de erori din această categorie sunt
bull Biasul de selecţie
bull Biasul de informaţie
Biasul de selecţie
Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul
trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion
inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale
persoanelor incluse
Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se
ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia
Biasul de informaţie
Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de
instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze
expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere
nesemnificativă sau chiar să nu şi-o amintească de loc
3 Confuzia
Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune
prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este
cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă
de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte
important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor
protector
4 Validitatea
Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă
Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte
estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional
Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă
45
conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se
demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)
Validitatea externă se poate realiza numai dacă studiul este valid intern
Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii
studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de
studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt
laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi
validă din punct de vedere intern)
3 6 Prezentarea rezultatelor
După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite
Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor
icircntr-o formă bdquodigerabilărdquo este necesară
Scopul prezentării datelor
1 Transmiterea concluziilor studiului
a Datele corecte şi importante merită comunicate
b Datele trebuie să confirme sau să infirme ipoteza studiului
c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală
2 Acordarea posibilităţii altor cercetători să aprecieze studiul
a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti
b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor
prezentate
Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru
fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie
statistică
Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de
valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras
(Tabel 3)
Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)
46
Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct
numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor
precum şi prezentarea acestora sub formă inteligibilă
Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care
convin cercetătorului
Prezentarea datelor se poate face
1 Figuri şi tabele icircn articole scrise
2 Figuri şi tabele icircn prezentări orale
3 Figuri şi tabele icircn postere
4 Text scris sau incluse icircn text
5 Site-uri de WEB
Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor
Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie
Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele
exprimacircnd exact ceea ce acestea exprimă
Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate
anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel
să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se
acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca
mai sus sugestive sunt formatele simple şi puţin icircncărcate
Dacă nu există reguli impuse se respectă
1 Mesaj simplu fără falsificarea datelor
2 De obicei este necesar atacirct tabelul cacirct şi graficul
3 Să fie simplu şi clar
Tabele
Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile
coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică
elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de
1 Se folosesc doar linii orizontale
2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn
evidenţi prin linie de separare (Tabelul 4)
Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland
Noua Zeelandă)
(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)
47
3 Numerele sunt aliniate icircn funcţie de virgulă
4 Indicii statistici sunt explicaţi sub tabel
5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană
6 Abrevierile pot fi folosite
7 Numărul de zecimale trebuie limitat la maxim două
8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel
9 Plasarea legendei este obligatorie sub tabel
10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)
Icircn cazul prezentărilor orale sau a posterelor este indicat ca
1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării
2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte
3 Folosirea de simboluri este permisă
Clasificarea tabelelor
Tabelele se clasifică după
i) conţinut
bull cu distribuţii de frecvenţe
bull de clase de frecvenţe
bull de contingenţă
ii) structura
bull cu doua coloane
bull cu subclasificări
bull ldquomasterrdquo
Tabele ce conţin distribuţii de frecvenţe
O modalitate comodă de a prezenta o mulţime de date brute este
1 Se ordonează datele in ordine crescătoare
2 Se determine frecvenţa fiecărei valori
3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane
(Tabelul 5)
Tabelul 5 Distribuţii de frecvenţă absolută
48
Tabelul claselor de frecvenţe
1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă
2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)
Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)
Tabele de contingenţă
1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a
tabelelor de contingenţă
2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a
combinaţiilor de perechi ordonate de valori
3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre
a factor de risc si
b starea sănătăţii
4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)
5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)
Tabelul 7 Tabel de contingenţă 2 x 2
49
Grafice
Există două categorii de moduri grafice sub care se pot prezenta datele
1 Ilustraţii şi fotografii
2 Grafice
1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă
pentru lucrare
2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit
Putem vorbi despre mai multe tipuri de grafice
bull Grafice pentru reprezentarea datelor cantitative
1048707 Grafic cartezian (X Y)
1048707 Histograma
1048707 Poligonul de frecvenţe
1048707 Diagrama bdquoscatterrdquo
bull Grafice pentru reprezentarea datelor calitative
1048707 Grafic cu bare
1048707 Diagrama tip bdquoboxplotrdquo
1048707 Diagrama bdquopierdquo
1048707 Cartograma
Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi
dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)
Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)
Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie
Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)
Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)
50
Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir
de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele
două variabile studiate (Figura 6)
Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2
(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2
rămacircne aproximativ constantă)
Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea
comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea
comparativă a mai multor variabile
Figura 7 Grafic calitativ cu bare
51
Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo
Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două
posibilităţi reprezentate grafic este mai frecventă (Figura 8)
Figura 8 Reprezentare tip bdquopierdquo
Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli
sau a oricărui element comparativ Se foloseşte de epidemiologi
Rezultate
Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare
Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o
manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu
explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția
bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la
ilustraţii tabele grafice
Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi
nici rezultatele care invalidează eventual ipoteza
Discuţii
Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd
cultura ştiinţifică şi inteligenţa autorilor
Acest capitol răspunde la trei obiective
Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia
calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de
selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează
rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv
52
este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn
care a fost abordată problema fără a face o revistă a literaturii
Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea
rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul
Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor
afirmaţii nesusţinute de conţinutul lucrării
Concluzii
Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate
să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie
Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de
concluzii va scădea valoarea lucrării
Bibliografia (lista referinţelor citarea icircn text)
Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn
lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente
Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli
- să conţină cele mai importante şi recente lucrări
- să includă numai lucrări publicate
- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate
Bibliografie
Elisabeta Jaba ndash Statistică Ed Economică 1998
Mihai Ţarcă ndash Statistică volI Ed UAIC 1979
Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale
Ed University Press 2009
Sorana Daniela Bolboacă ndash Metodologia cercetării curs
53
Probabilitatea asociată intersecţiei dintre suma rangurilor negative egală cu 6 cu volumul eşantionului
egal cu 8 = 0109
Icircnainte După Diferenţa Rang
64 66 -2 2
66 58 8 5
67 68 -1 3
71 65 6 4
72 75 -3 1
76 67 9 6
78 59 19 8
89 74 15 7
Testul Kruskal-Wallis (ge 3 eşantioane independente)
Test de ranguri aplicate pe mai mult de 3 eşantioane
H = parametrul testului
n = suma volumelor eşantioanelor studiate (n1 n2 n3 nk)
Tk = suma rangurilor
Valoarea antigenului prostatic este diferită la pacienţii cu hipertrofie prostatică benignă biopsie
pozitivă pentru cancer prostatic biopsie negativă la pacienţi indemni
34
df = k-1 (k = numărul de eşantioane)
df = 3-1 = 2
Hcritic(α=005) = 599
H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie
pozitivă şi respectiv biopsie negativă
Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie
a tipului de studiu pe eşantioane perechi)
1 Definirea numărului de tratamente k
2 Obţinerea rangurilor pentru fiecare tratament
3 Sumarea rangurilor fiecărui tratament
4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)
5 Dacă Fr gt Frcritic rarr respingem H0
Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost
măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi
n = 9 k = 3 T12 = 225 T2
2 = 38025 T32 = 38025
Frcritic = 599
Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de
prostată
35
De reţinut
Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei
Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-
of-Fit
Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z
Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t
Compararea mediilor a 3 sau mai multe eşantioane ANOVA
Compararea mediilor a două populaţii (σ) testul Z
Compararea mediilor a două eşantioane (s) testul t
Compararea mediilor a două eşantioane perechi (s) testul t
ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi
cu cel pentru compararea a două eşantioane perechi
Ranguri
Distribuţia datelor nu are importanţă
Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)
Trei sau mai multe eşantioane Kruskal-Wallis
Trei sau mai multe eşantioane perechi Friedman
Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia
Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a
datelor)
Variabile nominale
Un singur eşantion sau eşantioane perechi
Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte
Eşantioane perechi testul Mc Nemar
Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2
Icircn analiza proporţiilor există teste diferite pentru
Compararea unei frecvenţe cu o frecvenţă cunoscută
Compararea a două frecvenţe
Semnificaţia statistică
Valoarea p (p value)
Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor
două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E
posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării
aleatorii
36
Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală
urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii
Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este
probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un
experiment de dimensiunea acestuia
Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că
diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii
diferite
Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca
fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă
ar fi fost adevărată
Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă
1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe
baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De
fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001
2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie
3 Se aplică testul statistic aferent pentru a calcula valoarea p
4 Se compară valoarea p cu valoarea ndash prag
5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe
semnificativă dpdv statisticrdquo
6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e
semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să
conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă
Teste de semnificaţie
Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului
populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)
Testarea ipotezelor implică posibile erori
Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile
sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui
grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul
icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005
ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există
37
nici o diferenţă
Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ
statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de
ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost
ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau
dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă
cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă
semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe
ipotetice variate icircn cazul icircn care ele există
Măsuri ale frecvenţei
Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)
Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate
Generic formula pe care se bazează toate cele trei este
unde x şi y sunt cantităţile de comparat
Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea
unei frecvenţe pe grupe de sex vacircrstă etc
Proporţia implică icircn mod necesar ca x să fie inclus icircn y
Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară
frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp
Pentru calcularea unei rate trebuie ţinut cont de trei aspecte
bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin
bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp
bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo
Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un
tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei
populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei
aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)
38
Indicatori
Rata de incidenţă
Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă
icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii
Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o
perioadă de timp
Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de
timp x
Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei
susceptibili de a dezvolta icircmbolnăvirea studiată
Numitorul poate fi
bull Numărul mediu al populaţiei icircn perioada de timp studiată
bull Mărimea populaţiei icircn mijlocul perioadei de studiu
bull Mărimea populaţiei la icircnceputul studiului
Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă
Este obligatorie menţionarea perioadei de timp
Prevalenţa
Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la
un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă
schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa
momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)
39
Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include
numai cazuri noi respectiv include cazuri noi şi vechi
Rata de atac
Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este
folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp
raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori
Rata persoană-timp
Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din
momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte
migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost
observate
Riscul relativ (RR)
Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment
legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele
prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două
grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la
bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la
bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai
mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo
Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2
Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn
cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă
(Tabelul 1)
Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR
Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la
neexpuşi
40
Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de
culegere a datelor
Odds ratio (OR)
Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin
raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general
studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)
Tabelul 2 Tabelul 2 x 2 pentru calcularea OR
Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală
Rate de mortalitate
Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp
specificată Există mai multe tipuri de rate de mortalitate
o Mortalitate specifică pe sex
o Mortalitate specifică pe rasă
o Mortalitate specifică pe boală
o Mortalitate neonatală
o Mortalitate postneonatală
o Mortalitate infantilă
o Mortalitate maternă
Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP
41
Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de
viaţă şi vacircrsta la care survine decesul dacă este prematur
Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu
Ani de viaţă pierduţi datorat dizabilităţii
Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt
utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru
cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite
grupuri
Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de
risc şi o boală se folosesc riscul relativ şi odds ratio
35 Analiza şi interpretarea datelor
După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date
trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul
Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor
colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului
studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu
plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde
prezenţa biostatisticianului este necesară
Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu
elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat
iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului
iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate
depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori
testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere
clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza
Interpretarea rezultatelor statistice
Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne
motive (număr mic de date) acceptarea ei să fie falsă
Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine
gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia
ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument
de decizie Intervalul de confidenţă
42
Interpretarea statistica ne interpretarea clinică
Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă
Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice
obţinute pe eşantionul studiat
Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare
Ce interpretăm Rezultatele
personale obţinute icircn urma studiului
care au fost prezentate icircn secţiunea bdquoRezultaterdquo
Explicăm rezultatele obţinute
Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale
Interpretarea trebuie să se realizeze icircn
lumina limitelor studiului
contextul cultural social şi educaţional al locului unde s-a realizat cercetarea
contextul a ceea ce se cunoaşte din literatura de specialitate
Interpretăm doar rezultatele personale obţinute icircn urma studiului
Interpretarea statistică nu este tot una cu interpretarea clinică
Interpretarea statistică este importantă
Interpretarea clinică este foarte importantă
Intervalul de confidenţă
Media calculată pe baza unui eşantion nu va echivala media populaţiei
Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului
Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a
populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a
populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)
pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru
orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare
dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de
confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de
date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de
5
Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel
Dacă valoarea p este mică
Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare
aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o
medie diferită Diferenţa este semnificativă dpdv statistic
43
Icircn continuare
Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa
reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică
pentru a fi interesante din punct de vedere ştiinţific
Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC
oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care
este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a
obţine o concluzie clară
Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o
diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că
datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din
punct de vedere ştiinţific
Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul
detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat
Erorile studiilor medicale
Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura
anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară
caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea
asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri
legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias
Erorile potenţiale icircn studiile epidemiologice
1 Erori icircntacircmplătoare
2 Erori sistematice
3 Confuzia
4 Validitatea
1 Erori icircntacircmplătoare
Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a
parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel
de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot
fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii
(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor
de măsură (eroarea de măsurare)
44
2 Erori sistematice
Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate
care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu
acurateţe mare Acurateţea nu este afectată de mărimea eşantionului
Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de
experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea
dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus
şi greu de cuantificat (consum de alcool personalitate etc)
Principalele tipuri de erori din această categorie sunt
bull Biasul de selecţie
bull Biasul de informaţie
Biasul de selecţie
Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul
trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion
inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale
persoanelor incluse
Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se
ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia
Biasul de informaţie
Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de
instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze
expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere
nesemnificativă sau chiar să nu şi-o amintească de loc
3 Confuzia
Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune
prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este
cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă
de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte
important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor
protector
4 Validitatea
Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă
Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte
estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional
Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă
45
conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se
demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)
Validitatea externă se poate realiza numai dacă studiul este valid intern
Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii
studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de
studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt
laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi
validă din punct de vedere intern)
3 6 Prezentarea rezultatelor
După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite
Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor
icircntr-o formă bdquodigerabilărdquo este necesară
Scopul prezentării datelor
1 Transmiterea concluziilor studiului
a Datele corecte şi importante merită comunicate
b Datele trebuie să confirme sau să infirme ipoteza studiului
c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală
2 Acordarea posibilităţii altor cercetători să aprecieze studiul
a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti
b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor
prezentate
Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru
fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie
statistică
Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de
valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras
(Tabel 3)
Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)
46
Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct
numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor
precum şi prezentarea acestora sub formă inteligibilă
Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care
convin cercetătorului
Prezentarea datelor se poate face
1 Figuri şi tabele icircn articole scrise
2 Figuri şi tabele icircn prezentări orale
3 Figuri şi tabele icircn postere
4 Text scris sau incluse icircn text
5 Site-uri de WEB
Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor
Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie
Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele
exprimacircnd exact ceea ce acestea exprimă
Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate
anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel
să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se
acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca
mai sus sugestive sunt formatele simple şi puţin icircncărcate
Dacă nu există reguli impuse se respectă
1 Mesaj simplu fără falsificarea datelor
2 De obicei este necesar atacirct tabelul cacirct şi graficul
3 Să fie simplu şi clar
Tabele
Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile
coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică
elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de
1 Se folosesc doar linii orizontale
2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn
evidenţi prin linie de separare (Tabelul 4)
Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland
Noua Zeelandă)
(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)
47
3 Numerele sunt aliniate icircn funcţie de virgulă
4 Indicii statistici sunt explicaţi sub tabel
5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană
6 Abrevierile pot fi folosite
7 Numărul de zecimale trebuie limitat la maxim două
8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel
9 Plasarea legendei este obligatorie sub tabel
10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)
Icircn cazul prezentărilor orale sau a posterelor este indicat ca
1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării
2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte
3 Folosirea de simboluri este permisă
Clasificarea tabelelor
Tabelele se clasifică după
i) conţinut
bull cu distribuţii de frecvenţe
bull de clase de frecvenţe
bull de contingenţă
ii) structura
bull cu doua coloane
bull cu subclasificări
bull ldquomasterrdquo
Tabele ce conţin distribuţii de frecvenţe
O modalitate comodă de a prezenta o mulţime de date brute este
1 Se ordonează datele in ordine crescătoare
2 Se determine frecvenţa fiecărei valori
3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane
(Tabelul 5)
Tabelul 5 Distribuţii de frecvenţă absolută
48
Tabelul claselor de frecvenţe
1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă
2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)
Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)
Tabele de contingenţă
1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a
tabelelor de contingenţă
2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a
combinaţiilor de perechi ordonate de valori
3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre
a factor de risc si
b starea sănătăţii
4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)
5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)
Tabelul 7 Tabel de contingenţă 2 x 2
49
Grafice
Există două categorii de moduri grafice sub care se pot prezenta datele
1 Ilustraţii şi fotografii
2 Grafice
1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă
pentru lucrare
2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit
Putem vorbi despre mai multe tipuri de grafice
bull Grafice pentru reprezentarea datelor cantitative
1048707 Grafic cartezian (X Y)
1048707 Histograma
1048707 Poligonul de frecvenţe
1048707 Diagrama bdquoscatterrdquo
bull Grafice pentru reprezentarea datelor calitative
1048707 Grafic cu bare
1048707 Diagrama tip bdquoboxplotrdquo
1048707 Diagrama bdquopierdquo
1048707 Cartograma
Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi
dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)
Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)
Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie
Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)
Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)
50
Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir
de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele
două variabile studiate (Figura 6)
Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2
(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2
rămacircne aproximativ constantă)
Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea
comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea
comparativă a mai multor variabile
Figura 7 Grafic calitativ cu bare
51
Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo
Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două
posibilităţi reprezentate grafic este mai frecventă (Figura 8)
Figura 8 Reprezentare tip bdquopierdquo
Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli
sau a oricărui element comparativ Se foloseşte de epidemiologi
Rezultate
Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare
Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o
manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu
explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția
bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la
ilustraţii tabele grafice
Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi
nici rezultatele care invalidează eventual ipoteza
Discuţii
Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd
cultura ştiinţifică şi inteligenţa autorilor
Acest capitol răspunde la trei obiective
Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia
calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de
selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează
rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv
52
este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn
care a fost abordată problema fără a face o revistă a literaturii
Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea
rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul
Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor
afirmaţii nesusţinute de conţinutul lucrării
Concluzii
Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate
să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie
Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de
concluzii va scădea valoarea lucrării
Bibliografia (lista referinţelor citarea icircn text)
Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn
lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente
Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli
- să conţină cele mai importante şi recente lucrări
- să includă numai lucrări publicate
- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate
Bibliografie
Elisabeta Jaba ndash Statistică Ed Economică 1998
Mihai Ţarcă ndash Statistică volI Ed UAIC 1979
Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale
Ed University Press 2009
Sorana Daniela Bolboacă ndash Metodologia cercetării curs
53
df = k-1 (k = numărul de eşantioane)
df = 3-1 = 2
Hcritic(α=005) = 599
H = 853 gt 599 rarr nivelul PSA este diferit la pacienţi cu hipertrofie prostatică benignă biopsie
pozitivă şi respectiv biopsie negativă
Design randomizat de tip bloc trei sau mai multe tratamente sunt aplicate aceluiaşi eşantion (extensie
a tipului de studiu pe eşantioane perechi)
1 Definirea numărului de tratamente k
2 Obţinerea rangurilor pentru fiecare tratament
3 Sumarea rangurilor fiecărui tratament
4 Calcularea parametrului FRIEDMAN (urmează o distribuţie χ2)
5 Dacă Fr gt Frcritic rarr respingem H0
Antigenul prostatic rămacircne neschimbat post-terapeutic icircn cancerul de prostată PSA a fost
măsurat trei ani consecutiv după tratamentul cancerului de prostată la un eşantion de 9 pacienţi
n = 9 k = 3 T12 = 225 T2
2 = 38025 T32 = 38025
Frcritic = 599
Fr lt Frcritic rarr nivelul PSA nu creşte icircn primii 3 ani după intervenţia asupra cancerului de
prostată
35
De reţinut
Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei
Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-
of-Fit
Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z
Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t
Compararea mediilor a 3 sau mai multe eşantioane ANOVA
Compararea mediilor a două populaţii (σ) testul Z
Compararea mediilor a două eşantioane (s) testul t
Compararea mediilor a două eşantioane perechi (s) testul t
ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi
cu cel pentru compararea a două eşantioane perechi
Ranguri
Distribuţia datelor nu are importanţă
Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)
Trei sau mai multe eşantioane Kruskal-Wallis
Trei sau mai multe eşantioane perechi Friedman
Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia
Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a
datelor)
Variabile nominale
Un singur eşantion sau eşantioane perechi
Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte
Eşantioane perechi testul Mc Nemar
Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2
Icircn analiza proporţiilor există teste diferite pentru
Compararea unei frecvenţe cu o frecvenţă cunoscută
Compararea a două frecvenţe
Semnificaţia statistică
Valoarea p (p value)
Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor
două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E
posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării
aleatorii
36
Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală
urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii
Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este
probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un
experiment de dimensiunea acestuia
Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că
diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii
diferite
Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca
fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă
ar fi fost adevărată
Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă
1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe
baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De
fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001
2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie
3 Se aplică testul statistic aferent pentru a calcula valoarea p
4 Se compară valoarea p cu valoarea ndash prag
5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe
semnificativă dpdv statisticrdquo
6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e
semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să
conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă
Teste de semnificaţie
Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului
populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)
Testarea ipotezelor implică posibile erori
Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile
sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui
grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul
icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005
ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există
37
nici o diferenţă
Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ
statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de
ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost
ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau
dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă
cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă
semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe
ipotetice variate icircn cazul icircn care ele există
Măsuri ale frecvenţei
Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)
Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate
Generic formula pe care se bazează toate cele trei este
unde x şi y sunt cantităţile de comparat
Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea
unei frecvenţe pe grupe de sex vacircrstă etc
Proporţia implică icircn mod necesar ca x să fie inclus icircn y
Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară
frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp
Pentru calcularea unei rate trebuie ţinut cont de trei aspecte
bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin
bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp
bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo
Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un
tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei
populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei
aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)
38
Indicatori
Rata de incidenţă
Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă
icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii
Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o
perioadă de timp
Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de
timp x
Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei
susceptibili de a dezvolta icircmbolnăvirea studiată
Numitorul poate fi
bull Numărul mediu al populaţiei icircn perioada de timp studiată
bull Mărimea populaţiei icircn mijlocul perioadei de studiu
bull Mărimea populaţiei la icircnceputul studiului
Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă
Este obligatorie menţionarea perioadei de timp
Prevalenţa
Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la
un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă
schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa
momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)
39
Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include
numai cazuri noi respectiv include cazuri noi şi vechi
Rata de atac
Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este
folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp
raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori
Rata persoană-timp
Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din
momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte
migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost
observate
Riscul relativ (RR)
Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment
legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele
prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două
grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la
bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la
bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai
mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo
Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2
Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn
cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă
(Tabelul 1)
Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR
Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la
neexpuşi
40
Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de
culegere a datelor
Odds ratio (OR)
Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin
raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general
studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)
Tabelul 2 Tabelul 2 x 2 pentru calcularea OR
Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală
Rate de mortalitate
Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp
specificată Există mai multe tipuri de rate de mortalitate
o Mortalitate specifică pe sex
o Mortalitate specifică pe rasă
o Mortalitate specifică pe boală
o Mortalitate neonatală
o Mortalitate postneonatală
o Mortalitate infantilă
o Mortalitate maternă
Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP
41
Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de
viaţă şi vacircrsta la care survine decesul dacă este prematur
Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu
Ani de viaţă pierduţi datorat dizabilităţii
Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt
utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru
cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite
grupuri
Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de
risc şi o boală se folosesc riscul relativ şi odds ratio
35 Analiza şi interpretarea datelor
După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date
trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul
Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor
colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului
studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu
plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde
prezenţa biostatisticianului este necesară
Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu
elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat
iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului
iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate
depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori
testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere
clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza
Interpretarea rezultatelor statistice
Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne
motive (număr mic de date) acceptarea ei să fie falsă
Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine
gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia
ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument
de decizie Intervalul de confidenţă
42
Interpretarea statistica ne interpretarea clinică
Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă
Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice
obţinute pe eşantionul studiat
Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare
Ce interpretăm Rezultatele
personale obţinute icircn urma studiului
care au fost prezentate icircn secţiunea bdquoRezultaterdquo
Explicăm rezultatele obţinute
Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale
Interpretarea trebuie să se realizeze icircn
lumina limitelor studiului
contextul cultural social şi educaţional al locului unde s-a realizat cercetarea
contextul a ceea ce se cunoaşte din literatura de specialitate
Interpretăm doar rezultatele personale obţinute icircn urma studiului
Interpretarea statistică nu este tot una cu interpretarea clinică
Interpretarea statistică este importantă
Interpretarea clinică este foarte importantă
Intervalul de confidenţă
Media calculată pe baza unui eşantion nu va echivala media populaţiei
Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului
Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a
populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a
populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)
pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru
orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare
dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de
confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de
date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de
5
Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel
Dacă valoarea p este mică
Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare
aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o
medie diferită Diferenţa este semnificativă dpdv statistic
43
Icircn continuare
Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa
reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică
pentru a fi interesante din punct de vedere ştiinţific
Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC
oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care
este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a
obţine o concluzie clară
Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o
diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că
datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din
punct de vedere ştiinţific
Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul
detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat
Erorile studiilor medicale
Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura
anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară
caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea
asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri
legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias
Erorile potenţiale icircn studiile epidemiologice
1 Erori icircntacircmplătoare
2 Erori sistematice
3 Confuzia
4 Validitatea
1 Erori icircntacircmplătoare
Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a
parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel
de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot
fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii
(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor
de măsură (eroarea de măsurare)
44
2 Erori sistematice
Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate
care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu
acurateţe mare Acurateţea nu este afectată de mărimea eşantionului
Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de
experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea
dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus
şi greu de cuantificat (consum de alcool personalitate etc)
Principalele tipuri de erori din această categorie sunt
bull Biasul de selecţie
bull Biasul de informaţie
Biasul de selecţie
Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul
trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion
inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale
persoanelor incluse
Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se
ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia
Biasul de informaţie
Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de
instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze
expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere
nesemnificativă sau chiar să nu şi-o amintească de loc
3 Confuzia
Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune
prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este
cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă
de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte
important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor
protector
4 Validitatea
Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă
Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte
estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional
Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă
45
conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se
demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)
Validitatea externă se poate realiza numai dacă studiul este valid intern
Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii
studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de
studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt
laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi
validă din punct de vedere intern)
3 6 Prezentarea rezultatelor
După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite
Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor
icircntr-o formă bdquodigerabilărdquo este necesară
Scopul prezentării datelor
1 Transmiterea concluziilor studiului
a Datele corecte şi importante merită comunicate
b Datele trebuie să confirme sau să infirme ipoteza studiului
c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală
2 Acordarea posibilităţii altor cercetători să aprecieze studiul
a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti
b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor
prezentate
Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru
fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie
statistică
Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de
valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras
(Tabel 3)
Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)
46
Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct
numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor
precum şi prezentarea acestora sub formă inteligibilă
Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care
convin cercetătorului
Prezentarea datelor se poate face
1 Figuri şi tabele icircn articole scrise
2 Figuri şi tabele icircn prezentări orale
3 Figuri şi tabele icircn postere
4 Text scris sau incluse icircn text
5 Site-uri de WEB
Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor
Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie
Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele
exprimacircnd exact ceea ce acestea exprimă
Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate
anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel
să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se
acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca
mai sus sugestive sunt formatele simple şi puţin icircncărcate
Dacă nu există reguli impuse se respectă
1 Mesaj simplu fără falsificarea datelor
2 De obicei este necesar atacirct tabelul cacirct şi graficul
3 Să fie simplu şi clar
Tabele
Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile
coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică
elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de
1 Se folosesc doar linii orizontale
2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn
evidenţi prin linie de separare (Tabelul 4)
Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland
Noua Zeelandă)
(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)
47
3 Numerele sunt aliniate icircn funcţie de virgulă
4 Indicii statistici sunt explicaţi sub tabel
5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană
6 Abrevierile pot fi folosite
7 Numărul de zecimale trebuie limitat la maxim două
8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel
9 Plasarea legendei este obligatorie sub tabel
10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)
Icircn cazul prezentărilor orale sau a posterelor este indicat ca
1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării
2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte
3 Folosirea de simboluri este permisă
Clasificarea tabelelor
Tabelele se clasifică după
i) conţinut
bull cu distribuţii de frecvenţe
bull de clase de frecvenţe
bull de contingenţă
ii) structura
bull cu doua coloane
bull cu subclasificări
bull ldquomasterrdquo
Tabele ce conţin distribuţii de frecvenţe
O modalitate comodă de a prezenta o mulţime de date brute este
1 Se ordonează datele in ordine crescătoare
2 Se determine frecvenţa fiecărei valori
3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane
(Tabelul 5)
Tabelul 5 Distribuţii de frecvenţă absolută
48
Tabelul claselor de frecvenţe
1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă
2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)
Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)
Tabele de contingenţă
1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a
tabelelor de contingenţă
2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a
combinaţiilor de perechi ordonate de valori
3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre
a factor de risc si
b starea sănătăţii
4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)
5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)
Tabelul 7 Tabel de contingenţă 2 x 2
49
Grafice
Există două categorii de moduri grafice sub care se pot prezenta datele
1 Ilustraţii şi fotografii
2 Grafice
1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă
pentru lucrare
2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit
Putem vorbi despre mai multe tipuri de grafice
bull Grafice pentru reprezentarea datelor cantitative
1048707 Grafic cartezian (X Y)
1048707 Histograma
1048707 Poligonul de frecvenţe
1048707 Diagrama bdquoscatterrdquo
bull Grafice pentru reprezentarea datelor calitative
1048707 Grafic cu bare
1048707 Diagrama tip bdquoboxplotrdquo
1048707 Diagrama bdquopierdquo
1048707 Cartograma
Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi
dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)
Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)
Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie
Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)
Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)
50
Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir
de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele
două variabile studiate (Figura 6)
Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2
(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2
rămacircne aproximativ constantă)
Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea
comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea
comparativă a mai multor variabile
Figura 7 Grafic calitativ cu bare
51
Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo
Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două
posibilităţi reprezentate grafic este mai frecventă (Figura 8)
Figura 8 Reprezentare tip bdquopierdquo
Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli
sau a oricărui element comparativ Se foloseşte de epidemiologi
Rezultate
Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare
Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o
manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu
explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția
bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la
ilustraţii tabele grafice
Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi
nici rezultatele care invalidează eventual ipoteza
Discuţii
Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd
cultura ştiinţifică şi inteligenţa autorilor
Acest capitol răspunde la trei obiective
Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia
calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de
selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează
rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv
52
este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn
care a fost abordată problema fără a face o revistă a literaturii
Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea
rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul
Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor
afirmaţii nesusţinute de conţinutul lucrării
Concluzii
Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate
să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie
Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de
concluzii va scădea valoarea lucrării
Bibliografia (lista referinţelor citarea icircn text)
Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn
lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente
Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli
- să conţină cele mai importante şi recente lucrări
- să includă numai lucrări publicate
- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate
Bibliografie
Elisabeta Jaba ndash Statistică Ed Economică 1998
Mihai Ţarcă ndash Statistică volI Ed UAIC 1979
Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale
Ed University Press 2009
Sorana Daniela Bolboacă ndash Metodologia cercetării curs
53
De reţinut
Dacă variabilele sunt cantitative continue se verifică iniţial normalitatea distribuţiei
Teste de normalitate Shapiro-Wilk Kolmogorov-Smirnov Shapiro-Wilk Chi-Square Goodness-
of-Fit
Compararea mediei unui eşantion cu media unei populaţii (σ) testul Z
Compararea mediei unui eşantion cu media o medie cunoscută (s) testul t
Compararea mediilor a 3 sau mai multe eşantioane ANOVA
Compararea mediilor a două populaţii (σ) testul Z
Compararea mediilor a două eşantioane (s) testul t
Compararea mediilor a două eşantioane perechi (s) testul t
ATENŢIE Parametrul testului pentru compararea mediilor a două eşantioane nu este acelaşi
cu cel pentru compararea a două eşantioane perechi
Ranguri
Distribuţia datelor nu are importanţă
Un eşantion sau eşantioane perechi testul sumei rangurilor (Wilcoxon)
Trei sau mai multe eşantioane Kruskal-Wallis
Trei sau mai multe eşantioane perechi Friedman
Aplicarea unui test statistic trebuie făcută icircn conformitate cu condiţiile acestuia
Pe variabile calitative se aplică teste non-parametrice (nu necesită asumpţia distribuţiei normale a
datelor)
Variabile nominale
Un singur eşantion sau eşantioane perechi
Tabelul de contingenţă cu parametrii de tip raţii şi rapoarte
Eşantioane perechi testul Mc Nemar
Două eşantioane realizarea tabelului de contingenţă 2times2 şi aplicarea testului Fisher sau χ2
Icircn analiza proporţiilor există teste diferite pentru
Compararea unei frecvenţe cu o frecvenţă cunoscută
Compararea a două frecvenţe
Semnificaţia statistică
Valoarea p (p value)
Să presupunem colectarea de date din două eşantioane şi că mediile acestora sunt diferite Observarea celor
două medii diferite nu este suficientă pentru a ne convinge să concluzionăm că populaţiile au medii diferite E
posibil ca populaţiile să aibă aceeaşi medie iar diferenţa observată să fie o coincidenţă icircn urma eşantionării
aleatorii
36
Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală
urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii
Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este
probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un
experiment de dimensiunea acestuia
Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că
diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii
diferite
Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca
fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă
ar fi fost adevărată
Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă
1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe
baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De
fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001
2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie
3 Se aplică testul statistic aferent pentru a calcula valoarea p
4 Se compară valoarea p cu valoarea ndash prag
5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe
semnificativă dpdv statisticrdquo
6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e
semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să
conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă
Teste de semnificaţie
Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului
populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)
Testarea ipotezelor implică posibile erori
Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile
sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui
grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul
icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005
ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există
37
nici o diferenţă
Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ
statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de
ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost
ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau
dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă
cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă
semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe
ipotetice variate icircn cazul icircn care ele există
Măsuri ale frecvenţei
Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)
Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate
Generic formula pe care se bazează toate cele trei este
unde x şi y sunt cantităţile de comparat
Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea
unei frecvenţe pe grupe de sex vacircrstă etc
Proporţia implică icircn mod necesar ca x să fie inclus icircn y
Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară
frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp
Pentru calcularea unei rate trebuie ţinut cont de trei aspecte
bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin
bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp
bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo
Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un
tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei
populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei
aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)
38
Indicatori
Rata de incidenţă
Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă
icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii
Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o
perioadă de timp
Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de
timp x
Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei
susceptibili de a dezvolta icircmbolnăvirea studiată
Numitorul poate fi
bull Numărul mediu al populaţiei icircn perioada de timp studiată
bull Mărimea populaţiei icircn mijlocul perioadei de studiu
bull Mărimea populaţiei la icircnceputul studiului
Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă
Este obligatorie menţionarea perioadei de timp
Prevalenţa
Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la
un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă
schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa
momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)
39
Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include
numai cazuri noi respectiv include cazuri noi şi vechi
Rata de atac
Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este
folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp
raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori
Rata persoană-timp
Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din
momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte
migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost
observate
Riscul relativ (RR)
Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment
legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele
prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două
grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la
bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la
bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai
mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo
Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2
Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn
cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă
(Tabelul 1)
Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR
Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la
neexpuşi
40
Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de
culegere a datelor
Odds ratio (OR)
Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin
raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general
studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)
Tabelul 2 Tabelul 2 x 2 pentru calcularea OR
Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală
Rate de mortalitate
Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp
specificată Există mai multe tipuri de rate de mortalitate
o Mortalitate specifică pe sex
o Mortalitate specifică pe rasă
o Mortalitate specifică pe boală
o Mortalitate neonatală
o Mortalitate postneonatală
o Mortalitate infantilă
o Mortalitate maternă
Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP
41
Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de
viaţă şi vacircrsta la care survine decesul dacă este prematur
Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu
Ani de viaţă pierduţi datorat dizabilităţii
Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt
utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru
cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite
grupuri
Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de
risc şi o boală se folosesc riscul relativ şi odds ratio
35 Analiza şi interpretarea datelor
După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date
trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul
Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor
colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului
studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu
plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde
prezenţa biostatisticianului este necesară
Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu
elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat
iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului
iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate
depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori
testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere
clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza
Interpretarea rezultatelor statistice
Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne
motive (număr mic de date) acceptarea ei să fie falsă
Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine
gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia
ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument
de decizie Intervalul de confidenţă
42
Interpretarea statistica ne interpretarea clinică
Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă
Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice
obţinute pe eşantionul studiat
Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare
Ce interpretăm Rezultatele
personale obţinute icircn urma studiului
care au fost prezentate icircn secţiunea bdquoRezultaterdquo
Explicăm rezultatele obţinute
Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale
Interpretarea trebuie să se realizeze icircn
lumina limitelor studiului
contextul cultural social şi educaţional al locului unde s-a realizat cercetarea
contextul a ceea ce se cunoaşte din literatura de specialitate
Interpretăm doar rezultatele personale obţinute icircn urma studiului
Interpretarea statistică nu este tot una cu interpretarea clinică
Interpretarea statistică este importantă
Interpretarea clinică este foarte importantă
Intervalul de confidenţă
Media calculată pe baza unui eşantion nu va echivala media populaţiei
Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului
Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a
populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a
populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)
pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru
orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare
dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de
confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de
date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de
5
Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel
Dacă valoarea p este mică
Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare
aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o
medie diferită Diferenţa este semnificativă dpdv statistic
43
Icircn continuare
Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa
reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică
pentru a fi interesante din punct de vedere ştiinţific
Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC
oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care
este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a
obţine o concluzie clară
Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o
diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că
datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din
punct de vedere ştiinţific
Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul
detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat
Erorile studiilor medicale
Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura
anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară
caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea
asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri
legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias
Erorile potenţiale icircn studiile epidemiologice
1 Erori icircntacircmplătoare
2 Erori sistematice
3 Confuzia
4 Validitatea
1 Erori icircntacircmplătoare
Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a
parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel
de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot
fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii
(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor
de măsură (eroarea de măsurare)
44
2 Erori sistematice
Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate
care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu
acurateţe mare Acurateţea nu este afectată de mărimea eşantionului
Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de
experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea
dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus
şi greu de cuantificat (consum de alcool personalitate etc)
Principalele tipuri de erori din această categorie sunt
bull Biasul de selecţie
bull Biasul de informaţie
Biasul de selecţie
Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul
trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion
inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale
persoanelor incluse
Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se
ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia
Biasul de informaţie
Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de
instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze
expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere
nesemnificativă sau chiar să nu şi-o amintească de loc
3 Confuzia
Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune
prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este
cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă
de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte
important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor
protector
4 Validitatea
Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă
Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte
estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional
Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă
45
conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se
demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)
Validitatea externă se poate realiza numai dacă studiul este valid intern
Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii
studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de
studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt
laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi
validă din punct de vedere intern)
3 6 Prezentarea rezultatelor
După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite
Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor
icircntr-o formă bdquodigerabilărdquo este necesară
Scopul prezentării datelor
1 Transmiterea concluziilor studiului
a Datele corecte şi importante merită comunicate
b Datele trebuie să confirme sau să infirme ipoteza studiului
c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală
2 Acordarea posibilităţii altor cercetători să aprecieze studiul
a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti
b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor
prezentate
Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru
fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie
statistică
Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de
valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras
(Tabel 3)
Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)
46
Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct
numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor
precum şi prezentarea acestora sub formă inteligibilă
Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care
convin cercetătorului
Prezentarea datelor se poate face
1 Figuri şi tabele icircn articole scrise
2 Figuri şi tabele icircn prezentări orale
3 Figuri şi tabele icircn postere
4 Text scris sau incluse icircn text
5 Site-uri de WEB
Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor
Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie
Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele
exprimacircnd exact ceea ce acestea exprimă
Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate
anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel
să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se
acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca
mai sus sugestive sunt formatele simple şi puţin icircncărcate
Dacă nu există reguli impuse se respectă
1 Mesaj simplu fără falsificarea datelor
2 De obicei este necesar atacirct tabelul cacirct şi graficul
3 Să fie simplu şi clar
Tabele
Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile
coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică
elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de
1 Se folosesc doar linii orizontale
2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn
evidenţi prin linie de separare (Tabelul 4)
Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland
Noua Zeelandă)
(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)
47
3 Numerele sunt aliniate icircn funcţie de virgulă
4 Indicii statistici sunt explicaţi sub tabel
5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană
6 Abrevierile pot fi folosite
7 Numărul de zecimale trebuie limitat la maxim două
8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel
9 Plasarea legendei este obligatorie sub tabel
10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)
Icircn cazul prezentărilor orale sau a posterelor este indicat ca
1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării
2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte
3 Folosirea de simboluri este permisă
Clasificarea tabelelor
Tabelele se clasifică după
i) conţinut
bull cu distribuţii de frecvenţe
bull de clase de frecvenţe
bull de contingenţă
ii) structura
bull cu doua coloane
bull cu subclasificări
bull ldquomasterrdquo
Tabele ce conţin distribuţii de frecvenţe
O modalitate comodă de a prezenta o mulţime de date brute este
1 Se ordonează datele in ordine crescătoare
2 Se determine frecvenţa fiecărei valori
3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane
(Tabelul 5)
Tabelul 5 Distribuţii de frecvenţă absolută
48
Tabelul claselor de frecvenţe
1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă
2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)
Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)
Tabele de contingenţă
1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a
tabelelor de contingenţă
2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a
combinaţiilor de perechi ordonate de valori
3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre
a factor de risc si
b starea sănătăţii
4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)
5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)
Tabelul 7 Tabel de contingenţă 2 x 2
49
Grafice
Există două categorii de moduri grafice sub care se pot prezenta datele
1 Ilustraţii şi fotografii
2 Grafice
1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă
pentru lucrare
2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit
Putem vorbi despre mai multe tipuri de grafice
bull Grafice pentru reprezentarea datelor cantitative
1048707 Grafic cartezian (X Y)
1048707 Histograma
1048707 Poligonul de frecvenţe
1048707 Diagrama bdquoscatterrdquo
bull Grafice pentru reprezentarea datelor calitative
1048707 Grafic cu bare
1048707 Diagrama tip bdquoboxplotrdquo
1048707 Diagrama bdquopierdquo
1048707 Cartograma
Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi
dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)
Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)
Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie
Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)
Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)
50
Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir
de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele
două variabile studiate (Figura 6)
Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2
(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2
rămacircne aproximativ constantă)
Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea
comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea
comparativă a mai multor variabile
Figura 7 Grafic calitativ cu bare
51
Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo
Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două
posibilităţi reprezentate grafic este mai frecventă (Figura 8)
Figura 8 Reprezentare tip bdquopierdquo
Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli
sau a oricărui element comparativ Se foloseşte de epidemiologi
Rezultate
Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare
Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o
manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu
explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția
bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la
ilustraţii tabele grafice
Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi
nici rezultatele care invalidează eventual ipoteza
Discuţii
Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd
cultura ştiinţifică şi inteligenţa autorilor
Acest capitol răspunde la trei obiective
Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia
calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de
selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează
rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv
52
este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn
care a fost abordată problema fără a face o revistă a literaturii
Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea
rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul
Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor
afirmaţii nesusţinute de conţinutul lucrării
Concluzii
Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate
să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie
Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de
concluzii va scădea valoarea lucrării
Bibliografia (lista referinţelor citarea icircn text)
Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn
lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente
Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli
- să conţină cele mai importante şi recente lucrări
- să includă numai lucrări publicate
- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate
Bibliografie
Elisabeta Jaba ndash Statistică Ed Economică 1998
Mihai Ţarcă ndash Statistică volI Ed UAIC 1979
Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale
Ed University Press 2009
Sorana Daniela Bolboacă ndash Metodologia cercetării curs
53
Nu există nici un mod de a fi siguri că diferenţa observată reflectă o diferenţă reală sau una coincidentală
urmare a eşantionării aleatorii Tot ce se face este să calcularea probabilitatăţii
Valoarea p răspunde la această icircntrebare dacă populaţiile au avut icircntr-adevăr aceeaşi medie care este
probabilitatea de a observa o asemenea diferenţă (sau una mai mare) icircntre mediile eşantioanelor icircntr-un
experiment de dimensiunea acestuia
Valoarea p este o probabilitate cu valoarea oscilacircnd icircntre 0 şi 1 Dacă valoarea p este mică concluzia este că
diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putacircndu-se conchide că populaţiile au medii
diferite
Ipoteza nulă face dovada că nu există diferenţe icircntre grupuri Folosind acest termen valoarea P se defineşte ca
fiind probabilitatea de a observa o diferenţă la fel de mare sau mai mare decacirct s-ar fi observat dacă ipoteza nulă
ar fi fost adevărată
Pentru detectarea semnificaţiei statistice trebuie urmate etapele de inferenţă
1 Stabilirea unei valori prag icircnainte de a efectua experimentul Icircn mod ideal ar trebui stabilit acest prag pe
baza consecinţelor legate de trecerea cu vederea a unei diferenţe sau pe identificarea unei false diferenţe De
fapt valoarea ndash prag (numită α) este stabilită icircn mod tradiţional la 005 sau 001
2 Definirea ipotezei nule Dacă se compară 2 medii ipoteza nulă este că populaţiile au aceeaşi medie
3 Se aplică testul statistic aferent pentru a calcula valoarea p
4 Se compară valoarea p cu valoarea ndash prag
5 Dacă valoarea p este mai mică decacirct pragul stabilit declaraţi că bdquorespingeţi ipoteza nulărdquo şi că diferenţa bdquoe
semnificativă dpdv statisticrdquo
6 Dacă valoarea p este mai mare decacirct pragul declaraţi că bdquonu respingeţi ipoteza nulărdquo şi că diferenţa bdquonu e
semnificativă dpdv statisticrdquo Nu puteţi concluzia că ipoteza nulă este adevărată Tot ce puteţi face este să
conchideţi că nu aveţi probe suficiente pentru a respinge ipoteza nulă
Teste de semnificaţie
Testul de semnificaţie calculează valoare p probabilitatea de a obţine o valoare corectă a parametrului
populaţional prin extrapolare (inferenţă) de la valoarea estimatorului (calculat pe baza eşantionului)
Testarea ipotezelor implică posibile erori
Eroarea de tip I este numită nivel de semnificaţie valoarea ei fiind stabilită de cercetător Populaţiile
sunt identice deci nu există de fapt nici o diferenţă Din icircntacircmplare s-au obţinut valori mai mari icircn cazul unui
grup şi mai mici icircn cazul celuilalt Cacircnd apare un rezultat semnificativ din punct de vedere statistic ndash icircn cazul
icircn care populaţiile sunt identice (H0 = H1) - icircnseamnă că a intervenit o eroare de tip I Dacă se defineşte p lt005
ca fiind semnificaţia statistică va apare eroare de tip I icircn 5 din experimentele icircn care nu există
37
nici o diferenţă
Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ
statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de
ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost
ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau
dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă
cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă
semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe
ipotetice variate icircn cazul icircn care ele există
Măsuri ale frecvenţei
Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)
Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate
Generic formula pe care se bazează toate cele trei este
unde x şi y sunt cantităţile de comparat
Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea
unei frecvenţe pe grupe de sex vacircrstă etc
Proporţia implică icircn mod necesar ca x să fie inclus icircn y
Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară
frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp
Pentru calcularea unei rate trebuie ţinut cont de trei aspecte
bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin
bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp
bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo
Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un
tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei
populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei
aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)
38
Indicatori
Rata de incidenţă
Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă
icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii
Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o
perioadă de timp
Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de
timp x
Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei
susceptibili de a dezvolta icircmbolnăvirea studiată
Numitorul poate fi
bull Numărul mediu al populaţiei icircn perioada de timp studiată
bull Mărimea populaţiei icircn mijlocul perioadei de studiu
bull Mărimea populaţiei la icircnceputul studiului
Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă
Este obligatorie menţionarea perioadei de timp
Prevalenţa
Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la
un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă
schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa
momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)
39
Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include
numai cazuri noi respectiv include cazuri noi şi vechi
Rata de atac
Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este
folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp
raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori
Rata persoană-timp
Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din
momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte
migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost
observate
Riscul relativ (RR)
Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment
legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele
prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două
grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la
bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la
bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai
mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo
Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2
Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn
cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă
(Tabelul 1)
Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR
Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la
neexpuşi
40
Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de
culegere a datelor
Odds ratio (OR)
Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin
raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general
studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)
Tabelul 2 Tabelul 2 x 2 pentru calcularea OR
Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală
Rate de mortalitate
Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp
specificată Există mai multe tipuri de rate de mortalitate
o Mortalitate specifică pe sex
o Mortalitate specifică pe rasă
o Mortalitate specifică pe boală
o Mortalitate neonatală
o Mortalitate postneonatală
o Mortalitate infantilă
o Mortalitate maternă
Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP
41
Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de
viaţă şi vacircrsta la care survine decesul dacă este prematur
Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu
Ani de viaţă pierduţi datorat dizabilităţii
Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt
utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru
cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite
grupuri
Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de
risc şi o boală se folosesc riscul relativ şi odds ratio
35 Analiza şi interpretarea datelor
După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date
trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul
Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor
colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului
studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu
plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde
prezenţa biostatisticianului este necesară
Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu
elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat
iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului
iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate
depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori
testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere
clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza
Interpretarea rezultatelor statistice
Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne
motive (număr mic de date) acceptarea ei să fie falsă
Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine
gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia
ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument
de decizie Intervalul de confidenţă
42
Interpretarea statistica ne interpretarea clinică
Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă
Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice
obţinute pe eşantionul studiat
Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare
Ce interpretăm Rezultatele
personale obţinute icircn urma studiului
care au fost prezentate icircn secţiunea bdquoRezultaterdquo
Explicăm rezultatele obţinute
Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale
Interpretarea trebuie să se realizeze icircn
lumina limitelor studiului
contextul cultural social şi educaţional al locului unde s-a realizat cercetarea
contextul a ceea ce se cunoaşte din literatura de specialitate
Interpretăm doar rezultatele personale obţinute icircn urma studiului
Interpretarea statistică nu este tot una cu interpretarea clinică
Interpretarea statistică este importantă
Interpretarea clinică este foarte importantă
Intervalul de confidenţă
Media calculată pe baza unui eşantion nu va echivala media populaţiei
Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului
Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a
populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a
populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)
pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru
orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare
dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de
confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de
date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de
5
Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel
Dacă valoarea p este mică
Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare
aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o
medie diferită Diferenţa este semnificativă dpdv statistic
43
Icircn continuare
Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa
reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică
pentru a fi interesante din punct de vedere ştiinţific
Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC
oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care
este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a
obţine o concluzie clară
Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o
diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că
datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din
punct de vedere ştiinţific
Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul
detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat
Erorile studiilor medicale
Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura
anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară
caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea
asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri
legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias
Erorile potenţiale icircn studiile epidemiologice
1 Erori icircntacircmplătoare
2 Erori sistematice
3 Confuzia
4 Validitatea
1 Erori icircntacircmplătoare
Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a
parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel
de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot
fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii
(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor
de măsură (eroarea de măsurare)
44
2 Erori sistematice
Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate
care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu
acurateţe mare Acurateţea nu este afectată de mărimea eşantionului
Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de
experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea
dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus
şi greu de cuantificat (consum de alcool personalitate etc)
Principalele tipuri de erori din această categorie sunt
bull Biasul de selecţie
bull Biasul de informaţie
Biasul de selecţie
Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul
trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion
inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale
persoanelor incluse
Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se
ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia
Biasul de informaţie
Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de
instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze
expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere
nesemnificativă sau chiar să nu şi-o amintească de loc
3 Confuzia
Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune
prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este
cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă
de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte
important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor
protector
4 Validitatea
Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă
Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte
estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional
Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă
45
conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se
demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)
Validitatea externă se poate realiza numai dacă studiul este valid intern
Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii
studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de
studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt
laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi
validă din punct de vedere intern)
3 6 Prezentarea rezultatelor
După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite
Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor
icircntr-o formă bdquodigerabilărdquo este necesară
Scopul prezentării datelor
1 Transmiterea concluziilor studiului
a Datele corecte şi importante merită comunicate
b Datele trebuie să confirme sau să infirme ipoteza studiului
c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală
2 Acordarea posibilităţii altor cercetători să aprecieze studiul
a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti
b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor
prezentate
Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru
fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie
statistică
Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de
valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras
(Tabel 3)
Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)
46
Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct
numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor
precum şi prezentarea acestora sub formă inteligibilă
Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care
convin cercetătorului
Prezentarea datelor se poate face
1 Figuri şi tabele icircn articole scrise
2 Figuri şi tabele icircn prezentări orale
3 Figuri şi tabele icircn postere
4 Text scris sau incluse icircn text
5 Site-uri de WEB
Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor
Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie
Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele
exprimacircnd exact ceea ce acestea exprimă
Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate
anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel
să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se
acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca
mai sus sugestive sunt formatele simple şi puţin icircncărcate
Dacă nu există reguli impuse se respectă
1 Mesaj simplu fără falsificarea datelor
2 De obicei este necesar atacirct tabelul cacirct şi graficul
3 Să fie simplu şi clar
Tabele
Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile
coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică
elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de
1 Se folosesc doar linii orizontale
2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn
evidenţi prin linie de separare (Tabelul 4)
Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland
Noua Zeelandă)
(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)
47
3 Numerele sunt aliniate icircn funcţie de virgulă
4 Indicii statistici sunt explicaţi sub tabel
5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană
6 Abrevierile pot fi folosite
7 Numărul de zecimale trebuie limitat la maxim două
8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel
9 Plasarea legendei este obligatorie sub tabel
10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)
Icircn cazul prezentărilor orale sau a posterelor este indicat ca
1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării
2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte
3 Folosirea de simboluri este permisă
Clasificarea tabelelor
Tabelele se clasifică după
i) conţinut
bull cu distribuţii de frecvenţe
bull de clase de frecvenţe
bull de contingenţă
ii) structura
bull cu doua coloane
bull cu subclasificări
bull ldquomasterrdquo
Tabele ce conţin distribuţii de frecvenţe
O modalitate comodă de a prezenta o mulţime de date brute este
1 Se ordonează datele in ordine crescătoare
2 Se determine frecvenţa fiecărei valori
3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane
(Tabelul 5)
Tabelul 5 Distribuţii de frecvenţă absolută
48
Tabelul claselor de frecvenţe
1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă
2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)
Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)
Tabele de contingenţă
1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a
tabelelor de contingenţă
2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a
combinaţiilor de perechi ordonate de valori
3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre
a factor de risc si
b starea sănătăţii
4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)
5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)
Tabelul 7 Tabel de contingenţă 2 x 2
49
Grafice
Există două categorii de moduri grafice sub care se pot prezenta datele
1 Ilustraţii şi fotografii
2 Grafice
1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă
pentru lucrare
2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit
Putem vorbi despre mai multe tipuri de grafice
bull Grafice pentru reprezentarea datelor cantitative
1048707 Grafic cartezian (X Y)
1048707 Histograma
1048707 Poligonul de frecvenţe
1048707 Diagrama bdquoscatterrdquo
bull Grafice pentru reprezentarea datelor calitative
1048707 Grafic cu bare
1048707 Diagrama tip bdquoboxplotrdquo
1048707 Diagrama bdquopierdquo
1048707 Cartograma
Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi
dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)
Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)
Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie
Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)
Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)
50
Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir
de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele
două variabile studiate (Figura 6)
Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2
(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2
rămacircne aproximativ constantă)
Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea
comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea
comparativă a mai multor variabile
Figura 7 Grafic calitativ cu bare
51
Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo
Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două
posibilităţi reprezentate grafic este mai frecventă (Figura 8)
Figura 8 Reprezentare tip bdquopierdquo
Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli
sau a oricărui element comparativ Se foloseşte de epidemiologi
Rezultate
Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare
Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o
manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu
explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția
bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la
ilustraţii tabele grafice
Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi
nici rezultatele care invalidează eventual ipoteza
Discuţii
Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd
cultura ştiinţifică şi inteligenţa autorilor
Acest capitol răspunde la trei obiective
Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia
calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de
selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează
rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv
52
este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn
care a fost abordată problema fără a face o revistă a literaturii
Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea
rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul
Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor
afirmaţii nesusţinute de conţinutul lucrării
Concluzii
Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate
să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie
Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de
concluzii va scădea valoarea lucrării
Bibliografia (lista referinţelor citarea icircn text)
Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn
lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente
Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli
- să conţină cele mai importante şi recente lucrări
- să includă numai lucrări publicate
- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate
Bibliografie
Elisabeta Jaba ndash Statistică Ed Economică 1998
Mihai Ţarcă ndash Statistică volI Ed UAIC 1979
Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale
Ed University Press 2009
Sorana Daniela Bolboacă ndash Metodologia cercetării curs
53
nici o diferenţă
Eroarea de tip II nu este de temut pentru că prin acceptarea ipotezei nule rezultă bdquonesemnificativ
statisticrdquo şi nu se trag concluzii care eventual ar putea dăuna Cacircnd icircn urma unui studiu se obţine concluzia de
ldquodiferenţă nesemnificativă din punct de vedere statisticrdquo nu trebuie trasă concluzia că metoda a fost
ineficientă Este posibil ca studiul să fi omis un mic amănunt din cauza dimensiunii eşantionului şisau
dispersiei mari Icircn acest caz apare eroarea de tip II prin faptul că s-a concluzionat că nu există nici o diferenţă
cacircnd de fapt ea există Cacircnd se interpretează rezultatele unui experiment care nu a scos la iveală o diferenţă
semnificativă trebuie pusă următoarea problemă cacirct de capabil a fost acest studiu să găsească diferenţe
ipotetice variate icircn cazul icircn care ele există
Măsuri ale frecvenţei
Rezultatele unei cercetări medicale sunt de multe ori variabile binare (dihotomiale)
Indicatorii folosiţi pentru exprimarea unor astfel de variabile sunt raţii proporţii şi rate
Generic formula pe care se bazează toate cele trei este
unde x şi y sunt cantităţile de comparat
Raţia valorile x şi y sunt complet independente sau x poate fi inclus icircn y Sunt utile pentru aprecierea
unei frecvenţe pe grupe de sex vacircrstă etc
Proporţia implică icircn mod necesar ca x să fie inclus icircn y
Rata este de cele mai multe ori o proporţia la care se adaugă o dimensiune de obicei temporală măsoară
frecvenţa unui fenomen icircntr-o populaţie icircntr-un interval de timp
Pentru calcularea unei rate trebuie ţinut cont de trei aspecte
bull Persoanele de la numitor trebuie să reflecte populaţia din care cazurile de la numărător provin
bull Identificarea persoanelor de la numitor şi de la numărător trebuie să aibă loc icircn acelaşi interval de timp
bull Teoretic persoanele de la numitor trebuie să fie bdquola riscrdquo
Se constată că cei trei indicatori sunt toţi raţii proporţia este un tip particular de raţie iar rata este un
tip particular de proporţie Icircn practica medicală sunt folosite raţiile şi proporţiile pentru caracterizarea unei
populaţii (sex vacircrstă expunere etc) Folosim raţii proporţii şi foarte important rate pentru a descrie cele trei
aspecte importante ale evoluţiei unei populaţii morbiditate (boală) mortalitate (deces) şi natalitate (naştere)
38
Indicatori
Rata de incidenţă
Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă
icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii
Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o
perioadă de timp
Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de
timp x
Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei
susceptibili de a dezvolta icircmbolnăvirea studiată
Numitorul poate fi
bull Numărul mediu al populaţiei icircn perioada de timp studiată
bull Mărimea populaţiei icircn mijlocul perioadei de studiu
bull Mărimea populaţiei la icircnceputul studiului
Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă
Este obligatorie menţionarea perioadei de timp
Prevalenţa
Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la
un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă
schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa
momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)
39
Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include
numai cazuri noi respectiv include cazuri noi şi vechi
Rata de atac
Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este
folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp
raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori
Rata persoană-timp
Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din
momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte
migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost
observate
Riscul relativ (RR)
Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment
legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele
prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două
grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la
bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la
bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai
mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo
Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2
Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn
cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă
(Tabelul 1)
Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR
Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la
neexpuşi
40
Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de
culegere a datelor
Odds ratio (OR)
Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin
raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general
studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)
Tabelul 2 Tabelul 2 x 2 pentru calcularea OR
Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală
Rate de mortalitate
Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp
specificată Există mai multe tipuri de rate de mortalitate
o Mortalitate specifică pe sex
o Mortalitate specifică pe rasă
o Mortalitate specifică pe boală
o Mortalitate neonatală
o Mortalitate postneonatală
o Mortalitate infantilă
o Mortalitate maternă
Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP
41
Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de
viaţă şi vacircrsta la care survine decesul dacă este prematur
Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu
Ani de viaţă pierduţi datorat dizabilităţii
Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt
utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru
cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite
grupuri
Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de
risc şi o boală se folosesc riscul relativ şi odds ratio
35 Analiza şi interpretarea datelor
După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date
trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul
Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor
colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului
studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu
plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde
prezenţa biostatisticianului este necesară
Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu
elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat
iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului
iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate
depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori
testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere
clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza
Interpretarea rezultatelor statistice
Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne
motive (număr mic de date) acceptarea ei să fie falsă
Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine
gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia
ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument
de decizie Intervalul de confidenţă
42
Interpretarea statistica ne interpretarea clinică
Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă
Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice
obţinute pe eşantionul studiat
Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare
Ce interpretăm Rezultatele
personale obţinute icircn urma studiului
care au fost prezentate icircn secţiunea bdquoRezultaterdquo
Explicăm rezultatele obţinute
Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale
Interpretarea trebuie să se realizeze icircn
lumina limitelor studiului
contextul cultural social şi educaţional al locului unde s-a realizat cercetarea
contextul a ceea ce se cunoaşte din literatura de specialitate
Interpretăm doar rezultatele personale obţinute icircn urma studiului
Interpretarea statistică nu este tot una cu interpretarea clinică
Interpretarea statistică este importantă
Interpretarea clinică este foarte importantă
Intervalul de confidenţă
Media calculată pe baza unui eşantion nu va echivala media populaţiei
Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului
Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a
populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a
populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)
pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru
orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare
dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de
confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de
date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de
5
Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel
Dacă valoarea p este mică
Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare
aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o
medie diferită Diferenţa este semnificativă dpdv statistic
43
Icircn continuare
Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa
reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică
pentru a fi interesante din punct de vedere ştiinţific
Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC
oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care
este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a
obţine o concluzie clară
Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o
diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că
datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din
punct de vedere ştiinţific
Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul
detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat
Erorile studiilor medicale
Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura
anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară
caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea
asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri
legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias
Erorile potenţiale icircn studiile epidemiologice
1 Erori icircntacircmplătoare
2 Erori sistematice
3 Confuzia
4 Validitatea
1 Erori icircntacircmplătoare
Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a
parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel
de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot
fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii
(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor
de măsură (eroarea de măsurare)
44
2 Erori sistematice
Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate
care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu
acurateţe mare Acurateţea nu este afectată de mărimea eşantionului
Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de
experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea
dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus
şi greu de cuantificat (consum de alcool personalitate etc)
Principalele tipuri de erori din această categorie sunt
bull Biasul de selecţie
bull Biasul de informaţie
Biasul de selecţie
Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul
trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion
inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale
persoanelor incluse
Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se
ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia
Biasul de informaţie
Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de
instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze
expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere
nesemnificativă sau chiar să nu şi-o amintească de loc
3 Confuzia
Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune
prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este
cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă
de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte
important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor
protector
4 Validitatea
Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă
Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte
estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional
Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă
45
conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se
demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)
Validitatea externă se poate realiza numai dacă studiul este valid intern
Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii
studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de
studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt
laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi
validă din punct de vedere intern)
3 6 Prezentarea rezultatelor
După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite
Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor
icircntr-o formă bdquodigerabilărdquo este necesară
Scopul prezentării datelor
1 Transmiterea concluziilor studiului
a Datele corecte şi importante merită comunicate
b Datele trebuie să confirme sau să infirme ipoteza studiului
c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală
2 Acordarea posibilităţii altor cercetători să aprecieze studiul
a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti
b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor
prezentate
Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru
fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie
statistică
Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de
valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras
(Tabel 3)
Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)
46
Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct
numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor
precum şi prezentarea acestora sub formă inteligibilă
Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care
convin cercetătorului
Prezentarea datelor se poate face
1 Figuri şi tabele icircn articole scrise
2 Figuri şi tabele icircn prezentări orale
3 Figuri şi tabele icircn postere
4 Text scris sau incluse icircn text
5 Site-uri de WEB
Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor
Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie
Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele
exprimacircnd exact ceea ce acestea exprimă
Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate
anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel
să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se
acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca
mai sus sugestive sunt formatele simple şi puţin icircncărcate
Dacă nu există reguli impuse se respectă
1 Mesaj simplu fără falsificarea datelor
2 De obicei este necesar atacirct tabelul cacirct şi graficul
3 Să fie simplu şi clar
Tabele
Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile
coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică
elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de
1 Se folosesc doar linii orizontale
2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn
evidenţi prin linie de separare (Tabelul 4)
Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland
Noua Zeelandă)
(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)
47
3 Numerele sunt aliniate icircn funcţie de virgulă
4 Indicii statistici sunt explicaţi sub tabel
5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană
6 Abrevierile pot fi folosite
7 Numărul de zecimale trebuie limitat la maxim două
8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel
9 Plasarea legendei este obligatorie sub tabel
10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)
Icircn cazul prezentărilor orale sau a posterelor este indicat ca
1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării
2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte
3 Folosirea de simboluri este permisă
Clasificarea tabelelor
Tabelele se clasifică după
i) conţinut
bull cu distribuţii de frecvenţe
bull de clase de frecvenţe
bull de contingenţă
ii) structura
bull cu doua coloane
bull cu subclasificări
bull ldquomasterrdquo
Tabele ce conţin distribuţii de frecvenţe
O modalitate comodă de a prezenta o mulţime de date brute este
1 Se ordonează datele in ordine crescătoare
2 Se determine frecvenţa fiecărei valori
3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane
(Tabelul 5)
Tabelul 5 Distribuţii de frecvenţă absolută
48
Tabelul claselor de frecvenţe
1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă
2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)
Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)
Tabele de contingenţă
1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a
tabelelor de contingenţă
2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a
combinaţiilor de perechi ordonate de valori
3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre
a factor de risc si
b starea sănătăţii
4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)
5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)
Tabelul 7 Tabel de contingenţă 2 x 2
49
Grafice
Există două categorii de moduri grafice sub care se pot prezenta datele
1 Ilustraţii şi fotografii
2 Grafice
1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă
pentru lucrare
2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit
Putem vorbi despre mai multe tipuri de grafice
bull Grafice pentru reprezentarea datelor cantitative
1048707 Grafic cartezian (X Y)
1048707 Histograma
1048707 Poligonul de frecvenţe
1048707 Diagrama bdquoscatterrdquo
bull Grafice pentru reprezentarea datelor calitative
1048707 Grafic cu bare
1048707 Diagrama tip bdquoboxplotrdquo
1048707 Diagrama bdquopierdquo
1048707 Cartograma
Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi
dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)
Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)
Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie
Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)
Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)
50
Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir
de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele
două variabile studiate (Figura 6)
Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2
(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2
rămacircne aproximativ constantă)
Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea
comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea
comparativă a mai multor variabile
Figura 7 Grafic calitativ cu bare
51
Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo
Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două
posibilităţi reprezentate grafic este mai frecventă (Figura 8)
Figura 8 Reprezentare tip bdquopierdquo
Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli
sau a oricărui element comparativ Se foloseşte de epidemiologi
Rezultate
Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare
Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o
manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu
explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția
bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la
ilustraţii tabele grafice
Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi
nici rezultatele care invalidează eventual ipoteza
Discuţii
Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd
cultura ştiinţifică şi inteligenţa autorilor
Acest capitol răspunde la trei obiective
Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia
calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de
selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează
rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv
52
este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn
care a fost abordată problema fără a face o revistă a literaturii
Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea
rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul
Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor
afirmaţii nesusţinute de conţinutul lucrării
Concluzii
Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate
să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie
Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de
concluzii va scădea valoarea lucrării
Bibliografia (lista referinţelor citarea icircn text)
Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn
lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente
Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli
- să conţină cele mai importante şi recente lucrări
- să includă numai lucrări publicate
- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate
Bibliografie
Elisabeta Jaba ndash Statistică Ed Economică 1998
Mihai Ţarcă ndash Statistică volI Ed UAIC 1979
Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale
Ed University Press 2009
Sorana Daniela Bolboacă ndash Metodologia cercetării curs
53
Indicatori
Rata de incidenţă
Este cel mai comun mod de a măsura şi a compara frecvenţa unei boli icircn populaţie Folosim rata de incidenţă
icircn locul exprimării cifrice pentru a putea compara frecvenţa unei boli icircn diferite populaţii
Rata incidenţei (sau Incidenţa) măsoară frecvenţa cu care un eveniment (boală) apare icircn populaţie icircntr-o
perioadă de timp
Incidenţa = numărul de cazuri noi apărute icircntr-o perioadă de timp dată populaţia la risc icircn aceeaşi perioadă de
timp x
Numărătorul nu include cazuri preexistente Numitorul icircn condiţii ideale reprezintă populaţia la risc adică cei
susceptibili de a dezvolta icircmbolnăvirea studiată
Numitorul poate fi
bull Numărul mediu al populaţiei icircn perioada de timp studiată
bull Mărimea populaţiei icircn mijlocul perioadei de studiu
bull Mărimea populaţiei la icircnceputul studiului
Dacă numitorul reprezintă populaţia la icircnceputul studiului rata calculată se numeşte incidenţă cumulativă
Este obligatorie menţionarea perioadei de timp
Prevalenţa
Numită şi rata de prevalenţă este proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la
un moment dat sau icircntr-o perioadă de timp dată Numărul de bolnavi dintr-o populaţie este icircn permanentă
schimbare Pentru a putea determina numărul de bolnavi la un moment dat se calculează prevalenţa
momentană Se poate calcula prevalenţa icircntr-o perioadă de timp (luna an decadă etc)
39
Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include
numai cazuri noi respectiv include cazuri noi şi vechi
Rata de atac
Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este
folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp
raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori
Rata persoană-timp
Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din
momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte
migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost
observate
Riscul relativ (RR)
Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment
legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele
prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două
grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la
bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la
bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai
mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo
Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2
Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn
cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă
(Tabelul 1)
Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR
Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la
neexpuşi
40
Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de
culegere a datelor
Odds ratio (OR)
Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin
raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general
studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)
Tabelul 2 Tabelul 2 x 2 pentru calcularea OR
Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală
Rate de mortalitate
Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp
specificată Există mai multe tipuri de rate de mortalitate
o Mortalitate specifică pe sex
o Mortalitate specifică pe rasă
o Mortalitate specifică pe boală
o Mortalitate neonatală
o Mortalitate postneonatală
o Mortalitate infantilă
o Mortalitate maternă
Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP
41
Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de
viaţă şi vacircrsta la care survine decesul dacă este prematur
Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu
Ani de viaţă pierduţi datorat dizabilităţii
Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt
utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru
cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite
grupuri
Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de
risc şi o boală se folosesc riscul relativ şi odds ratio
35 Analiza şi interpretarea datelor
După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date
trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul
Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor
colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului
studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu
plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde
prezenţa biostatisticianului este necesară
Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu
elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat
iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului
iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate
depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori
testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere
clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza
Interpretarea rezultatelor statistice
Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne
motive (număr mic de date) acceptarea ei să fie falsă
Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine
gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia
ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument
de decizie Intervalul de confidenţă
42
Interpretarea statistica ne interpretarea clinică
Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă
Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice
obţinute pe eşantionul studiat
Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare
Ce interpretăm Rezultatele
personale obţinute icircn urma studiului
care au fost prezentate icircn secţiunea bdquoRezultaterdquo
Explicăm rezultatele obţinute
Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale
Interpretarea trebuie să se realizeze icircn
lumina limitelor studiului
contextul cultural social şi educaţional al locului unde s-a realizat cercetarea
contextul a ceea ce se cunoaşte din literatura de specialitate
Interpretăm doar rezultatele personale obţinute icircn urma studiului
Interpretarea statistică nu este tot una cu interpretarea clinică
Interpretarea statistică este importantă
Interpretarea clinică este foarte importantă
Intervalul de confidenţă
Media calculată pe baza unui eşantion nu va echivala media populaţiei
Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului
Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a
populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a
populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)
pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru
orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare
dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de
confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de
date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de
5
Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel
Dacă valoarea p este mică
Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare
aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o
medie diferită Diferenţa este semnificativă dpdv statistic
43
Icircn continuare
Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa
reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică
pentru a fi interesante din punct de vedere ştiinţific
Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC
oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care
este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a
obţine o concluzie clară
Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o
diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că
datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din
punct de vedere ştiinţific
Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul
detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat
Erorile studiilor medicale
Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura
anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară
caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea
asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri
legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias
Erorile potenţiale icircn studiile epidemiologice
1 Erori icircntacircmplătoare
2 Erori sistematice
3 Confuzia
4 Validitatea
1 Erori icircntacircmplătoare
Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a
parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel
de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot
fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii
(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor
de măsură (eroarea de măsurare)
44
2 Erori sistematice
Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate
care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu
acurateţe mare Acurateţea nu este afectată de mărimea eşantionului
Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de
experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea
dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus
şi greu de cuantificat (consum de alcool personalitate etc)
Principalele tipuri de erori din această categorie sunt
bull Biasul de selecţie
bull Biasul de informaţie
Biasul de selecţie
Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul
trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion
inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale
persoanelor incluse
Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se
ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia
Biasul de informaţie
Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de
instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze
expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere
nesemnificativă sau chiar să nu şi-o amintească de loc
3 Confuzia
Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune
prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este
cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă
de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte
important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor
protector
4 Validitatea
Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă
Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte
estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional
Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă
45
conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se
demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)
Validitatea externă se poate realiza numai dacă studiul este valid intern
Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii
studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de
studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt
laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi
validă din punct de vedere intern)
3 6 Prezentarea rezultatelor
După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite
Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor
icircntr-o formă bdquodigerabilărdquo este necesară
Scopul prezentării datelor
1 Transmiterea concluziilor studiului
a Datele corecte şi importante merită comunicate
b Datele trebuie să confirme sau să infirme ipoteza studiului
c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală
2 Acordarea posibilităţii altor cercetători să aprecieze studiul
a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti
b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor
prezentate
Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru
fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie
statistică
Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de
valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras
(Tabel 3)
Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)
46
Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct
numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor
precum şi prezentarea acestora sub formă inteligibilă
Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care
convin cercetătorului
Prezentarea datelor se poate face
1 Figuri şi tabele icircn articole scrise
2 Figuri şi tabele icircn prezentări orale
3 Figuri şi tabele icircn postere
4 Text scris sau incluse icircn text
5 Site-uri de WEB
Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor
Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie
Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele
exprimacircnd exact ceea ce acestea exprimă
Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate
anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel
să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se
acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca
mai sus sugestive sunt formatele simple şi puţin icircncărcate
Dacă nu există reguli impuse se respectă
1 Mesaj simplu fără falsificarea datelor
2 De obicei este necesar atacirct tabelul cacirct şi graficul
3 Să fie simplu şi clar
Tabele
Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile
coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică
elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de
1 Se folosesc doar linii orizontale
2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn
evidenţi prin linie de separare (Tabelul 4)
Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland
Noua Zeelandă)
(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)
47
3 Numerele sunt aliniate icircn funcţie de virgulă
4 Indicii statistici sunt explicaţi sub tabel
5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană
6 Abrevierile pot fi folosite
7 Numărul de zecimale trebuie limitat la maxim două
8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel
9 Plasarea legendei este obligatorie sub tabel
10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)
Icircn cazul prezentărilor orale sau a posterelor este indicat ca
1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării
2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte
3 Folosirea de simboluri este permisă
Clasificarea tabelelor
Tabelele se clasifică după
i) conţinut
bull cu distribuţii de frecvenţe
bull de clase de frecvenţe
bull de contingenţă
ii) structura
bull cu doua coloane
bull cu subclasificări
bull ldquomasterrdquo
Tabele ce conţin distribuţii de frecvenţe
O modalitate comodă de a prezenta o mulţime de date brute este
1 Se ordonează datele in ordine crescătoare
2 Se determine frecvenţa fiecărei valori
3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane
(Tabelul 5)
Tabelul 5 Distribuţii de frecvenţă absolută
48
Tabelul claselor de frecvenţe
1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă
2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)
Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)
Tabele de contingenţă
1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a
tabelelor de contingenţă
2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a
combinaţiilor de perechi ordonate de valori
3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre
a factor de risc si
b starea sănătăţii
4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)
5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)
Tabelul 7 Tabel de contingenţă 2 x 2
49
Grafice
Există două categorii de moduri grafice sub care se pot prezenta datele
1 Ilustraţii şi fotografii
2 Grafice
1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă
pentru lucrare
2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit
Putem vorbi despre mai multe tipuri de grafice
bull Grafice pentru reprezentarea datelor cantitative
1048707 Grafic cartezian (X Y)
1048707 Histograma
1048707 Poligonul de frecvenţe
1048707 Diagrama bdquoscatterrdquo
bull Grafice pentru reprezentarea datelor calitative
1048707 Grafic cu bare
1048707 Diagrama tip bdquoboxplotrdquo
1048707 Diagrama bdquopierdquo
1048707 Cartograma
Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi
dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)
Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)
Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie
Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)
Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)
50
Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir
de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele
două variabile studiate (Figura 6)
Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2
(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2
rămacircne aproximativ constantă)
Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea
comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea
comparativă a mai multor variabile
Figura 7 Grafic calitativ cu bare
51
Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo
Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două
posibilităţi reprezentate grafic este mai frecventă (Figura 8)
Figura 8 Reprezentare tip bdquopierdquo
Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli
sau a oricărui element comparativ Se foloseşte de epidemiologi
Rezultate
Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare
Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o
manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu
explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția
bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la
ilustraţii tabele grafice
Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi
nici rezultatele care invalidează eventual ipoteza
Discuţii
Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd
cultura ştiinţifică şi inteligenţa autorilor
Acest capitol răspunde la trei obiective
Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia
calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de
selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează
rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv
52
este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn
care a fost abordată problema fără a face o revistă a literaturii
Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea
rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul
Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor
afirmaţii nesusţinute de conţinutul lucrării
Concluzii
Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate
să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie
Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de
concluzii va scădea valoarea lucrării
Bibliografia (lista referinţelor citarea icircn text)
Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn
lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente
Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli
- să conţină cele mai importante şi recente lucrări
- să includă numai lucrări publicate
- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate
Bibliografie
Elisabeta Jaba ndash Statistică Ed Economică 1998
Mihai Ţarcă ndash Statistică volI Ed UAIC 1979
Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale
Ed University Press 2009
Sorana Daniela Bolboacă ndash Metodologia cercetării curs
53
Incidenţa şi prevalenţa sunt indicatori deseori confundaţi Diferenţa constă icircn faptul că numărătorul include
numai cazuri noi respectiv include cazuri noi şi vechi
Rata de atac
Este o variantă a incidenţei aplicate la un segment foarte icircngust populaţional icircntr-o perioadă scurtă Este
folosită icircn epidemii Reprezintă numărul de cazuri noi apărute icircn populaţia le risc icircntr-o perioadă de timp
raportată la populaţia la risc la icircnceputul perioadei de studiu Icircn general se raportează la 100 de locuitori
Rata persoană-timp
Varianta incidenţei care include la numitor timpul Icircn mod tipic o persoană bolnavă este urmărită din
momentul icircn care devine bolnavă pacircnă icircn momentul icircn care calitatea de bolnav dispare (icircnsănătoşire moarte
migraţie sfacircrşitul studiului) Numitorul este suma timpului icircn care persoanele de la numărător au fost
observate
Riscul relativ (RR)
Este o măsură a asocierii dintre un factor de risc şi apariţia unei boli Compară risc producerii unui eveniment
legat de starea de sănătate ca boala sau decesul icircn două grupuri Cele două grupuri sunt diferenţiate icircntre ele
prin factori demografici (sex) sau prin expunere la un factor de risc presupus Cel mai frecvent cele două
grupuri se numesc bdquoexpuşirdquo şi bdquoneexpuşirdquo Se calculează raportul dintre riscul la bdquoexpuşirdquo şi riscul la
bdquoneexpuşirdquo Dacă RR este 1 riscul este identic icircn ambele grupuri Dacă este mai mic decacirct 1 riscul la
bdquoneexpuşirdquo este mai mare (probabil factor protector) Dacă este mai mare de 1 riscul la bdquoexpuşirdquo este mai
mare Practic se afirmă bdquoriscul expuşilor de a face boala de RR mai mare decacirct la neexpuşirdquo
Calculul RR Se face folosind datele sintetizate icircn tabelul de contingenţă 2 x 2
Aplicarea RR este permisă doar pentru studiile care utilizează culegerea datelor tip bdquoexpus - neexpusrdquo Icircn
cercetarea ştiinţifică această metodă este folosită icircn studiul de cohortă
(Tabelul 1)
Tabelul 1 Tabel de contingenţă 2 x 2 pentru calculul RR
Calculul icircn mod practic al RR se face prin raportul dintre riscul de boală la expuşi şi riscul de boală la
neexpuşi
40
Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de
culegere a datelor
Odds ratio (OR)
Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin
raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general
studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)
Tabelul 2 Tabelul 2 x 2 pentru calcularea OR
Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală
Rate de mortalitate
Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp
specificată Există mai multe tipuri de rate de mortalitate
o Mortalitate specifică pe sex
o Mortalitate specifică pe rasă
o Mortalitate specifică pe boală
o Mortalitate neonatală
o Mortalitate postneonatală
o Mortalitate infantilă
o Mortalitate maternă
Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP
41
Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de
viaţă şi vacircrsta la care survine decesul dacă este prematur
Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu
Ani de viaţă pierduţi datorat dizabilităţii
Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt
utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru
cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite
grupuri
Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de
risc şi o boală se folosesc riscul relativ şi odds ratio
35 Analiza şi interpretarea datelor
După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date
trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul
Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor
colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului
studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu
plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde
prezenţa biostatisticianului este necesară
Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu
elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat
iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului
iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate
depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori
testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere
clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza
Interpretarea rezultatelor statistice
Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne
motive (număr mic de date) acceptarea ei să fie falsă
Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine
gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia
ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument
de decizie Intervalul de confidenţă
42
Interpretarea statistica ne interpretarea clinică
Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă
Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice
obţinute pe eşantionul studiat
Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare
Ce interpretăm Rezultatele
personale obţinute icircn urma studiului
care au fost prezentate icircn secţiunea bdquoRezultaterdquo
Explicăm rezultatele obţinute
Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale
Interpretarea trebuie să se realizeze icircn
lumina limitelor studiului
contextul cultural social şi educaţional al locului unde s-a realizat cercetarea
contextul a ceea ce se cunoaşte din literatura de specialitate
Interpretăm doar rezultatele personale obţinute icircn urma studiului
Interpretarea statistică nu este tot una cu interpretarea clinică
Interpretarea statistică este importantă
Interpretarea clinică este foarte importantă
Intervalul de confidenţă
Media calculată pe baza unui eşantion nu va echivala media populaţiei
Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului
Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a
populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a
populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)
pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru
orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare
dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de
confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de
date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de
5
Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel
Dacă valoarea p este mică
Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare
aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o
medie diferită Diferenţa este semnificativă dpdv statistic
43
Icircn continuare
Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa
reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică
pentru a fi interesante din punct de vedere ştiinţific
Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC
oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care
este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a
obţine o concluzie clară
Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o
diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că
datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din
punct de vedere ştiinţific
Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul
detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat
Erorile studiilor medicale
Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura
anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară
caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea
asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri
legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias
Erorile potenţiale icircn studiile epidemiologice
1 Erori icircntacircmplătoare
2 Erori sistematice
3 Confuzia
4 Validitatea
1 Erori icircntacircmplătoare
Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a
parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel
de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot
fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii
(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor
de măsură (eroarea de măsurare)
44
2 Erori sistematice
Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate
care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu
acurateţe mare Acurateţea nu este afectată de mărimea eşantionului
Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de
experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea
dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus
şi greu de cuantificat (consum de alcool personalitate etc)
Principalele tipuri de erori din această categorie sunt
bull Biasul de selecţie
bull Biasul de informaţie
Biasul de selecţie
Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul
trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion
inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale
persoanelor incluse
Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se
ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia
Biasul de informaţie
Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de
instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze
expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere
nesemnificativă sau chiar să nu şi-o amintească de loc
3 Confuzia
Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune
prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este
cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă
de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte
important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor
protector
4 Validitatea
Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă
Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte
estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional
Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă
45
conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se
demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)
Validitatea externă se poate realiza numai dacă studiul este valid intern
Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii
studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de
studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt
laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi
validă din punct de vedere intern)
3 6 Prezentarea rezultatelor
După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite
Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor
icircntr-o formă bdquodigerabilărdquo este necesară
Scopul prezentării datelor
1 Transmiterea concluziilor studiului
a Datele corecte şi importante merită comunicate
b Datele trebuie să confirme sau să infirme ipoteza studiului
c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală
2 Acordarea posibilităţii altor cercetători să aprecieze studiul
a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti
b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor
prezentate
Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru
fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie
statistică
Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de
valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras
(Tabel 3)
Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)
46
Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct
numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor
precum şi prezentarea acestora sub formă inteligibilă
Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care
convin cercetătorului
Prezentarea datelor se poate face
1 Figuri şi tabele icircn articole scrise
2 Figuri şi tabele icircn prezentări orale
3 Figuri şi tabele icircn postere
4 Text scris sau incluse icircn text
5 Site-uri de WEB
Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor
Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie
Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele
exprimacircnd exact ceea ce acestea exprimă
Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate
anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel
să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se
acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca
mai sus sugestive sunt formatele simple şi puţin icircncărcate
Dacă nu există reguli impuse se respectă
1 Mesaj simplu fără falsificarea datelor
2 De obicei este necesar atacirct tabelul cacirct şi graficul
3 Să fie simplu şi clar
Tabele
Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile
coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică
elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de
1 Se folosesc doar linii orizontale
2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn
evidenţi prin linie de separare (Tabelul 4)
Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland
Noua Zeelandă)
(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)
47
3 Numerele sunt aliniate icircn funcţie de virgulă
4 Indicii statistici sunt explicaţi sub tabel
5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană
6 Abrevierile pot fi folosite
7 Numărul de zecimale trebuie limitat la maxim două
8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel
9 Plasarea legendei este obligatorie sub tabel
10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)
Icircn cazul prezentărilor orale sau a posterelor este indicat ca
1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării
2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte
3 Folosirea de simboluri este permisă
Clasificarea tabelelor
Tabelele se clasifică după
i) conţinut
bull cu distribuţii de frecvenţe
bull de clase de frecvenţe
bull de contingenţă
ii) structura
bull cu doua coloane
bull cu subclasificări
bull ldquomasterrdquo
Tabele ce conţin distribuţii de frecvenţe
O modalitate comodă de a prezenta o mulţime de date brute este
1 Se ordonează datele in ordine crescătoare
2 Se determine frecvenţa fiecărei valori
3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane
(Tabelul 5)
Tabelul 5 Distribuţii de frecvenţă absolută
48
Tabelul claselor de frecvenţe
1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă
2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)
Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)
Tabele de contingenţă
1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a
tabelelor de contingenţă
2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a
combinaţiilor de perechi ordonate de valori
3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre
a factor de risc si
b starea sănătăţii
4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)
5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)
Tabelul 7 Tabel de contingenţă 2 x 2
49
Grafice
Există două categorii de moduri grafice sub care se pot prezenta datele
1 Ilustraţii şi fotografii
2 Grafice
1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă
pentru lucrare
2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit
Putem vorbi despre mai multe tipuri de grafice
bull Grafice pentru reprezentarea datelor cantitative
1048707 Grafic cartezian (X Y)
1048707 Histograma
1048707 Poligonul de frecvenţe
1048707 Diagrama bdquoscatterrdquo
bull Grafice pentru reprezentarea datelor calitative
1048707 Grafic cu bare
1048707 Diagrama tip bdquoboxplotrdquo
1048707 Diagrama bdquopierdquo
1048707 Cartograma
Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi
dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)
Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)
Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie
Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)
Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)
50
Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir
de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele
două variabile studiate (Figura 6)
Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2
(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2
rămacircne aproximativ constantă)
Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea
comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea
comparativă a mai multor variabile
Figura 7 Grafic calitativ cu bare
51
Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo
Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două
posibilităţi reprezentate grafic este mai frecventă (Figura 8)
Figura 8 Reprezentare tip bdquopierdquo
Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli
sau a oricărui element comparativ Se foloseşte de epidemiologi
Rezultate
Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare
Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o
manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu
explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția
bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la
ilustraţii tabele grafice
Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi
nici rezultatele care invalidează eventual ipoteza
Discuţii
Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd
cultura ştiinţifică şi inteligenţa autorilor
Acest capitol răspunde la trei obiective
Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia
calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de
selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează
rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv
52
este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn
care a fost abordată problema fără a face o revistă a literaturii
Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea
rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul
Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor
afirmaţii nesusţinute de conţinutul lucrării
Concluzii
Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate
să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie
Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de
concluzii va scădea valoarea lucrării
Bibliografia (lista referinţelor citarea icircn text)
Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn
lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente
Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli
- să conţină cele mai importante şi recente lucrări
- să includă numai lucrări publicate
- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate
Bibliografie
Elisabeta Jaba ndash Statistică Ed Economică 1998
Mihai Ţarcă ndash Statistică volI Ed UAIC 1979
Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale
Ed University Press 2009
Sorana Daniela Bolboacă ndash Metodologia cercetării curs
53
Este important de reţinut că toate calculele se fac icircntre expuşi şi neexpuşi pe orizontal datorită modului de
culegere a datelor
Odds ratio (OR)
Este o altă măsură a asocierii care cuantifică relaţia icircntre expunere şi apariţia unei boli Se calculează prin
raportul (bolnavi expuşibolnavi neexpuşi) (fără boală expuşifără boală neexpuşi) Se aplică icircn general
studiilor caz control Se calculează din datele tabelului 2 x 2 (Tabelul 2)
Tabelul 2 Tabelul 2 x 2 pentru calcularea OR
Pentru calcularea OR este esenţial de reţinut că criteriul de clasificare a datelor este boalăfără boală
Rate de mortalitate
Rata de mortalitate măsoară frecvenţa apariţiei decesului icircntr-o populaţie definită şi icircntr-o perioadă de timp
specificată Există mai multe tipuri de rate de mortalitate
o Mortalitate specifică pe sex
o Mortalitate specifică pe rasă
o Mortalitate specifică pe boală
o Mortalitate neonatală
o Mortalitate postneonatală
o Mortalitate infantilă
o Mortalitate maternă
Ani potenţiali de viaţă pierduţi (APVP) şi rata APVP
41
Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de
viaţă şi vacircrsta la care survine decesul dacă este prematur
Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu
Ani de viaţă pierduţi datorat dizabilităţii
Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt
utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru
cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite
grupuri
Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de
risc şi o boală se folosesc riscul relativ şi odds ratio
35 Analiza şi interpretarea datelor
După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date
trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul
Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor
colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului
studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu
plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde
prezenţa biostatisticianului este necesară
Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu
elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat
iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului
iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate
depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori
testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere
clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza
Interpretarea rezultatelor statistice
Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne
motive (număr mic de date) acceptarea ei să fie falsă
Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine
gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia
ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument
de decizie Intervalul de confidenţă
42
Interpretarea statistica ne interpretarea clinică
Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă
Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice
obţinute pe eşantionul studiat
Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare
Ce interpretăm Rezultatele
personale obţinute icircn urma studiului
care au fost prezentate icircn secţiunea bdquoRezultaterdquo
Explicăm rezultatele obţinute
Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale
Interpretarea trebuie să se realizeze icircn
lumina limitelor studiului
contextul cultural social şi educaţional al locului unde s-a realizat cercetarea
contextul a ceea ce se cunoaşte din literatura de specialitate
Interpretăm doar rezultatele personale obţinute icircn urma studiului
Interpretarea statistică nu este tot una cu interpretarea clinică
Interpretarea statistică este importantă
Interpretarea clinică este foarte importantă
Intervalul de confidenţă
Media calculată pe baza unui eşantion nu va echivala media populaţiei
Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului
Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a
populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a
populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)
pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru
orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare
dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de
confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de
date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de
5
Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel
Dacă valoarea p este mică
Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare
aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o
medie diferită Diferenţa este semnificativă dpdv statistic
43
Icircn continuare
Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa
reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică
pentru a fi interesante din punct de vedere ştiinţific
Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC
oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care
este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a
obţine o concluzie clară
Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o
diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că
datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din
punct de vedere ştiinţific
Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul
detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat
Erorile studiilor medicale
Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura
anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară
caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea
asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri
legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias
Erorile potenţiale icircn studiile epidemiologice
1 Erori icircntacircmplătoare
2 Erori sistematice
3 Confuzia
4 Validitatea
1 Erori icircntacircmplătoare
Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a
parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel
de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot
fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii
(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor
de măsură (eroarea de măsurare)
44
2 Erori sistematice
Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate
care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu
acurateţe mare Acurateţea nu este afectată de mărimea eşantionului
Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de
experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea
dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus
şi greu de cuantificat (consum de alcool personalitate etc)
Principalele tipuri de erori din această categorie sunt
bull Biasul de selecţie
bull Biasul de informaţie
Biasul de selecţie
Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul
trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion
inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale
persoanelor incluse
Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se
ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia
Biasul de informaţie
Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de
instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze
expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere
nesemnificativă sau chiar să nu şi-o amintească de loc
3 Confuzia
Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune
prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este
cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă
de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte
important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor
protector
4 Validitatea
Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă
Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte
estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional
Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă
45
conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se
demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)
Validitatea externă se poate realiza numai dacă studiul este valid intern
Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii
studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de
studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt
laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi
validă din punct de vedere intern)
3 6 Prezentarea rezultatelor
După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite
Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor
icircntr-o formă bdquodigerabilărdquo este necesară
Scopul prezentării datelor
1 Transmiterea concluziilor studiului
a Datele corecte şi importante merită comunicate
b Datele trebuie să confirme sau să infirme ipoteza studiului
c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală
2 Acordarea posibilităţii altor cercetători să aprecieze studiul
a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti
b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor
prezentate
Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru
fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie
statistică
Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de
valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras
(Tabel 3)
Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)
46
Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct
numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor
precum şi prezentarea acestora sub formă inteligibilă
Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care
convin cercetătorului
Prezentarea datelor se poate face
1 Figuri şi tabele icircn articole scrise
2 Figuri şi tabele icircn prezentări orale
3 Figuri şi tabele icircn postere
4 Text scris sau incluse icircn text
5 Site-uri de WEB
Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor
Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie
Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele
exprimacircnd exact ceea ce acestea exprimă
Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate
anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel
să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se
acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca
mai sus sugestive sunt formatele simple şi puţin icircncărcate
Dacă nu există reguli impuse se respectă
1 Mesaj simplu fără falsificarea datelor
2 De obicei este necesar atacirct tabelul cacirct şi graficul
3 Să fie simplu şi clar
Tabele
Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile
coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică
elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de
1 Se folosesc doar linii orizontale
2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn
evidenţi prin linie de separare (Tabelul 4)
Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland
Noua Zeelandă)
(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)
47
3 Numerele sunt aliniate icircn funcţie de virgulă
4 Indicii statistici sunt explicaţi sub tabel
5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană
6 Abrevierile pot fi folosite
7 Numărul de zecimale trebuie limitat la maxim două
8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel
9 Plasarea legendei este obligatorie sub tabel
10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)
Icircn cazul prezentărilor orale sau a posterelor este indicat ca
1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării
2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte
3 Folosirea de simboluri este permisă
Clasificarea tabelelor
Tabelele se clasifică după
i) conţinut
bull cu distribuţii de frecvenţe
bull de clase de frecvenţe
bull de contingenţă
ii) structura
bull cu doua coloane
bull cu subclasificări
bull ldquomasterrdquo
Tabele ce conţin distribuţii de frecvenţe
O modalitate comodă de a prezenta o mulţime de date brute este
1 Se ordonează datele in ordine crescătoare
2 Se determine frecvenţa fiecărei valori
3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane
(Tabelul 5)
Tabelul 5 Distribuţii de frecvenţă absolută
48
Tabelul claselor de frecvenţe
1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă
2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)
Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)
Tabele de contingenţă
1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a
tabelelor de contingenţă
2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a
combinaţiilor de perechi ordonate de valori
3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre
a factor de risc si
b starea sănătăţii
4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)
5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)
Tabelul 7 Tabel de contingenţă 2 x 2
49
Grafice
Există două categorii de moduri grafice sub care se pot prezenta datele
1 Ilustraţii şi fotografii
2 Grafice
1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă
pentru lucrare
2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit
Putem vorbi despre mai multe tipuri de grafice
bull Grafice pentru reprezentarea datelor cantitative
1048707 Grafic cartezian (X Y)
1048707 Histograma
1048707 Poligonul de frecvenţe
1048707 Diagrama bdquoscatterrdquo
bull Grafice pentru reprezentarea datelor calitative
1048707 Grafic cu bare
1048707 Diagrama tip bdquoboxplotrdquo
1048707 Diagrama bdquopierdquo
1048707 Cartograma
Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi
dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)
Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)
Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie
Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)
Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)
50
Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir
de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele
două variabile studiate (Figura 6)
Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2
(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2
rămacircne aproximativ constantă)
Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea
comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea
comparativă a mai multor variabile
Figura 7 Grafic calitativ cu bare
51
Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo
Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două
posibilităţi reprezentate grafic este mai frecventă (Figura 8)
Figura 8 Reprezentare tip bdquopierdquo
Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli
sau a oricărui element comparativ Se foloseşte de epidemiologi
Rezultate
Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare
Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o
manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu
explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția
bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la
ilustraţii tabele grafice
Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi
nici rezultatele care invalidează eventual ipoteza
Discuţii
Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd
cultura ştiinţifică şi inteligenţa autorilor
Acest capitol răspunde la trei obiective
Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia
calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de
selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează
rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv
52
este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn
care a fost abordată problema fără a face o revistă a literaturii
Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea
rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul
Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor
afirmaţii nesusţinute de conţinutul lucrării
Concluzii
Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate
să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie
Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de
concluzii va scădea valoarea lucrării
Bibliografia (lista referinţelor citarea icircn text)
Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn
lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente
Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli
- să conţină cele mai importante şi recente lucrări
- să includă numai lucrări publicate
- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate
Bibliografie
Elisabeta Jaba ndash Statistică Ed Economică 1998
Mihai Ţarcă ndash Statistică volI Ed UAIC 1979
Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale
Ed University Press 2009
Sorana Daniela Bolboacă ndash Metodologia cercetării curs
53
Măsoară impactul deceselor premature icircntr-o populaţie Se calculează ca suma diferenţelor dintre speranţa de
viaţă şi vacircrsta la care survine decesul dacă este prematur
Rata APVP este raportul dintre APVP şi populaţia cu vacircrsta sub 65 de ani multiplicată cu
Ani de viaţă pierduţi datorat dizabilităţii
Pentru cunoaşterea stării de sănătate a unei populaţii sunt necesari aceşti indicatori Raţiile şi proporţiile sunt
utilizate pentru a descrie anumite caracteristici ale populaţiei Proporţiile şi ratele sunt folosite pentru
cuantificarea morbidităţii şi mortalităţii Din aceste proporţii se poate cuantifica prezenţa riscului icircn diferite
grupuri
Măsurile primare ale morbidităţii sunt incidenţa şi prevalenţa Pentru a demonstra asocierea dintre un factor de
risc şi o boală se folosesc riscul relativ şi odds ratio
35 Analiza şi interpretarea datelor
După dezvoltarea ideii de-a lungul icircntregului studiu se ajunge icircn momentul icircn care un volum mare de date
trebuie analizat Scopul analizei datelor este stabilirea corectitudinii ideii care a generat studiul
Dacă s-a acordat suficientă atenţie planificării studiului şi a fost asigurată calitatea şi validitatea datelor
colectate şi a metodelor de colectare este de aşteptat ca rezultatul să fie corect (să corespundă scopului
studiului) Analiza datelor implică multă experienţă şi răbdare icircn manipularea datelor obţinute icircn acord cu
plenul de analiză statistică existent icircn protocolul de studiu Este nevoie de o conlucrare multidisciplinară unde
prezenţa biostatisticianului este necesară
Comparaţiile statistice pe care cercetătorul le face sunt aceleaşi cu cele menţionate icircn protocolul de studiu
elaborat icircnainte de colectarea datelor Deci icircn această parte a studiului trebuie urmat icircn totalitate planul elaborat
iniţial Presupunacircnd că urmărirea planului este realizată această parte a studiului va fi o repetare a protocolului
iniţial cu mici modificări necesare Este de icircnţeles că alegerea unui test statistic specific poate
depinde de calitatea datelor culese (dacă o variabilă continuă este sau nu normal distribuită) astfel de multe ori
testul care trebuie aplicat nu poate fi statuat icircn avans La finalul acestei secţiuni trebuie realizată o descriere
clară şi concisă a modului icircn care au fost analizate datele astfel icircncacirct oricine ar dori să poată repeta analiza
Interpretarea rezultatelor statistice
Ipoteza nulă este acceptată numai pentru că nu este respinsă Există deci posibilitatea ca din alterne
motive (număr mic de date) acceptarea ei să fie falsă
Valoarea p poate fi mai mică decacirct pragul de semnificaţie alfa la limită Icircn acest moment intervine
gacircndirea cercetătorului care trebuie să ia o decizie bdquosemnificativ statistic este implică sau nu semnificaţia
ştiinţificărdquo Pentru aprecierea corectă a rezultatelor statistice s-a introdus pe lacircngă valoare p un alt instrument
de decizie Intervalul de confidenţă
42
Interpretarea statistica ne interpretarea clinică
Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă
Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice
obţinute pe eşantionul studiat
Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare
Ce interpretăm Rezultatele
personale obţinute icircn urma studiului
care au fost prezentate icircn secţiunea bdquoRezultaterdquo
Explicăm rezultatele obţinute
Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale
Interpretarea trebuie să se realizeze icircn
lumina limitelor studiului
contextul cultural social şi educaţional al locului unde s-a realizat cercetarea
contextul a ceea ce se cunoaşte din literatura de specialitate
Interpretăm doar rezultatele personale obţinute icircn urma studiului
Interpretarea statistică nu este tot una cu interpretarea clinică
Interpretarea statistică este importantă
Interpretarea clinică este foarte importantă
Intervalul de confidenţă
Media calculată pe baza unui eşantion nu va echivala media populaţiei
Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului
Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a
populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a
populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)
pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru
orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare
dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de
confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de
date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de
5
Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel
Dacă valoarea p este mică
Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare
aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o
medie diferită Diferenţa este semnificativă dpdv statistic
43
Icircn continuare
Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa
reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică
pentru a fi interesante din punct de vedere ştiinţific
Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC
oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care
este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a
obţine o concluzie clară
Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o
diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că
datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din
punct de vedere ştiinţific
Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul
detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat
Erorile studiilor medicale
Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura
anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară
caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea
asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri
legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias
Erorile potenţiale icircn studiile epidemiologice
1 Erori icircntacircmplătoare
2 Erori sistematice
3 Confuzia
4 Validitatea
1 Erori icircntacircmplătoare
Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a
parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel
de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot
fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii
(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor
de măsură (eroarea de măsurare)
44
2 Erori sistematice
Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate
care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu
acurateţe mare Acurateţea nu este afectată de mărimea eşantionului
Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de
experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea
dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus
şi greu de cuantificat (consum de alcool personalitate etc)
Principalele tipuri de erori din această categorie sunt
bull Biasul de selecţie
bull Biasul de informaţie
Biasul de selecţie
Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul
trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion
inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale
persoanelor incluse
Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se
ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia
Biasul de informaţie
Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de
instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze
expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere
nesemnificativă sau chiar să nu şi-o amintească de loc
3 Confuzia
Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune
prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este
cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă
de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte
important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor
protector
4 Validitatea
Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă
Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte
estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional
Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă
45
conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se
demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)
Validitatea externă se poate realiza numai dacă studiul este valid intern
Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii
studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de
studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt
laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi
validă din punct de vedere intern)
3 6 Prezentarea rezultatelor
După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite
Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor
icircntr-o formă bdquodigerabilărdquo este necesară
Scopul prezentării datelor
1 Transmiterea concluziilor studiului
a Datele corecte şi importante merită comunicate
b Datele trebuie să confirme sau să infirme ipoteza studiului
c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală
2 Acordarea posibilităţii altor cercetători să aprecieze studiul
a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti
b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor
prezentate
Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru
fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie
statistică
Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de
valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras
(Tabel 3)
Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)
46
Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct
numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor
precum şi prezentarea acestora sub formă inteligibilă
Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care
convin cercetătorului
Prezentarea datelor se poate face
1 Figuri şi tabele icircn articole scrise
2 Figuri şi tabele icircn prezentări orale
3 Figuri şi tabele icircn postere
4 Text scris sau incluse icircn text
5 Site-uri de WEB
Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor
Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie
Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele
exprimacircnd exact ceea ce acestea exprimă
Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate
anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel
să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se
acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca
mai sus sugestive sunt formatele simple şi puţin icircncărcate
Dacă nu există reguli impuse se respectă
1 Mesaj simplu fără falsificarea datelor
2 De obicei este necesar atacirct tabelul cacirct şi graficul
3 Să fie simplu şi clar
Tabele
Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile
coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică
elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de
1 Se folosesc doar linii orizontale
2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn
evidenţi prin linie de separare (Tabelul 4)
Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland
Noua Zeelandă)
(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)
47
3 Numerele sunt aliniate icircn funcţie de virgulă
4 Indicii statistici sunt explicaţi sub tabel
5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană
6 Abrevierile pot fi folosite
7 Numărul de zecimale trebuie limitat la maxim două
8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel
9 Plasarea legendei este obligatorie sub tabel
10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)
Icircn cazul prezentărilor orale sau a posterelor este indicat ca
1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării
2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte
3 Folosirea de simboluri este permisă
Clasificarea tabelelor
Tabelele se clasifică după
i) conţinut
bull cu distribuţii de frecvenţe
bull de clase de frecvenţe
bull de contingenţă
ii) structura
bull cu doua coloane
bull cu subclasificări
bull ldquomasterrdquo
Tabele ce conţin distribuţii de frecvenţe
O modalitate comodă de a prezenta o mulţime de date brute este
1 Se ordonează datele in ordine crescătoare
2 Se determine frecvenţa fiecărei valori
3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane
(Tabelul 5)
Tabelul 5 Distribuţii de frecvenţă absolută
48
Tabelul claselor de frecvenţe
1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă
2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)
Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)
Tabele de contingenţă
1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a
tabelelor de contingenţă
2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a
combinaţiilor de perechi ordonate de valori
3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre
a factor de risc si
b starea sănătăţii
4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)
5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)
Tabelul 7 Tabel de contingenţă 2 x 2
49
Grafice
Există două categorii de moduri grafice sub care se pot prezenta datele
1 Ilustraţii şi fotografii
2 Grafice
1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă
pentru lucrare
2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit
Putem vorbi despre mai multe tipuri de grafice
bull Grafice pentru reprezentarea datelor cantitative
1048707 Grafic cartezian (X Y)
1048707 Histograma
1048707 Poligonul de frecvenţe
1048707 Diagrama bdquoscatterrdquo
bull Grafice pentru reprezentarea datelor calitative
1048707 Grafic cu bare
1048707 Diagrama tip bdquoboxplotrdquo
1048707 Diagrama bdquopierdquo
1048707 Cartograma
Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi
dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)
Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)
Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie
Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)
Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)
50
Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir
de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele
două variabile studiate (Figura 6)
Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2
(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2
rămacircne aproximativ constantă)
Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea
comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea
comparativă a mai multor variabile
Figura 7 Grafic calitativ cu bare
51
Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo
Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două
posibilităţi reprezentate grafic este mai frecventă (Figura 8)
Figura 8 Reprezentare tip bdquopierdquo
Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli
sau a oricărui element comparativ Se foloseşte de epidemiologi
Rezultate
Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare
Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o
manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu
explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția
bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la
ilustraţii tabele grafice
Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi
nici rezultatele care invalidează eventual ipoteza
Discuţii
Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd
cultura ştiinţifică şi inteligenţa autorilor
Acest capitol răspunde la trei obiective
Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia
calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de
selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează
rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv
52
este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn
care a fost abordată problema fără a face o revistă a literaturii
Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea
rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul
Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor
afirmaţii nesusţinute de conţinutul lucrării
Concluzii
Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate
să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie
Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de
concluzii va scădea valoarea lucrării
Bibliografia (lista referinţelor citarea icircn text)
Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn
lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente
Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli
- să conţină cele mai importante şi recente lucrări
- să includă numai lucrări publicate
- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate
Bibliografie
Elisabeta Jaba ndash Statistică Ed Economică 1998
Mihai Ţarcă ndash Statistică volI Ed UAIC 1979
Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale
Ed University Press 2009
Sorana Daniela Bolboacă ndash Metodologia cercetării curs
53
Interpretarea statistica ne interpretarea clinică
Interpretarea statistică ne spune doar dacă ipoteza statistică testată este acceptată sau respinsă
Interpretarea clinică ne permite să specificăm semnificaţia clinică a rezultatelor statistice
obţinute pe eşantionul studiat
Odată cu interpretarea rezultatelor pot apărea noi ipoteze de cercetare
Ce interpretăm Rezultatele
personale obţinute icircn urma studiului
care au fost prezentate icircn secţiunea bdquoRezultaterdquo
Explicăm rezultatele obţinute
Referim rezultate obţinute de alţi cercetători şi le comparăm cu rezultatele personale
Interpretarea trebuie să se realizeze icircn
lumina limitelor studiului
contextul cultural social şi educaţional al locului unde s-a realizat cercetarea
contextul a ceea ce se cunoaşte din literatura de specialitate
Interpretăm doar rezultatele personale obţinute icircn urma studiului
Interpretarea statistică nu este tot una cu interpretarea clinică
Interpretarea statistică este importantă
Interpretarea clinică este foarte importantă
Intervalul de confidenţă
Media calculată pe baza unui eşantion nu va echivala media populaţiei
Dimensiunea diferenţei depinde de mărimea şi variabilitatea eşantionului
Dacă eşantionul este mic şisau cu varianţă mare media acestuia poate fi destul de icircndepărtată de cea a
populaţiei Dacă eşantionul este mare cu puţine fluctuaţii media va fi probabil foarte apropiată de cea a
populaţiei Calculele statistice combină mărimea dimensiunea eşantionului şi variabilitatea (deviaţia standard)
pentru a genera un interval de confidenţă (IC) pentru media populaţiei Puteţi să calculaţi intervalele pentru
orice grad de siguranţă dar 95 este valoarea utilizată Dacă presupuneţi că eşantionul este ales la icircntacircmplare
dintr-o populaţie care respectă distribuţia gaussiană putem fi siguri icircn procent de 95 că intervalul de
confidenţă include media populaţiei Mai precis dacă formăm mai multe IC de 95 din mai multe seturi de
date ne aşteptăm că IC să cuprindă adevărata valoare medie icircn 95 din cazuri şi să nu o includă icircn restul de
5
Decizia de bdquosemnificativ ştiinţificrdquo se va lua pe baza IC şi p astfel
Dacă valoarea p este mică
Diferenţa observată icircntre media eşantionului şi cea ipotetică nu este rezultatul unei coincidenţe de colectare
aleatoare a datelor Se respinge ideea că diferenţa este o coincidenţă şi se concluzionează că populaţia are o
medie diferită Diferenţa este semnificativă dpdv statistic
43
Icircn continuare
Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa
reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică
pentru a fi interesante din punct de vedere ştiinţific
Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC
oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care
este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a
obţine o concluzie clară
Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o
diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că
datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din
punct de vedere ştiinţific
Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul
detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat
Erorile studiilor medicale
Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura
anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară
caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea
asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri
legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias
Erorile potenţiale icircn studiile epidemiologice
1 Erori icircntacircmplătoare
2 Erori sistematice
3 Confuzia
4 Validitatea
1 Erori icircntacircmplătoare
Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a
parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel
de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot
fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii
(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor
de măsură (eroarea de măsurare)
44
2 Erori sistematice
Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate
care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu
acurateţe mare Acurateţea nu este afectată de mărimea eşantionului
Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de
experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea
dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus
şi greu de cuantificat (consum de alcool personalitate etc)
Principalele tipuri de erori din această categorie sunt
bull Biasul de selecţie
bull Biasul de informaţie
Biasul de selecţie
Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul
trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion
inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale
persoanelor incluse
Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se
ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia
Biasul de informaţie
Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de
instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze
expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere
nesemnificativă sau chiar să nu şi-o amintească de loc
3 Confuzia
Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune
prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este
cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă
de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte
important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor
protector
4 Validitatea
Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă
Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte
estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional
Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă
45
conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se
demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)
Validitatea externă se poate realiza numai dacă studiul este valid intern
Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii
studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de
studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt
laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi
validă din punct de vedere intern)
3 6 Prezentarea rezultatelor
După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite
Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor
icircntr-o formă bdquodigerabilărdquo este necesară
Scopul prezentării datelor
1 Transmiterea concluziilor studiului
a Datele corecte şi importante merită comunicate
b Datele trebuie să confirme sau să infirme ipoteza studiului
c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală
2 Acordarea posibilităţii altor cercetători să aprecieze studiul
a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti
b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor
prezentate
Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru
fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie
statistică
Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de
valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras
(Tabel 3)
Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)
46
Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct
numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor
precum şi prezentarea acestora sub formă inteligibilă
Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care
convin cercetătorului
Prezentarea datelor se poate face
1 Figuri şi tabele icircn articole scrise
2 Figuri şi tabele icircn prezentări orale
3 Figuri şi tabele icircn postere
4 Text scris sau incluse icircn text
5 Site-uri de WEB
Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor
Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie
Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele
exprimacircnd exact ceea ce acestea exprimă
Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate
anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel
să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se
acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca
mai sus sugestive sunt formatele simple şi puţin icircncărcate
Dacă nu există reguli impuse se respectă
1 Mesaj simplu fără falsificarea datelor
2 De obicei este necesar atacirct tabelul cacirct şi graficul
3 Să fie simplu şi clar
Tabele
Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile
coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică
elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de
1 Se folosesc doar linii orizontale
2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn
evidenţi prin linie de separare (Tabelul 4)
Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland
Noua Zeelandă)
(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)
47
3 Numerele sunt aliniate icircn funcţie de virgulă
4 Indicii statistici sunt explicaţi sub tabel
5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană
6 Abrevierile pot fi folosite
7 Numărul de zecimale trebuie limitat la maxim două
8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel
9 Plasarea legendei este obligatorie sub tabel
10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)
Icircn cazul prezentărilor orale sau a posterelor este indicat ca
1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării
2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte
3 Folosirea de simboluri este permisă
Clasificarea tabelelor
Tabelele se clasifică după
i) conţinut
bull cu distribuţii de frecvenţe
bull de clase de frecvenţe
bull de contingenţă
ii) structura
bull cu doua coloane
bull cu subclasificări
bull ldquomasterrdquo
Tabele ce conţin distribuţii de frecvenţe
O modalitate comodă de a prezenta o mulţime de date brute este
1 Se ordonează datele in ordine crescătoare
2 Se determine frecvenţa fiecărei valori
3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane
(Tabelul 5)
Tabelul 5 Distribuţii de frecvenţă absolută
48
Tabelul claselor de frecvenţe
1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă
2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)
Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)
Tabele de contingenţă
1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a
tabelelor de contingenţă
2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a
combinaţiilor de perechi ordonate de valori
3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre
a factor de risc si
b starea sănătăţii
4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)
5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)
Tabelul 7 Tabel de contingenţă 2 x 2
49
Grafice
Există două categorii de moduri grafice sub care se pot prezenta datele
1 Ilustraţii şi fotografii
2 Grafice
1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă
pentru lucrare
2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit
Putem vorbi despre mai multe tipuri de grafice
bull Grafice pentru reprezentarea datelor cantitative
1048707 Grafic cartezian (X Y)
1048707 Histograma
1048707 Poligonul de frecvenţe
1048707 Diagrama bdquoscatterrdquo
bull Grafice pentru reprezentarea datelor calitative
1048707 Grafic cu bare
1048707 Diagrama tip bdquoboxplotrdquo
1048707 Diagrama bdquopierdquo
1048707 Cartograma
Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi
dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)
Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)
Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie
Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)
Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)
50
Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir
de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele
două variabile studiate (Figura 6)
Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2
(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2
rămacircne aproximativ constantă)
Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea
comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea
comparativă a mai multor variabile
Figura 7 Grafic calitativ cu bare
51
Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo
Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două
posibilităţi reprezentate grafic este mai frecventă (Figura 8)
Figura 8 Reprezentare tip bdquopierdquo
Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli
sau a oricărui element comparativ Se foloseşte de epidemiologi
Rezultate
Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare
Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o
manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu
explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția
bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la
ilustraţii tabele grafice
Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi
nici rezultatele care invalidează eventual ipoteza
Discuţii
Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd
cultura ştiinţifică şi inteligenţa autorilor
Acest capitol răspunde la trei obiective
Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia
calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de
selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează
rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv
52
este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn
care a fost abordată problema fără a face o revistă a literaturii
Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea
rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul
Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor
afirmaţii nesusţinute de conţinutul lucrării
Concluzii
Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate
să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie
Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de
concluzii va scădea valoarea lucrării
Bibliografia (lista referinţelor citarea icircn text)
Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn
lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente
Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli
- să conţină cele mai importante şi recente lucrări
- să includă numai lucrări publicate
- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate
Bibliografie
Elisabeta Jaba ndash Statistică Ed Economică 1998
Mihai Ţarcă ndash Statistică volI Ed UAIC 1979
Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale
Ed University Press 2009
Sorana Daniela Bolboacă ndash Metodologia cercetării curs
53
Icircn continuare
Limitele IC sunt largi ndash deşi diferenţa reală nu este egală cu 0 din moment (ce valoarea p este mică ) diferenţa
reală este mică şi neinteresantă Datele au o medie diferită de valoarea reală icircnsă diferenţa este prea mică
pentru a fi interesante din punct de vedere ştiinţific
Limita inferioară a IC este depărtată de media eşantionului iar cea superioară este apropiată ndash deoarece IC
oscilează de la o diferenţă despre care spunem că este neimportantă din punct de vedere biologic la una care
este importantă nu se poate trage o concluzie clară din datele colectate Este nevoie de mai multe date pentru a
obţine o concluzie clară
Ambele limite ale CI sunt apropiate ndash din moment ce pacircnă şi limita inferioară a intervalului reprezintă o
diferenţă destul de mare pentru a fi considerată importantă din punct de vedere biologic se poate spune că
datele au o medie diferită de valoarea ipotetică şi că diferenţa este destul de mare pentru a fi relevantă din
punct de vedere ştiinţific
Dacă valoarea p este mai mare decacirct pragul impus (005) semnificaţia ştiinţifică poate fi discutată icircn contextul
detectării unor erori de colectare eşantionare de măsură care ar putea duce la obţinerea acestui rezultat
Erorile studiilor medicale
Termenul generic pentru erorile existente icircn studiile epidemiologice este cel de bdquobiasrdquo preluat din literatura
anglo ndash saxonă cu o semnificaţie de bdquoa apuca pe un drum greşitrdquo Studiile epidemiologice măsoară
caracteristici populaţionale Parametrii de interes pot fi rate indici de prevalenţă incidenţă sau cel mai adesea
asocieri icircntre expunere şi boală Pentru că aceste studii sunt realizate cu oameni sunt supuse unor constracircngeri
legate subiecţii icircn studiu de aspecte etice şi de design de studiu care aproape invariabil generează bias
Erorile potenţiale icircn studiile epidemiologice
1 Erori icircntacircmplătoare
2 Erori sistematice
3 Confuzia
4 Validitatea
1 Erori icircntacircmplătoare
Sunt neconcordanţe datorate exclusiv icircntacircmplării icircntre o observaţie efectuată pe un eşantion şi valoarea reală a
parametrului icircn populaţie Determină o lipsă de precizie icircn măsurarea unei asocieri Există trei surse de astfel
de erori variabilitatea biologică individuală eroarea de eşantionaj şi eroarea de măsurare Aceste erori nu pot
fi eliminate complet icircnsă pot fi reduse prin măsurarea atentă a expunerii şi a rezultatului expunerii
(variabilitatea biologică) creşterea taliei eşantionului (eroarea de eşantionaj) sau prin validarea instrumentelor
de măsură (eroarea de măsurare)
44
2 Erori sistematice
Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate
care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu
acurateţe mare Acurateţea nu este afectată de mărimea eşantionului
Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de
experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea
dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus
şi greu de cuantificat (consum de alcool personalitate etc)
Principalele tipuri de erori din această categorie sunt
bull Biasul de selecţie
bull Biasul de informaţie
Biasul de selecţie
Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul
trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion
inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale
persoanelor incluse
Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se
ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia
Biasul de informaţie
Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de
instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze
expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere
nesemnificativă sau chiar să nu şi-o amintească de loc
3 Confuzia
Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune
prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este
cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă
de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte
important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor
protector
4 Validitatea
Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă
Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte
estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional
Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă
45
conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se
demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)
Validitatea externă se poate realiza numai dacă studiul este valid intern
Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii
studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de
studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt
laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi
validă din punct de vedere intern)
3 6 Prezentarea rezultatelor
După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite
Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor
icircntr-o formă bdquodigerabilărdquo este necesară
Scopul prezentării datelor
1 Transmiterea concluziilor studiului
a Datele corecte şi importante merită comunicate
b Datele trebuie să confirme sau să infirme ipoteza studiului
c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală
2 Acordarea posibilităţii altor cercetători să aprecieze studiul
a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti
b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor
prezentate
Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru
fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie
statistică
Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de
valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras
(Tabel 3)
Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)
46
Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct
numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor
precum şi prezentarea acestora sub formă inteligibilă
Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care
convin cercetătorului
Prezentarea datelor se poate face
1 Figuri şi tabele icircn articole scrise
2 Figuri şi tabele icircn prezentări orale
3 Figuri şi tabele icircn postere
4 Text scris sau incluse icircn text
5 Site-uri de WEB
Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor
Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie
Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele
exprimacircnd exact ceea ce acestea exprimă
Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate
anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel
să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se
acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca
mai sus sugestive sunt formatele simple şi puţin icircncărcate
Dacă nu există reguli impuse se respectă
1 Mesaj simplu fără falsificarea datelor
2 De obicei este necesar atacirct tabelul cacirct şi graficul
3 Să fie simplu şi clar
Tabele
Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile
coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică
elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de
1 Se folosesc doar linii orizontale
2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn
evidenţi prin linie de separare (Tabelul 4)
Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland
Noua Zeelandă)
(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)
47
3 Numerele sunt aliniate icircn funcţie de virgulă
4 Indicii statistici sunt explicaţi sub tabel
5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană
6 Abrevierile pot fi folosite
7 Numărul de zecimale trebuie limitat la maxim două
8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel
9 Plasarea legendei este obligatorie sub tabel
10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)
Icircn cazul prezentărilor orale sau a posterelor este indicat ca
1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării
2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte
3 Folosirea de simboluri este permisă
Clasificarea tabelelor
Tabelele se clasifică după
i) conţinut
bull cu distribuţii de frecvenţe
bull de clase de frecvenţe
bull de contingenţă
ii) structura
bull cu doua coloane
bull cu subclasificări
bull ldquomasterrdquo
Tabele ce conţin distribuţii de frecvenţe
O modalitate comodă de a prezenta o mulţime de date brute este
1 Se ordonează datele in ordine crescătoare
2 Se determine frecvenţa fiecărei valori
3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane
(Tabelul 5)
Tabelul 5 Distribuţii de frecvenţă absolută
48
Tabelul claselor de frecvenţe
1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă
2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)
Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)
Tabele de contingenţă
1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a
tabelelor de contingenţă
2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a
combinaţiilor de perechi ordonate de valori
3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre
a factor de risc si
b starea sănătăţii
4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)
5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)
Tabelul 7 Tabel de contingenţă 2 x 2
49
Grafice
Există două categorii de moduri grafice sub care se pot prezenta datele
1 Ilustraţii şi fotografii
2 Grafice
1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă
pentru lucrare
2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit
Putem vorbi despre mai multe tipuri de grafice
bull Grafice pentru reprezentarea datelor cantitative
1048707 Grafic cartezian (X Y)
1048707 Histograma
1048707 Poligonul de frecvenţe
1048707 Diagrama bdquoscatterrdquo
bull Grafice pentru reprezentarea datelor calitative
1048707 Grafic cu bare
1048707 Diagrama tip bdquoboxplotrdquo
1048707 Diagrama bdquopierdquo
1048707 Cartograma
Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi
dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)
Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)
Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie
Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)
Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)
50
Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir
de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele
două variabile studiate (Figura 6)
Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2
(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2
rămacircne aproximativ constantă)
Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea
comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea
comparativă a mai multor variabile
Figura 7 Grafic calitativ cu bare
51
Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo
Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două
posibilităţi reprezentate grafic este mai frecventă (Figura 8)
Figura 8 Reprezentare tip bdquopierdquo
Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli
sau a oricărui element comparativ Se foloseşte de epidemiologi
Rezultate
Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare
Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o
manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu
explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția
bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la
ilustraţii tabele grafice
Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi
nici rezultatele care invalidează eventual ipoteza
Discuţii
Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd
cultura ştiinţifică şi inteligenţa autorilor
Acest capitol răspunde la trei obiective
Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia
calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de
selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează
rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv
52
este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn
care a fost abordată problema fără a face o revistă a literaturii
Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea
rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul
Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor
afirmaţii nesusţinute de conţinutul lucrării
Concluzii
Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate
să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie
Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de
concluzii va scădea valoarea lucrării
Bibliografia (lista referinţelor citarea icircn text)
Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn
lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente
Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli
- să conţină cele mai importante şi recente lucrări
- să includă numai lucrări publicate
- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate
Bibliografie
Elisabeta Jaba ndash Statistică Ed Economică 1998
Mihai Ţarcă ndash Statistică volI Ed UAIC 1979
Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale
Ed University Press 2009
Sorana Daniela Bolboacă ndash Metodologia cercetării curs
53
2 Erori sistematice
Acest tip de erori apar atunci cacircnd icircn cadrul studiilor epidemiologice există tendinţa de a se obţine rezultate
care sunt diferite icircn mod sistematic de valorile reale Un studiu cu o eroare sistematică mică este practic cu
acurateţe mare Acurateţea nu este afectată de mărimea eşantionului
Eroarea sistematică constituie un risc de tip special pentru epidemiologi pentru că aceştia spre deosebire de
experimentul de laborator nu pot avea un control foarte bun asupra subiecţilor investigaţi Este de asemenea
dificil destul de frecvent să se obţină un eşantion de studiu reprezentativ calitativ Unele variabile sunt icircn plus
şi greu de cuantificat (consum de alcool personalitate etc)
Principalele tipuri de erori din această categorie sunt
bull Biasul de selecţie
bull Biasul de informaţie
Biasul de selecţie
Acesta intervine atunci cacircnd subiecţii studiaţi nu sunt reprezentativi pentru populaţia ţintă despre care studiul
trebuie să tragă concluzii Sunt descrise două moduri de apariţie a acestui tip de bias selectarea unui eşantion
inadecvat (nereprezentativ pentru populaţia ţintă) sau datorită unor eventuale răspunsuri incomplete ale
persoanelor incluse
Posibilitatea apariţiei biasului de selecţie trebuie luat icircn considerare icircn momentul alcătuirii lotului de studiu Se
ţine cont atacirct de talia calculabilă a eşantionului cacirct şi de reprezentativitate calitativă a acestuia
Biasul de informaţie
Acest bias ia naştere din erori care derivă din proasta măsurare a expunerii sau a bolii Aici se vorbeşte de
instrumente de măsură greşit alese Este forate posibil ca persoanele aflate icircn lotul caz să supraevalueze
expunerea la un anumit factor de risc iar persoanele din lotul martor să considere eventuala expunere
nesemnificativă sau chiar să nu şi-o amintească de loc
3 Confuzia
Apare cel mai frecvent atunci cacircnd se studiază o eventuală asociere icircntre un factor de risc şi o boală Presupune
prezenţa unui al treilea factor de risc care poate avea ca rezultat apariţia aceleaşi boli Practic deşi boala este
cauzată de doi factori de risc se ia icircn calcul numai unul dintre ei apăracircnd astfel o asociere mult crescută faţă
de realitate pentru un factor sau chiar scăderea asocierii cu alt factor de risc Poate avea un rol foarte
important icircn apariţia de rezultate false mergacircnd pacircnă la schimbarea statutului de factor de risc icircn factor
protector
4 Validitatea
Validitatea se poate exprima ca adevăr sau realitate Există validitate internă şi externă
Validitatea externă reprezintă caracteristica de generalizare a concluziilor unui studiu Cu alte cuvinte
estimatorul calculat pe baza studiului pe eşantion poate fi extrapolat spre aflarea parametrului populaţional
Dacă rezultatele studiului pot să fie sau nu generalizate este o icircntrebare la care trebuie să răspundă
45
conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se
demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)
Validitatea externă se poate realiza numai dacă studiul este valid intern
Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii
studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de
studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt
laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi
validă din punct de vedere intern)
3 6 Prezentarea rezultatelor
După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite
Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor
icircntr-o formă bdquodigerabilărdquo este necesară
Scopul prezentării datelor
1 Transmiterea concluziilor studiului
a Datele corecte şi importante merită comunicate
b Datele trebuie să confirme sau să infirme ipoteza studiului
c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală
2 Acordarea posibilităţii altor cercetători să aprecieze studiul
a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti
b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor
prezentate
Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru
fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie
statistică
Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de
valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras
(Tabel 3)
Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)
46
Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct
numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor
precum şi prezentarea acestora sub formă inteligibilă
Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care
convin cercetătorului
Prezentarea datelor se poate face
1 Figuri şi tabele icircn articole scrise
2 Figuri şi tabele icircn prezentări orale
3 Figuri şi tabele icircn postere
4 Text scris sau incluse icircn text
5 Site-uri de WEB
Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor
Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie
Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele
exprimacircnd exact ceea ce acestea exprimă
Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate
anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel
să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se
acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca
mai sus sugestive sunt formatele simple şi puţin icircncărcate
Dacă nu există reguli impuse se respectă
1 Mesaj simplu fără falsificarea datelor
2 De obicei este necesar atacirct tabelul cacirct şi graficul
3 Să fie simplu şi clar
Tabele
Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile
coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică
elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de
1 Se folosesc doar linii orizontale
2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn
evidenţi prin linie de separare (Tabelul 4)
Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland
Noua Zeelandă)
(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)
47
3 Numerele sunt aliniate icircn funcţie de virgulă
4 Indicii statistici sunt explicaţi sub tabel
5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană
6 Abrevierile pot fi folosite
7 Numărul de zecimale trebuie limitat la maxim două
8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel
9 Plasarea legendei este obligatorie sub tabel
10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)
Icircn cazul prezentărilor orale sau a posterelor este indicat ca
1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării
2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte
3 Folosirea de simboluri este permisă
Clasificarea tabelelor
Tabelele se clasifică după
i) conţinut
bull cu distribuţii de frecvenţe
bull de clase de frecvenţe
bull de contingenţă
ii) structura
bull cu doua coloane
bull cu subclasificări
bull ldquomasterrdquo
Tabele ce conţin distribuţii de frecvenţe
O modalitate comodă de a prezenta o mulţime de date brute este
1 Se ordonează datele in ordine crescătoare
2 Se determine frecvenţa fiecărei valori
3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane
(Tabelul 5)
Tabelul 5 Distribuţii de frecvenţă absolută
48
Tabelul claselor de frecvenţe
1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă
2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)
Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)
Tabele de contingenţă
1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a
tabelelor de contingenţă
2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a
combinaţiilor de perechi ordonate de valori
3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre
a factor de risc si
b starea sănătăţii
4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)
5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)
Tabelul 7 Tabel de contingenţă 2 x 2
49
Grafice
Există două categorii de moduri grafice sub care se pot prezenta datele
1 Ilustraţii şi fotografii
2 Grafice
1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă
pentru lucrare
2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit
Putem vorbi despre mai multe tipuri de grafice
bull Grafice pentru reprezentarea datelor cantitative
1048707 Grafic cartezian (X Y)
1048707 Histograma
1048707 Poligonul de frecvenţe
1048707 Diagrama bdquoscatterrdquo
bull Grafice pentru reprezentarea datelor calitative
1048707 Grafic cu bare
1048707 Diagrama tip bdquoboxplotrdquo
1048707 Diagrama bdquopierdquo
1048707 Cartograma
Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi
dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)
Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)
Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie
Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)
Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)
50
Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir
de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele
două variabile studiate (Figura 6)
Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2
(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2
rămacircne aproximativ constantă)
Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea
comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea
comparativă a mai multor variabile
Figura 7 Grafic calitativ cu bare
51
Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo
Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două
posibilităţi reprezentate grafic este mai frecventă (Figura 8)
Figura 8 Reprezentare tip bdquopierdquo
Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli
sau a oricărui element comparativ Se foloseşte de epidemiologi
Rezultate
Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare
Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o
manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu
explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția
bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la
ilustraţii tabele grafice
Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi
nici rezultatele care invalidează eventual ipoteza
Discuţii
Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd
cultura ştiinţifică şi inteligenţa autorilor
Acest capitol răspunde la trei obiective
Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia
calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de
selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează
rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv
52
este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn
care a fost abordată problema fără a face o revistă a literaturii
Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea
rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul
Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor
afirmaţii nesusţinute de conţinutul lucrării
Concluzii
Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate
să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie
Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de
concluzii va scădea valoarea lucrării
Bibliografia (lista referinţelor citarea icircn text)
Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn
lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente
Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli
- să conţină cele mai importante şi recente lucrări
- să includă numai lucrări publicate
- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate
Bibliografie
Elisabeta Jaba ndash Statistică Ed Economică 1998
Mihai Ţarcă ndash Statistică volI Ed UAIC 1979
Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale
Ed University Press 2009
Sorana Daniela Bolboacă ndash Metodologia cercetării curs
53
conducătorul studiului (Ex scăderea colesterolului la bărbaţi este relevantă şi pentru femei pentru a se
demonstra acest lucru trebuie să fie judecate lucrurile icircn funcţie de validitatea externă pentru bărbaţi)
Validitatea externă se poate realiza numai dacă studiul este valid intern
Validitatea internă Un studiu este valid intern dacă datele măsurate reprezintă corect adevărul despre subiecţii
studiaţi Altfel spus rezultatele obţinute nu sunt datorate icircntacircmplării biasului confuziei sau a unui protocol de
studiu prost ales (ex concentraţia Hb trebuie să diferenţieze persoanele anemice din studiu analiza icircn alt
laborator poate să dea alte rezultate din cauza erorilor sistematice dar asocierea cu anemia poate totuşi fi
validă din punct de vedere intern)
3 6 Prezentarea rezultatelor
După culegerea informaţiei cercetătorul este icircn faţa unui număr mare de cifre care sunt pur şi simplu icircnşiruite
Aceste cifre reprezintă icircnsă rezultatul unei cercetări care poate necesita un efort considerabil Aducerea lor
icircntr-o formă bdquodigerabilărdquo este necesară
Scopul prezentării datelor
1 Transmiterea concluziilor studiului
a Datele corecte şi importante merită comunicate
b Datele trebuie să confirme sau să infirme ipoteza studiului
c Datele arată dacă studiul a dus la descoperirea a ceva important pentru lumea ştiinţifică medicală
2 Acordarea posibilităţii altor cercetători să aprecieze studiul
a Articolele ştiinţifice sunt supuse lecturii critice a altor specialişti
b Cercetătorii care citesc lucrarea trebuie să poată să-şi dezvolte propriul raţionament pe baza datelor
prezentate
Este de reţinut că fiecare variabilă măsurată (TA Colesterol Glicemie) are mai multe valori numerice pentru
fiecare pacient investigat Icircnşiruirea de cifre reprezentacircnd valori pe care o varibilă le ia se defineşte ca serie
statistică
Este cel mai simplu mod de a prezenta o variabilă fiind icircnsă puţin sugestiv pentru cel care citeşte Numărul de
valori este egal cu talia eşantionului Se ajunge la un tabel simplu din care orice concluzie este dificil de tras
(Tabel 3)
Tabelul 3 Tabel de prezentare a datelor (vacircrsta pacienţilor din lotul studiat)
46
Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct
numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor
precum şi prezentarea acestora sub formă inteligibilă
Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care
convin cercetătorului
Prezentarea datelor se poate face
1 Figuri şi tabele icircn articole scrise
2 Figuri şi tabele icircn prezentări orale
3 Figuri şi tabele icircn postere
4 Text scris sau incluse icircn text
5 Site-uri de WEB
Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor
Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie
Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele
exprimacircnd exact ceea ce acestea exprimă
Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate
anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel
să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se
acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca
mai sus sugestive sunt formatele simple şi puţin icircncărcate
Dacă nu există reguli impuse se respectă
1 Mesaj simplu fără falsificarea datelor
2 De obicei este necesar atacirct tabelul cacirct şi graficul
3 Să fie simplu şi clar
Tabele
Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile
coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică
elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de
1 Se folosesc doar linii orizontale
2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn
evidenţi prin linie de separare (Tabelul 4)
Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland
Noua Zeelandă)
(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)
47
3 Numerele sunt aliniate icircn funcţie de virgulă
4 Indicii statistici sunt explicaţi sub tabel
5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană
6 Abrevierile pot fi folosite
7 Numărul de zecimale trebuie limitat la maxim două
8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel
9 Plasarea legendei este obligatorie sub tabel
10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)
Icircn cazul prezentărilor orale sau a posterelor este indicat ca
1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării
2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte
3 Folosirea de simboluri este permisă
Clasificarea tabelelor
Tabelele se clasifică după
i) conţinut
bull cu distribuţii de frecvenţe
bull de clase de frecvenţe
bull de contingenţă
ii) structura
bull cu doua coloane
bull cu subclasificări
bull ldquomasterrdquo
Tabele ce conţin distribuţii de frecvenţe
O modalitate comodă de a prezenta o mulţime de date brute este
1 Se ordonează datele in ordine crescătoare
2 Se determine frecvenţa fiecărei valori
3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane
(Tabelul 5)
Tabelul 5 Distribuţii de frecvenţă absolută
48
Tabelul claselor de frecvenţe
1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă
2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)
Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)
Tabele de contingenţă
1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a
tabelelor de contingenţă
2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a
combinaţiilor de perechi ordonate de valori
3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre
a factor de risc si
b starea sănătăţii
4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)
5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)
Tabelul 7 Tabel de contingenţă 2 x 2
49
Grafice
Există două categorii de moduri grafice sub care se pot prezenta datele
1 Ilustraţii şi fotografii
2 Grafice
1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă
pentru lucrare
2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit
Putem vorbi despre mai multe tipuri de grafice
bull Grafice pentru reprezentarea datelor cantitative
1048707 Grafic cartezian (X Y)
1048707 Histograma
1048707 Poligonul de frecvenţe
1048707 Diagrama bdquoscatterrdquo
bull Grafice pentru reprezentarea datelor calitative
1048707 Grafic cu bare
1048707 Diagrama tip bdquoboxplotrdquo
1048707 Diagrama bdquopierdquo
1048707 Cartograma
Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi
dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)
Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)
Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie
Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)
Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)
50
Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir
de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele
două variabile studiate (Figura 6)
Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2
(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2
rămacircne aproximativ constantă)
Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea
comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea
comparativă a mai multor variabile
Figura 7 Grafic calitativ cu bare
51
Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo
Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două
posibilităţi reprezentate grafic este mai frecventă (Figura 8)
Figura 8 Reprezentare tip bdquopierdquo
Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli
sau a oricărui element comparativ Se foloseşte de epidemiologi
Rezultate
Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare
Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o
manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu
explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția
bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la
ilustraţii tabele grafice
Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi
nici rezultatele care invalidează eventual ipoteza
Discuţii
Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd
cultura ştiinţifică şi inteligenţa autorilor
Acest capitol răspunde la trei obiective
Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia
calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de
selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează
rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv
52
este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn
care a fost abordată problema fără a face o revistă a literaturii
Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea
rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul
Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor
afirmaţii nesusţinute de conţinutul lucrării
Concluzii
Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate
să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie
Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de
concluzii va scădea valoarea lucrării
Bibliografia (lista referinţelor citarea icircn text)
Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn
lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente
Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli
- să conţină cele mai importante şi recente lucrări
- să includă numai lucrări publicate
- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate
Bibliografie
Elisabeta Jaba ndash Statistică Ed Economică 1998
Mihai Ţarcă ndash Statistică volI Ed UAIC 1979
Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale
Ed University Press 2009
Sorana Daniela Bolboacă ndash Metodologia cercetării curs
53
Icircn cazul unui număr redus de icircnregistrări este mai uşor de apreciat semnificaţia rezultatelor Cu cacirct
numărul de date creşte cu atacirct semnificaţia devine mai neclară Devine absolut necesară ordonarea datelor
precum şi prezentarea acestora sub formă inteligibilă
Primul pas este ordonarea datelor Se poate face crescător descrescător sau folosind alte criterii care
convin cercetătorului
Prezentarea datelor se poate face
1 Figuri şi tabele icircn articole scrise
2 Figuri şi tabele icircn prezentări orale
3 Figuri şi tabele icircn postere
4 Text scris sau incluse icircn text
5 Site-uri de WEB
Trebuie luate icircn calcul cacircteva aspecte care influenţează reprezentarea grafică a datelor
Ambiguitatea Datele trebuie prezentate icircn aşa fel icircncacirct să arate ceea ce trebuie
Datele din figuri şi legendele figurilor trebuie să fie identice iar titlurile să fie aşezate lacircngă figuri sau tabele
exprimacircnd exact ceea ce acestea exprimă
Formatul Este necesar ca cel care face prezentarea să ştie foarte exact cum se folosesc şi la ce sunt indicate
anumite tipuri de grafice sau tabele Este foarte important din acest punct de vedere ca fiecare figură sau tabel
să aibă legendă explicativă care să fie suficient de explicită icircncacirct figura sau tabelul să se explice singure Se
acordă icircn mod obligatoriu atenţie fiecărui detaliu icircncacirct să nu scape nici o eroare Icircn aceeaşi măsură ca
mai sus sugestive sunt formatele simple şi puţin icircncărcate
Dacă nu există reguli impuse se respectă
1 Mesaj simplu fără falsificarea datelor
2 De obicei este necesar atacirct tabelul cacirct şi graficul
3 Să fie simplu şi clar
Tabele
Este obligatoriu ca un tabel să se explice singur Icircnseamnă că trebuie ca titlul să fie cuprinzător iar titlurile
coloanelor să fie concise iar icircn cazul unor date numerice să indice unitatea de măsură Icircntr-o lucrare ştiinţifică
elaborată după standarde generice icircn ceea ce priveşte tabelele trebuie ţinut cont de
1 Se folosesc doar linii orizontale
2 Separarea icircntre racircnduri se face doar pentru primul şi ultimul racircnd eventual dacă există un bdquototalrdquo se scoate icircn
evidenţi prin linie de separare (Tabelul 4)
Tabelul 4 Rata internărilor icircn spital pentru astm la 100000 de locuitori pe grupe de vacircrstă (Aukland
Noua Zeelandă)
(reprodus după R Beaglehole bdquoBazele epidemiologieirdquo)
47
3 Numerele sunt aliniate icircn funcţie de virgulă
4 Indicii statistici sunt explicaţi sub tabel
5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană
6 Abrevierile pot fi folosite
7 Numărul de zecimale trebuie limitat la maxim două
8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel
9 Plasarea legendei este obligatorie sub tabel
10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)
Icircn cazul prezentărilor orale sau a posterelor este indicat ca
1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării
2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte
3 Folosirea de simboluri este permisă
Clasificarea tabelelor
Tabelele se clasifică după
i) conţinut
bull cu distribuţii de frecvenţe
bull de clase de frecvenţe
bull de contingenţă
ii) structura
bull cu doua coloane
bull cu subclasificări
bull ldquomasterrdquo
Tabele ce conţin distribuţii de frecvenţe
O modalitate comodă de a prezenta o mulţime de date brute este
1 Se ordonează datele in ordine crescătoare
2 Se determine frecvenţa fiecărei valori
3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane
(Tabelul 5)
Tabelul 5 Distribuţii de frecvenţă absolută
48
Tabelul claselor de frecvenţe
1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă
2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)
Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)
Tabele de contingenţă
1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a
tabelelor de contingenţă
2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a
combinaţiilor de perechi ordonate de valori
3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre
a factor de risc si
b starea sănătăţii
4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)
5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)
Tabelul 7 Tabel de contingenţă 2 x 2
49
Grafice
Există două categorii de moduri grafice sub care se pot prezenta datele
1 Ilustraţii şi fotografii
2 Grafice
1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă
pentru lucrare
2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit
Putem vorbi despre mai multe tipuri de grafice
bull Grafice pentru reprezentarea datelor cantitative
1048707 Grafic cartezian (X Y)
1048707 Histograma
1048707 Poligonul de frecvenţe
1048707 Diagrama bdquoscatterrdquo
bull Grafice pentru reprezentarea datelor calitative
1048707 Grafic cu bare
1048707 Diagrama tip bdquoboxplotrdquo
1048707 Diagrama bdquopierdquo
1048707 Cartograma
Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi
dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)
Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)
Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie
Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)
Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)
50
Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir
de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele
două variabile studiate (Figura 6)
Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2
(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2
rămacircne aproximativ constantă)
Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea
comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea
comparativă a mai multor variabile
Figura 7 Grafic calitativ cu bare
51
Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo
Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două
posibilităţi reprezentate grafic este mai frecventă (Figura 8)
Figura 8 Reprezentare tip bdquopierdquo
Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli
sau a oricărui element comparativ Se foloseşte de epidemiologi
Rezultate
Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare
Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o
manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu
explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția
bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la
ilustraţii tabele grafice
Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi
nici rezultatele care invalidează eventual ipoteza
Discuţii
Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd
cultura ştiinţifică şi inteligenţa autorilor
Acest capitol răspunde la trei obiective
Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia
calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de
selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează
rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv
52
este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn
care a fost abordată problema fără a face o revistă a literaturii
Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea
rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul
Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor
afirmaţii nesusţinute de conţinutul lucrării
Concluzii
Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate
să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie
Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de
concluzii va scădea valoarea lucrării
Bibliografia (lista referinţelor citarea icircn text)
Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn
lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente
Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli
- să conţină cele mai importante şi recente lucrări
- să includă numai lucrări publicate
- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate
Bibliografie
Elisabeta Jaba ndash Statistică Ed Economică 1998
Mihai Ţarcă ndash Statistică volI Ed UAIC 1979
Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale
Ed University Press 2009
Sorana Daniela Bolboacă ndash Metodologia cercetării curs
53
3 Numerele sunt aliniate icircn funcţie de virgulă
4 Indicii statistici sunt explicaţi sub tabel
5 Nu se utilizează mai mult de 6 ndash 8 racircnduri pentru fiecare coloană
6 Abrevierile pot fi folosite
7 Numărul de zecimale trebuie limitat la maxim două
8 Icircn textul scris nu se repetă datele doar se atrage atenţia asupra elementelor semnificative din tabel
9 Plasarea legendei este obligatorie sub tabel
10 Icircn cazul icircn care tabelul este preluat din surse preexistente se menţionează sursa (autorul cartea)
Icircn cazul prezentărilor orale sau a posterelor este indicat ca
1 Tabelele să fie mai simple din cauza limitării timpului acordat prezentării
2 Se folosesc colori forme speciale pentru a putea scoate icircn evidenţă anumite aspecte
3 Folosirea de simboluri este permisă
Clasificarea tabelelor
Tabelele se clasifică după
i) conţinut
bull cu distribuţii de frecvenţe
bull de clase de frecvenţe
bull de contingenţă
ii) structura
bull cu doua coloane
bull cu subclasificări
bull ldquomasterrdquo
Tabele ce conţin distribuţii de frecvenţe
O modalitate comodă de a prezenta o mulţime de date brute este
1 Se ordonează datele in ordine crescătoare
2 Se determine frecvenţa fiecărei valori
3 Se includ valorile distincte şi frecvenţele icircntr-un tabel pe două coloane
(Tabelul 5)
Tabelul 5 Distribuţii de frecvenţă absolută
48
Tabelul claselor de frecvenţe
1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă
2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)
Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)
Tabele de contingenţă
1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a
tabelelor de contingenţă
2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a
combinaţiilor de perechi ordonate de valori
3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre
a factor de risc si
b starea sănătăţii
4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)
5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)
Tabelul 7 Tabel de contingenţă 2 x 2
49
Grafice
Există două categorii de moduri grafice sub care se pot prezenta datele
1 Ilustraţii şi fotografii
2 Grafice
1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă
pentru lucrare
2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit
Putem vorbi despre mai multe tipuri de grafice
bull Grafice pentru reprezentarea datelor cantitative
1048707 Grafic cartezian (X Y)
1048707 Histograma
1048707 Poligonul de frecvenţe
1048707 Diagrama bdquoscatterrdquo
bull Grafice pentru reprezentarea datelor calitative
1048707 Grafic cu bare
1048707 Diagrama tip bdquoboxplotrdquo
1048707 Diagrama bdquopierdquo
1048707 Cartograma
Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi
dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)
Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)
Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie
Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)
Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)
50
Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir
de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele
două variabile studiate (Figura 6)
Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2
(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2
rămacircne aproximativ constantă)
Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea
comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea
comparativă a mai multor variabile
Figura 7 Grafic calitativ cu bare
51
Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo
Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două
posibilităţi reprezentate grafic este mai frecventă (Figura 8)
Figura 8 Reprezentare tip bdquopierdquo
Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli
sau a oricărui element comparativ Se foloseşte de epidemiologi
Rezultate
Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare
Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o
manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu
explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția
bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la
ilustraţii tabele grafice
Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi
nici rezultatele care invalidează eventual ipoteza
Discuţii
Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd
cultura ştiinţifică şi inteligenţa autorilor
Acest capitol răspunde la trei obiective
Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia
calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de
selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează
rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv
52
este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn
care a fost abordată problema fără a face o revistă a literaturii
Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea
rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul
Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor
afirmaţii nesusţinute de conţinutul lucrării
Concluzii
Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate
să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie
Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de
concluzii va scădea valoarea lucrării
Bibliografia (lista referinţelor citarea icircn text)
Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn
lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente
Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli
- să conţină cele mai importante şi recente lucrări
- să includă numai lucrări publicate
- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate
Bibliografie
Elisabeta Jaba ndash Statistică Ed Economică 1998
Mihai Ţarcă ndash Statistică volI Ed UAIC 1979
Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale
Ed University Press 2009
Sorana Daniela Bolboacă ndash Metodologia cercetării curs
53
Tabelul claselor de frecvenţe
1 Se descompune seria icircn clase prin icircmpărţirea icircntinderii ei icircn intervale de clasă
2 Se determină numărul de valori care intră icircn fiecare clasă (Tabelul 6)
Tabelul 6 Distribuţii pe clase de frecvenţe (frecvenţă relativă şi relativă cumulată)
Tabele de contingenţă
1 Altă modalitate de prezentare a frecvenţelor (absolute sau relative) după două caracteristici este cea a
tabelelor de contingenţă
2 Fiecare dintre cele două caracteristici au mai multe ldquovalorirdquo tabelul conţinacircnd frecvenţele de apariţie a
combinaţiilor de perechi ordonate de valori
3 Tabel de contingenţă de tipul 2 x 2 arata legătura intre
a factor de risc si
b starea sănătăţii
4 Astfel de tabele de contingenţă intervin frecvent icircn analiza statistică a datelor medicale (testul Hi-pătrat)
5 Determinarea nivelului de asociere a doua variabile calitative binare (Tabelul 7)
Tabelul 7 Tabel de contingenţă 2 x 2
49
Grafice
Există două categorii de moduri grafice sub care se pot prezenta datele
1 Ilustraţii şi fotografii
2 Grafice
1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă
pentru lucrare
2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit
Putem vorbi despre mai multe tipuri de grafice
bull Grafice pentru reprezentarea datelor cantitative
1048707 Grafic cartezian (X Y)
1048707 Histograma
1048707 Poligonul de frecvenţe
1048707 Diagrama bdquoscatterrdquo
bull Grafice pentru reprezentarea datelor calitative
1048707 Grafic cu bare
1048707 Diagrama tip bdquoboxplotrdquo
1048707 Diagrama bdquopierdquo
1048707 Cartograma
Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi
dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)
Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)
Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie
Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)
Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)
50
Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir
de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele
două variabile studiate (Figura 6)
Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2
(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2
rămacircne aproximativ constantă)
Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea
comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea
comparativă a mai multor variabile
Figura 7 Grafic calitativ cu bare
51
Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo
Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două
posibilităţi reprezentate grafic este mai frecventă (Figura 8)
Figura 8 Reprezentare tip bdquopierdquo
Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli
sau a oricărui element comparativ Se foloseşte de epidemiologi
Rezultate
Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare
Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o
manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu
explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția
bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la
ilustraţii tabele grafice
Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi
nici rezultatele care invalidează eventual ipoteza
Discuţii
Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd
cultura ştiinţifică şi inteligenţa autorilor
Acest capitol răspunde la trei obiective
Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia
calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de
selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează
rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv
52
este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn
care a fost abordată problema fără a face o revistă a literaturii
Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea
rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul
Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor
afirmaţii nesusţinute de conţinutul lucrării
Concluzii
Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate
să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie
Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de
concluzii va scădea valoarea lucrării
Bibliografia (lista referinţelor citarea icircn text)
Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn
lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente
Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli
- să conţină cele mai importante şi recente lucrări
- să includă numai lucrări publicate
- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate
Bibliografie
Elisabeta Jaba ndash Statistică Ed Economică 1998
Mihai Ţarcă ndash Statistică volI Ed UAIC 1979
Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale
Ed University Press 2009
Sorana Daniela Bolboacă ndash Metodologia cercetării curs
53
Grafice
Există două categorii de moduri grafice sub care se pot prezenta datele
1 Ilustraţii şi fotografii
2 Grafice
1 Trebuie pornit de la premiza că orice fotografie introdusă icircntr-o lucrare ştiinţifică este cea mai reprezentativă
pentru lucrare
2 Graficele sunt prelucrări asistate de computer a datelor care permit aprecierea vizuală a elementului urmărit
Putem vorbi despre mai multe tipuri de grafice
bull Grafice pentru reprezentarea datelor cantitative
1048707 Grafic cartezian (X Y)
1048707 Histograma
1048707 Poligonul de frecvenţe
1048707 Diagrama bdquoscatterrdquo
bull Grafice pentru reprezentarea datelor calitative
1048707 Grafic cu bare
1048707 Diagrama tip bdquoboxplotrdquo
1048707 Diagrama bdquopierdquo
1048707 Cartograma
Graficele carteziene tip bdquolinierdquo sunt icircn general utilizate pentru reprezentarea a două variabile (independentă şi
dependentă) Este util pentru a evidenţia evoluţia icircn timp sau relaţia dintre două variabile (Figura 4)
Figura 4 Grafic tip bdquolinierdquo pentru prezentarea evoluţiei icircn timp a cazurilor de boală (MS Excel)
Histograma este un tip particular de grafic care exprimă grafic numărul de elemente dintr-o clasă printr-o arie
Baza ariei reprezintă icircntotdeauna intervalul de clasă iar aria efectivul clasei respective (Figura 5)
Figura 5 Histogramă reprezentacircnd distribuţia pe grupe de vacircrstă (Epi Info)
50
Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir
de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele
două variabile studiate (Figura 6)
Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2
(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2
rămacircne aproximativ constantă)
Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea
comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea
comparativă a mai multor variabile
Figura 7 Grafic calitativ cu bare
51
Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo
Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două
posibilităţi reprezentate grafic este mai frecventă (Figura 8)
Figura 8 Reprezentare tip bdquopierdquo
Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli
sau a oricărui element comparativ Se foloseşte de epidemiologi
Rezultate
Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare
Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o
manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu
explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția
bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la
ilustraţii tabele grafice
Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi
nici rezultatele care invalidează eventual ipoteza
Discuţii
Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd
cultura ştiinţifică şi inteligenţa autorilor
Acest capitol răspunde la trei obiective
Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia
calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de
selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează
rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv
52
este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn
care a fost abordată problema fără a face o revistă a literaturii
Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea
rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul
Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor
afirmaţii nesusţinute de conţinutul lucrării
Concluzii
Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate
să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie
Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de
concluzii va scădea valoarea lucrării
Bibliografia (lista referinţelor citarea icircn text)
Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn
lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente
Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli
- să conţină cele mai importante şi recente lucrări
- să includă numai lucrări publicate
- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate
Bibliografie
Elisabeta Jaba ndash Statistică Ed Economică 1998
Mihai Ţarcă ndash Statistică volI Ed UAIC 1979
Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale
Ed University Press 2009
Sorana Daniela Bolboacă ndash Metodologia cercetării curs
53
Diagrama tip bdquoscatterrdquo prezintă datele asociate perechi (xy) sub forma unui noir
de puncte Este foarte utilă pentru aprecierea vizuală a unei eventuale corelaţii icircntre cele
două variabile studiate (Figura 6)
Figura 6 Diagramă tip bdquoscatterrdquo Exprimă vizual eventuala asociere dintre vacircrstă şi cantitatea de HbA2
(se poate spune că cu creşterea icircn vacircrstă cantitatea de HbA2
rămacircne aproximativ constantă)
Graficul cu bare este primul utilizat pentru prezentarea datelor calitativ Este ideal pentru prezentarea
comparativă a datelor Prezintă comparativ o variabilă pe parcursul mai multor etape Este posibilă prezentarea
comparativă a mai multor variabile
Figura 7 Grafic calitativ cu bare
51
Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo
Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două
posibilităţi reprezentate grafic este mai frecventă (Figura 8)
Figura 8 Reprezentare tip bdquopierdquo
Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli
sau a oricărui element comparativ Se foloseşte de epidemiologi
Rezultate
Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare
Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o
manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu
explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția
bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la
ilustraţii tabele grafice
Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi
nici rezultatele care invalidează eventual ipoteza
Discuţii
Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd
cultura ştiinţifică şi inteligenţa autorilor
Acest capitol răspunde la trei obiective
Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia
calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de
selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează
rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv
52
este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn
care a fost abordată problema fără a face o revistă a literaturii
Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea
rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul
Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor
afirmaţii nesusţinute de conţinutul lucrării
Concluzii
Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate
să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie
Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de
concluzii va scădea valoarea lucrării
Bibliografia (lista referinţelor citarea icircn text)
Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn
lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente
Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli
- să conţină cele mai importante şi recente lucrări
- să includă numai lucrări publicate
- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate
Bibliografie
Elisabeta Jaba ndash Statistică Ed Economică 1998
Mihai Ţarcă ndash Statistică volI Ed UAIC 1979
Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale
Ed University Press 2009
Sorana Daniela Bolboacă ndash Metodologia cercetării curs
53
Graficul tip bdquopierdquo sau bdquoplăcintărdquo se utilizează pentru prezentarea calitativă a variabilelor binare de tip bdquosexrdquo
Arată distribuţia procentuală cel care priveşte un astfel de grafic poate să aprecieze care dintre cele două
posibilităţi reprezentate grafic este mai frecventă (Figura 8)
Figura 8 Reprezentare tip bdquopierdquo
Cartograma este o hartă a unei ţări regiuni oraş sau a icircntregului glob care prezintă vizual prezenţa unei boli
sau a oricărui element comparativ Se foloseşte de epidemiologi
Rezultate
Acest capitol este inima articolului original reprezintă finalitatea cercetării şi baza discuţiei ulterioare
Rezultatele trebuie să fie prezentate clar simplu fără afirmaţii vagi (s-a constatat o tendinţă de creştere) icircntr-o
manieră concisă Este de dorit să fie expuse doar rezultatele nu trebuie să comporte nici un comentariu
explicaţii sau comparaţii cu alte studii icircn consecinţă nu trebuie să includă titluri bibliografice cu excepția
bibliografiei legată de metoda folosită Pentru exprimarea cacirct mai sugestivă a rezultatelor se va face apel la
ilustraţii tabele grafice
Rezultatele trebuie să ofere răspuns la obiectivele studiului nu trebuie icircndepărtate nici rezultatele negative şi
nici rezultatele care invalidează eventual ipoteza
Discuţii
Scopul discuţiilor este de a interpreta lucrarea realizată calitatea şi interesul stacircrnit de acestea reflectacircnd
cultura ştiinţifică şi inteligenţa autorilor
Acest capitol răspunde la trei obiective
Primul obiectiv este de a comunica dacă scopul cercetării a fost sau nu atins cel de al doilea este de a aprecia
calitatea şi validitatea rezultatelor (dacă numărul subiecţilor investigaţi a fost suficient dacă există biasuri de
selecţie dacă metoda aleasă a fost optimă de ce a fost preferată metoda respectivă cum se interpretează
rezultatele icircn funcţie de metoda ultilizată care este puterea statistică a rezultatelor) Al treilea obiectiv
52
este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn
care a fost abordată problema fără a face o revistă a literaturii
Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea
rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul
Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor
afirmaţii nesusţinute de conţinutul lucrării
Concluzii
Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate
să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie
Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de
concluzii va scădea valoarea lucrării
Bibliografia (lista referinţelor citarea icircn text)
Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn
lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente
Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli
- să conţină cele mai importante şi recente lucrări
- să includă numai lucrări publicate
- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate
Bibliografie
Elisabeta Jaba ndash Statistică Ed Economică 1998
Mihai Ţarcă ndash Statistică volI Ed UAIC 1979
Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale
Ed University Press 2009
Sorana Daniela Bolboacă ndash Metodologia cercetării curs
53
este de a compara rezultatele studiului cu cele ale altor autori Trebuie menţionat aportul personal maniera icircn
care a fost abordată problema fără a face o revistă a literaturii
Spiritul critic şi prudenţa evită unele erori care pot să apară icircn redactarea acestui capitol cum ar fi repetarea
rezultatelor icircn detaliu repetarea datelor incluse icircn capitolul
Introducere subiectivismul excesiv icircn aprecierea propriilor rezultate enunţarea unor
afirmaţii nesusţinute de conţinutul lucrării
Concluzii
Concluziile trebuie să rezulte din cercetarea efectuată să fie concluziile autorilor să ie clar şi concis formulate
să nu repete rezultate ci să sumarizeze dovezile pentru fiecare concluzie
Nu numărul concluziilor este important ci esenţa acestora Este de multe ori greşită ideea că un număr mic de
concluzii va scădea valoarea lucrării
Bibliografia (lista referinţelor citarea icircn text)
Bibliografia este ansamblul articolelor şi a cărţilor pe un subiect şi are scopul de a justifica orice fapt enunţat icircn
lucrare Principalele surse pentru referinţe sunt articole de jurnal cărţi capitole din cărţi monografii patente
Icircn icircntocmirea bibliografiei trebuie să se ţină cont de cacircteva reguli
- să conţină cele mai importante şi recente lucrări
- să includă numai lucrări publicate
- să se treacă icircn lista referinţelor bibliografice numai lucrările consultate
Bibliografie
Elisabeta Jaba ndash Statistică Ed Economică 1998
Mihai Ţarcă ndash Statistică volI Ed UAIC 1979
Vladimir Bacacircrea Monica Sabău Marius Măruşteri - Metodologia cercetării ştiinţifice medicale
Ed University Press 2009
Sorana Daniela Bolboacă ndash Metodologia cercetării curs
53