Epidemiologie. Genomic Wide Study

40
NOTIUNI DE EPIDEMIOLOGIE. GENOMICWIDE STUDIES Genomica- C7

description

hhh,ujh

Transcript of Epidemiologie. Genomic Wide Study

Page 1: Epidemiologie. Genomic Wide Study

NOTIUNI DE EPIDEMIOLOGIE. GENOMICWIDE STUDIES

Genomica- C7

Page 2: Epidemiologie. Genomic Wide Study

CUPRINSUL CURSULUI

NOTIUNI DE EPIDEMIOLOGIE SI EVIDENCE BASED MEDICINE NECESARE INTELEGERII STUDIILOR DE TIPUL GENOMIC WIDE

Clasificarea studiilor epidemiologice Studiile caz control Parametrii utilizati in masurarea asocierii si in identificarea relatiei de cauzalitate De la epidemiologie la medicina bazata pe dovezi

DESCRIERE GENERALA A UNUI PROIECT DE TIP GENOMICWIDE STUDY

Clasificarea si analiza rezultatelor studiului: Identificarea limitarilor si obstacolelor actuale

LEGATURA INTRE STUDIILE DE ASOCIERE ALE INTREGULUI GENOM, MEDICINA BAZATA PE DOVEZI SI MEDICINA PERSONALIZATA

Page 3: Epidemiologie. Genomic Wide Study

NOTIUNI DE EPIDEMIOLOGIE SI EVIDENCE BASED MEDICINE NECESARE INTELEGERII STUDIILOR DE TIPUL GENOMIC WIDE

GENOMICA– C7

Page 4: Epidemiologie. Genomic Wide Study

CLASIFICAREA STUDIILOR EPIDEMIOLOGICE

Studiie epidemiologice sunt studii care isi propun sa identifice relatii intre actiunea diferitilor factori de risc sau de protectie si efectele lor biologice, in particular cele asupra organismului uman. Efectele biologice pot fi:

• Epidemiologia stabileste initial ipoteze, si anume ipoteza ca un factor reprezinta un risc sau dimpotriva confera protectie in aparitia unui efect biologic.

De aceea, etapa premergatoare oricarui studiu identifica factorii de risc sau de protectie in jurul carora se creeaza ipoteza de lucru. Pe langa factorii selectati in studiu, in realitate exista si alti factori care actioneaza in momentul expunerii; cei care afecteaza independent de factorii de risc analizati rezultatul, se numesc factori de confuzie. Sa presupunem un studiu ipotetic care arata ca din cei 200 de subiecti care beau cafea peste 300 ml pe zi, 180

au dezvoltat in 10 ani de supraveghere cancer pulmonar. Daca studiul nu ia in consideratie si analiza variabilei fumator/nefumator, precum si a numarul de pachete an fumate, asocierea generata de studiu (intre cafea si cancencerul pulmonar) ar putea fi falsa. Factorul fumat este in acest exemplu un factor de confuzie.

Boli: Se pot cerceta cauzele de aparitie, efectele tratamentului sau elementele care moduleaza prognosticul unei boli.

Modificari ale unor parametrii clinici si functionali (ex: cresterea nivelului de colesterol, ameliorarea performantei la efort, etc)

Page 5: Epidemiologie. Genomic Wide Study

COMPARAREA CARACTERISTICILOR

Populatiile sunt impartite in functie de existenta sau nu a factorilor de risc (sau de protectie) care actioneaza in interiorul fiecarui grup (sau a aceluiasi grup insa analizat in dinamica temporala) si intre caracteristicile lor;

in functie de tipul de studiu ales, se pot masura parametrii care sa cuantifice intensitatea si tipul interdependentei: marimea asocierii sau a corelatiei, gradul de influenta a unuia in raport cu celalalt.

Page 6: Epidemiologie. Genomic Wide Study

CLASIFICAREA GENERALA A STUDIILOR EPIDEMIOLOGICE

Studii epidemiologice

Experimentale

Nerandomizate Studii populationale

Randomizate Studii clinice

Observationale

Studii DESCRIPTIVE

Studii transversale

Studii retrospective

Studii ANALITICE

Studii caz control

Studii Prospective

Page 7: Epidemiologie. Genomic Wide Study

TIPURI DE STUDII EXPERIMENTALE Studii experimentale: studii in care cercetatorii

intervin in mod activ in evolutia fenomenului studiat

Studii randomizate

Studii nerandomizate

Studii in care alocarea indivizilor in grupurile care sunt comparate se face aleator

Studii in care alocarea indivizilor in grupurile care sunt comparate NU se face aleator

Page 8: Epidemiologie. Genomic Wide Study

STUDII EXPERIMENTALE RANDOMIZATE Studii randomizate: alocarea indivizilor in grupurile care sunt

comparate se face aleator prin procesul de randomizare.

De aceea, studiile randomizate sunt studiile epidemiologice cele mai solide in probarea relatiei de cauzalitate intre doua evenimente. (BMJ 316 : 201 (Published 17 January 1998) Understanding controlled trials: Why are randomised controlled trials important? Bonnie Sibbald, Martin Roland)

Randomizarea (alocarea intamplatoare a subiectilor intr- un grup sau altul) permite excluderea unei diferente sistematice intre grupurile studiate a

factorilor, cunoscuti sau necunoscuti, care influenteza rezultatul interventiei.

Page 9: Epidemiologie. Genomic Wide Study

STUDII EXPERIMENTALE NE RANDOMIZATE Studii nerandomizate sunt studiile in care nu exista o

randomizare a populatiei analizate. studiile populationale (in comunitati): se adreaseaza intregii populatii,

fara nici un criteriu de alocare a interventiei. Exemplu: interventii de educatie cu scopul de a schimba atitudinea si

comportamentul fata de un factor de risc (educarea publicului larg pentru reducerea consumului de calorii ca modalitate de preventie a obezitatii)

Exista si studii non randomizate la alegerea pacientilor (de exemplu optiunea pentru a fi inclus intr-un tratament experimental). In acest caz, este posibil ca grupul care alege tratamentul experimental se

autoselecteaza pe baza severitatii crescute a bolii la momentul initierii tratamentului experimental si de aceea compararea rezultatelor lor de supravietuire cu a celor care nu au ales varianta experimentala de tratament sa nu fie relevanta. Nu este exemplu tipic de studiu de efect terapeutic, dar aceste studii pot fi facute in introducerea unor tratamente noi pentru boli incurabile.

Page 10: Epidemiologie. Genomic Wide Study

TIPURI DE STUDII OBSERVATIONALE Pot fi:

Studiile observationale atesta o asociere intre doua fenomene;

diferenta intre asociere si cauzalitate este esentiala , pentru ca una nu o implica pe cealalta. Cauzalitatea este apanajul cercetarii experimentale; cum insa nu se pot face experimente

pe om, cauzalitatea este de cele mai multe ori estimata indirect.

Pentru ca o relatie de asociere sa se apropie de intensitatea unei legaturi cauzale, ea trebuie sa indeplineasca o suma de criterii, si anume:

Studii observationale: studii in care cercetatorii doar fac constatari privind evolutia fenomenului

Studii descriptive Studii analitice

Criterii esentiale: • temporalitatea, • magnitudinea corelatiei, • relatia doza raspuns, • plauzibilitatea biologica.

Criterii auxiliare: • explicatiile alternative • constatarile legate de incetarea expunerii • specificitatea legaturii factor de risc-efect • consistenta cu alte studii.

Page 11: Epidemiologie. Genomic Wide Study

STUDII OBSERVATIONALE DESCRIPTIVE 1

Pot fi

Studiile observationale transversale analizeaza fenomenul la momentul studiului. Exemple de obiective: : urmarirea numarul de cazuri de imbolnavire prezente in populatia studiata (prevalenta) la cei

expusi fata de cei non expusi (fata de prevalenta expunerii). Cele mai multe anchete sunt de acest tip: de exemplu inregistreaza numarul de pacienti cu boala

coronariana si numarul de fumatori. Aceste studii nu pot stabili relatia de succesiune in timp intre cele doua evenimente (factor de risc

si boala) si nici nu pot fi aplicate in boli a caror durata de evolutie este scurta, deoarece risca sa ii excluda pe cei a caror boala a avut o evolutie foarte rapida catre deces sau pe cei care s-au vindecat

deja.

In general studiile descriptive pornesc de la formularea de ipoteze privind legatura intre boli si expunerea la un anumit factor de risc observationale

Studii transversale Studii retrospective

Page 12: Epidemiologie. Genomic Wide Study

STUDII OBSERVATIONALE DESCRIPTIVE Studiile observationale retrospective: analizeaza istoria expunerii

inainte de studiu.

pot identifica evolutia in timp a unei boli in functie de diferiti factori de risc. De exemplu un studiu retrospectiv al transmiterii infectiei cu virusul HIV in

Singapore a luat in considerare mai multi factori de risc pentru transmiterea bolii: comportamentul sexual, transfuzia de sange, consumul de droguri pe cale intravenoasa, transplantul renal, transmiterea perinatala. Din datele colectate intre 1987 si 1991 s-a aratat, printre altele, ca trendul transmiterii virusului este de diminuare a transmiterii intre homosexuali si prin transfuzii de sange si de crestere a incidentei transmisiunii heterosexuale. (Goh A, Chew SK, Monteiro EH, Chan RK Retrospective epidemiological study of HIV infection from 1987 to 1991 in Singapore. )

Page 13: Epidemiologie. Genomic Wide Study

STUDII OBSERVATIONALE ANALITICE Studiile observationale analitice pot fi:

Cel mai cunoscut studiu de cohorta a fost studiul Framingham, un studiu inceput in

orasul Framingham din Massachusetts in 1948 (Dr. Thomas R. Dawber) pe 5,209 barbati si femei cu varsta (la debutul studiului) intre 30 si 62 de ani;

din 1948 si pana in 1971 subiectii primei cohorte au fost evaluati o data la 2 ani: privind obiceiurile de viata, au fost inregistrate bolilele de care au suferit au fost examinati clinic au efectuat un set de analize de laborator.

In 1971 au fost inrolati copii participantilor la primul studiu (a doua cohorta)

2002 o a treia generatie (cohorta) a fost inclusa in studiu.

Studiul a tras concluzii privind factorii de risc cardiovascular (fumat, obezitate, activitate fizica redusa, etc) care acum reprezinta baza oricarei strategii de sanatate publica din intreaga lume.

Studii prospective (de cohorta) Studii caz control

Page 14: Epidemiologie. Genomic Wide Study

STUDIILE CAZ CONTROL

Genomica – C7

Page 15: Epidemiologie. Genomic Wide Study

ELEMENTE CARACTERISTICE ALE UNUI STUDIU CAZ CONTROL

Studiile caz control compara doua grupuri, unul in care fenomenul biologic (de exemplu o boala) este prezent cu un alt grup, denumit grup de control in care boala este absenta.

Studiile caz control pornesc de la cunoasterea fenomenului biologic, spre deosebire de studiile prospective de cohorta la care se urmareste aparitia in timp a efectului biologic sau a bolii studiate.

Pornind de la rezultatul cunoscut si identificat la subiectii din grupul de studiu (prezenta

bolii), cele mai multe studii epidemiologice de tip caz control cauta in istoricul acestor subiecti un anumit tip de expunere pe care o compara cu cea a grupului de control (sau grup martor).

Avantaje:

pot fi utilizate si pentru afectiuni mai putin frecvente, pentru cele care se dezvolta intr-o perioada mai lunga de timp

sunt mai ieftine decat cele de cohorta pentru ca nu necesita o urmarire indelungata in timp.

Page 16: Epidemiologie. Genomic Wide Study

PASII NECESARI CONCEPERII UNUI STUDIU CAZ CONTROL

Selectarea bolii, inclusiv a criteriilor obligatorii de includere in studiu ( de exemplu se poate precizeaza ca boala este: hipertensiunea arteriala stadiul I conform definitiei societatii europene de cardiologie, adica o valoare a tensiunii arteriale sistolice intre 140-159 mmHg sau a celei diastolice intre 90-99 mmHg)

Identificarea pacientilor, adica a acelor pacienti care corespund criteriilor de selectie din definitia de mai sus

Alegerea metodei de colectare a informatiei (chestionare auto administrate, interviu, etc). In formatiile trebuie sa contina date atat despre boala studiata cat si despre factorii de risc studiati. In cazul in care informatia analizata nu este de tip chestionar, ci de tip parametru masurabil (de exemplu expunerea la un factor de mediu monitorizat in mod curent) se evita factorul de eroare generat de memorarea selectiva a unor evenimente nedocumentate.

Identificarea cazurilor control. Este preferabil ca alegerea cazurilor control sa fie facuta din aceeasi regiune geografica, cu diferente cat mai mici in ceea ce privesc variabilele demografice (distributia pe varste, sex, rasa, etc).

Page 17: Epidemiologie. Genomic Wide Study

PARAMETRII UTILIZATI IN MASURAREA ASOCIERII SI IN IDENTIFICAREA RELATIEI DE CAUZALITATE

Odds ratio = OR =Raportul marimilor relative de coordonare intre 2 componente ale aceluiasi ansamblu. Un odds este definit ca probabilitea ca un eveniment sa apara impartita la probabilitatea ca el sa nu apara. Este o masura a magnitudinii asocierii intre factor de risc (sau un factor protector) si efectul biologic respectiv. Este masura marimii relative a cotei expunerii in populatia celor care au boala (sau efectul biologic) fata de cei care nu au boala (sau efectul biologic).

cazuri controale

Expusi a b

Non expusi c d

OR = (a/c)/(b/d)

OR =1 Nu exista diferente intre cei expusi si cei non expusi, OR> 1 : indivizii care prezinta boala (sau efectul biologic) au sanse mai mari sa fi avut expunerea decat cei care nu prezinta boala. De exemplu daca OR= 5.7 la populatia expusa la compusi fluorurati peste limita maxima admisa care au astm bronsic, inseamna ca astmaticii au de 5.7 ori mai mari sanse sa fi fost expusi la compusi fluorurati decat cei fara astm. OR<1: factorul respectiv este mai putin prezent in populatia care prezinta boala fata de cea care nu o prezinta, el poate fi deci considerat ca un factor protector.

Page 18: Epidemiologie. Genomic Wide Study

PARAMETRII UTILIZATI IN MASURAREA ASOCIERII SI IN IDENTIFICAREA RELATIEI DE CAUZALITATE

Riscul relativ:

In studiile de cohorta se calculeaza riscul relativ: acesta este o masura a asocierii intre o boala si un factor de risc.

Se calculeaza prin impartirea incidentei bolii la cei expusi la incidenta bolii la cei non expusi.

cazuri controale

Expusi a b

Non expusi c d

RR= a/(a+b)/c/(c+d)

RR=1 Incidenta este egala in grupul de expusi cu cea duin grupul de non expusi, nu exista o asociere intre expunere si boala RR>1 Exista o incidenta mai mare a bolii la cei expusi, existenta factorului de risc creste probabilitatea de aparitie a bolii RR<1 Exista o incidenta mai mica a bolii la cei expusi, existenta factorului de risc scade probabilitatea de aparitie a bolii

Page 19: Epidemiologie. Genomic Wide Study

PARAMETRII UTILIZATI IN MASURAREA ASOCIERII SI IN IDENTIFICAREA RELATIEI DE CAUZALITATE

Corelatia: Intre doua variabile cantitative se poate calcula raportul de corelatie, care reprezinta intensitatea legaturii cauza efect. Raportul se calculeaza ca o functie de regresie a variabilei dependente fata de cea independenta. Coeficientul de corelatie ia valori intre -1 si 1, valorile pozitive desemnand o relatie concordanta (creste intensitatea factorului de risc, creste probabilitatea de aparitie a bolii) valorile negative corespanzand unei relatii discordante (creste factorul de risc, descreste probabilitatea de aparitie a bolii). Cu cat valoarea este mai apropiata de 1 (si respectiv -1) cu atat legatura intre cele doua evenimente este mai stransa.

Intre diferite categorii de variabile numerice se pot aplica teste de diferentiere statistica.

Indiferent de tipul de test aplicat, se alege un prag de semnificatie statistica peste care se considera ca rezultatele sunt valide. P reprezinta probabilitatea ca predictia sa fie corecta. Iar p= pragul de semnificatie si este egal cu 100-P. Pentru studiile epidemiologice pragul de la care se considera ca testul are semnificatie statistica

incepe la 0.05. Altfel spus un p< 0.05 inseamna ca probabilitatea ca predictia sa fie corecta este de 95% si ca exista 5% sanse de eroare. Altfel spus ca exista o sansa de 1 la 20 ca rezultatul sa fie unul accidental.

Pentru studiile de genomica pragul este de obicei forte inalt si poate ajunge pana la 10-7. Interval de incredere (IC) Cuantifica incertitudinea masuratorii. Este de obicei raportat ca IC

95% care este intervalul valorilor intre care putem fi 95% siguri ca se situeaza valoarea adevarata pentru intreaga populatie (nu doar pe subpopulatia pe care am studiat-o).

Page 20: Epidemiologie. Genomic Wide Study

MEDICINA BAZATA PE DOVEZI

Genomica – C7

Page 21: Epidemiologie. Genomic Wide Study

EVIDENTE

Epidemiologia a creat cadrul de desfasurare a unei analize sistematice a datelor medicale. Un pas important a fost apoi aparitia conceptului de medicina bazata pe dovezi. In

prezent, aceasta semnifica utilizarea: consecventa, explicita si judicioasa

a celor mai bune practici disponibile la momentul actual in luarea deciziilor privind ingrijirea pacientilor.

Medicina bazata pe evidente nu se rezuma la deciziile terapeutice pentru cazurile

individuale; ea se aplica in egala masura deciziilor de sanatate publica, planificarii resurselor precum si deciziilor de achizitie in domeniul sanatatii.

Evidentele clinice reprezinta cele mai bune practici disponibile la ora actuala; ele sunt rezultatul cercetarii sistematice a datelor din literatura medicala adaptate scopului propus.

Page 22: Epidemiologie. Genomic Wide Study

PROCESUL DE CAUTARE A EVIDENTELOR

Pasii procesului de practica corespunzator medicinii bazate pe dovezi descrisi de Oxford Center for Evidence Based Medicine in decizia terapeutica individuala (http://www.cebm.net/index.aspx?o=1001) sunt urmatorii: Evaluarea pacientului: definirea problemei clinice sau a chestiunii specifice legate de

ingrijirea pacientului: de ex. PROBLEMA: reducerea frecventei internarilor pentru o afectiune cronica prin modificarea schemei de tratament

Formularea INTREBARII: Integrarea medicatiei X in schema de tratament a pacientului ii reduce riscul de spitalizare sau nu?

Obtinerea DATELOR DE EVIDENTA: selectarea referintelor adecvate si investigarea lor. Interogarea bazelor de date de studii clinice care au utilizat medicatia X in tratamentul afectiunii pacientului respectiv.

Evaluarea evidentelor din perspectiva VALIDITATII (gradului de apropiere fata de realitate) si aplicabilitatii in situatia practica concreta

APLICAREA EVIDENTELOR IN PRACTICA – integrarea evidentelor in propria experienta clinica, in preferintele pacientului si in aplicabilitatea ei practica

AUTO-EVALUAREA: evaluarea propriei performante in legatura cu pacientului respectiv

Page 23: Epidemiologie. Genomic Wide Study

VALIDITATEA EVIDENTELOR Categorie Descriere

Ia Evidente din meta analize si studii clinice randomizate si controlate

Ib Evidente din cel putin un studiu clinic randomizat si controlat IIa Evidente din cel putin un studiu clinic controlat, dar fara

randomizare IIb Evidente din cel putin un alt studiu clinic cvasi-experimental III Evidente din studii descriptive, cum sunt studiile comparative,

studiile de corelatie si studiile caz control IV Evidente din rapoartele comisiilor de experti sau opinii sau

experienta clinice ale autoritatilor in domeniu

Elementele esentiale in sustinerea validitatii unui studiu in special terapeutic sunt: randomizarea, alocarea prin metoda dublu orb a pacientilor in grupele de studiu (necunoscuta nici de investigatori, nici de pacienti), similaritatea initiala a grupurilor, parcurgerea intregului proces de catre cei inrolati in studiu si obiectivul tratamentului

Page 24: Epidemiologie. Genomic Wide Study

GENOM WIDE ASSOCIATION STUDY Genomica –C7

Page 25: Epidemiologie. Genomic Wide Study

DESCRIERE GENERALA Un astfel de proiect presupune scanarea markerilor intregul set de gene ale ADN-ului (adica

a integritatii genomului) intr-o populatie cu scopul identificarii unor asociatii intre variatiile genice si o boala sau intre variatiile genelor si raspunsul la un anumit tratament.

Variatia genetica reprezinta diferenta inter-individuala de localizare specifica a SNP-urilor in cadrul genomului uman. Termenul de “normal” (“”forma salbatica” ) este folosit de obicei pentru a desemna varianta cea mai comuna (frecventa) de localizare in populatie.

Studiile de asociere ale intregului genom (SAIG) au devenit posibile dupa 2003; la 50 de ani de la descoperira ADN-ul de catre Watson si Crick, a fost publicata prima secventiere a genelor umane, estimate a fi in numar 25000. Secventierea a permis: intelegerea mai profunda a mecanismelor bolilor, precum si identificarea susceptibilitatilor pentru o anumita

boala

personalizarea medicinii in special prin dezvoltarea famacogenomicii

intelegerea mai buna a mecanismelor cunoasterii si comportamentului uman

Identificarea patternul genic reprezinta un pas in adaptarea strategiei de preventie si tratament a bolilor. Pana la sfarsitul anului 2010 au fost publicate 1212 studii pe 210 manifestari fenotipice (trasaturi) ale bolilor

foarte frecvente cum ar fi obezitatea, diabetul, astmul, cancerul la caracteristici fenotipice (culoarea ochilor, inaltimea, longevitatea) sau parametrii biologici (nivelul de anticorpi de tip IG E, trigliceride, intervalul QT pe electrocardiograma, numarul de plachete sanguine, proteina C reactiva, nivelul de calciu etc) sau raspunsul la o anumita medicatie (anemia indusa de ribavirina, etc).

Page 26: Epidemiologie. Genomic Wide Study

ECHILIBRUL HARDY WEINBERG Results of random union of the two gametes produced by two

individuals, each heterozygous for a given trait. As a result of meiosis, half the gametes produced by each

parent with carry allele B; the other half allele b.

Results of random union of the gametes produced by an entire

population with a gene pool containing 80% B and 20% b.

0.5 B 0.5 b 0.8 B 0.2 b

0.5 B 0.25 BB 0.25 Bb 0.8 B 0.64 BB 0.16 Bb

0.5 b 0.25 Bb 0.25 bb 0.2 b 0.16 Bb 0.04 bb

O premiza importanta a tuturor SAIG este teoria echilibrul Hardy-Weinberg; aceasta teorie susine ca frecventa genelor si raportul genotipic intr-o populatie aleasa randomizat ramane constanta de la o generatie la alta daca conditiile de mai jos sunt indeplinite simultan: • nu apar mutatii, • nu se modifica fluxul genic, nu exista devierea genica datorata unei populatii cu numar mic de indivizi, • imperecherea este randomizata • nu apare fenomenul de selectie naturala

Imperecherea aleatorie a genelor produce o generatie cu: • 64% homozygoti pt BB (0.8 x 0.8 = 0.64) • 32% Bb heterozygoti (0.8 x 0.2 x 2 = 0.32) • 4% homozygoti (bb) (0.2 x 0.2 = 0.04) Rezulta ca 96% din aceasta generatie vor avea trasatura B si 4% pe b. Toti gametii formati de anim. BB contin alela B; 50% din gametii formati din heterozigotii Bb. Rezulta ca 80% (0.64 + .5*0.32) din pool-ul de gameti formati in aceasta generatie contin B. Toti gametii anim.(bb) (4%) vor contine b ca si 50% din gametii de Bb. Rezulta ca 20% (0.04 + .5*0.32) din gameti vor contine b. Proportia alelei b in populatie ramane constanta.

Page 27: Epidemiologie. Genomic Wide Study

ETAPELE PRINCIPALE ALE UNUI SAIG/GWS

Un SAIG se desfasoara de obicei pe modelul caz control clasic: • Probele participantilor se impart in doua grupe: probe colectate de la grupul de pacienti si respectiv de la grupul martor (cei care nu prezinta boala). • In studiile farmacologice participantii sunt fie cei care primesc tratamentul si au rezultatul dorit (sau reactia adversa, in situatia in care se studiaza acest lucru) constituind grupul martor, fie cei care nu raspund la tratament (sau nu prezinta reactia adversa, dupa cum va fi redata in stduiul de mai jos) si care constituie grupul de control. • De la toti participantii se obtine o mostra de ADN. Dupa extractia ADN-ului, se identifica SNP - urile care prezinta diferente intre cele doua grupuri.

• SNP apar , in medie, din 300 in 300 de nucleotide; • sunt deci, aprox. 10 milioane de SNP-uri in genomul uman. • Sunt situate mai ales intre gene. • Servesc pentru localizarea genelor asociate anumitor boli, in special cand sunt situate in interiorul unei gene codante sau intr-o zona de reglare.

Page 28: Epidemiologie. Genomic Wide Study

POLIMORFISM NUCLEOTIDIC UNIC

single-nucleotide polymorphism (SNP, pronountat snip) este o variatie a unei secvente de ADN ce apare cand un singur nucleotid din genom difera intre membrii aceleiasi specii sau pe cromozomii pereche ai unui individ.

Cele mai multe SNPs comune au numai doua alele Distributia genomica a SNPs nu este homogena, ele apar mai

frecvent in regiunile non-codante, In general, selectia naturala fixeaza alela SNP care constituite

cea mai favorabila adaptare genetica. Recombinarea si frecventa mutatiilor determina de asemenea

densitatea SNP. Intr-o populatie, SNPs pot fi desemnate ca alelele cu frecventa

minora – frecventa cea mai mica a alelelor pbservate in populatie. Exista variatii intre populatiile umane, un SNP comun intr-un grup geografic sau etnic poate fi mai rar decat intr-altul.

Page 29: Epidemiologie. Genomic Wide Study

ETAPELE PRINCIPALE ALE UNUI GWS Alegerea SNP-urilor de studiu reprezinta un element esential in desfasurarea studiului.

• Se estimeaza ca sunt 10 milioane de SNP-uri cu o frecventa de transmitere a alelei minore de peste 5% (fata de media frecventei tuturor SNP-urilor care este de de 1%); Acestea reprezinta pool-ul initial din care se face alegerea.

Metodele actuale de investigatie permit scanarea simultana a peste 1 milion de SNP-uri intr-o proba.

Cu toate acestea, se alege de obicei un numar mai mic pentru scanare: criteriul 1: SNP-urile cu frecventa mai mare de 5% de transmitere a alelei minore criteriul 2: SNP-urile care se gasesc frecvent in populatia bolnava sau la populatia care este obiectul

de cercetare (cea care a prezentat reactii adverse, de exemplu).

Alegerea pragului de semnificatie statistica a diferentelor de frecventa a SNP-urilor este de asemenea importanta. Evident ca, cu cat pragul este mai inalt, cu atat rata de raspunsuri fals pozitive este mai mic.

SNP-urile identificate prin compararea lor in cele doua populatii, situate peste pragul de semnificatie statistica, sunt SNP-urile care indica regiunea genomului uman implicata in patogenia bolii.

Page 30: Epidemiologie. Genomic Wide Study

ETAPELE PRINCIPALE ALE UNUI GWS RAFINAREA REZULTATELOR

Procesul de fine mapping porneste de la un astfel de SNP-ul initial localizat, SNP care apartine unui haplotip; haplotipul din care face parte SNP-ul este la randul lui scanat pentru a se vedea daca nu cumva exista in interiorul haplotipului un alt SNP care sa fie si mai puternic asociat bolii.

Imprinting (atribuirea) este o metoda folosita deseori in SAIG; este utilizata pentru a completa datele obtinute atunci cand genotiparea a omis scrierea (type) unor SNP-uri sau pentru a combina studii efectuate pe platforme diferite. Datele obtinute direct sunt integrate in datele de referinta generala din HapMap sau din alte baze de date de referinta. Punerea in comun a datelor SAIG, atat a celor genotipice, cat si a celor fenotipice faciliteaza dezvoltarea de noi

tehnologii pentru preventie, diagnostic si tratament.

Atribuirea presupune compararea si integrarea rezultatelor studiului cu rezultatele deja existente si se realizeaza folosind programe informatice, cele mai des folosite fiind BEAGLE v3.0.4 (Browning BL, 2009; Browning SR, 2007; Browning BL, 2007), IMPUTE v1 (Marchini J, 2007) v2 (Howie BN, 2009), si MACH v1.03 (Li 2006).

Cu cat studiile referitoare la o anume problema medicala cresc, cu atat este mai mare nevoie de integrare a rezultatelor lor; in acest fel se creeaza deja premizele unor meta analize, iar prin combinarea probelor din studii diferite se creste sansa de detectare a alelelor cu penetrare redusa.

Haplotipul este un set de variatii de ADN sau de SNP-uri care tind sa fie mostenite impreuna

Page 31: Epidemiologie. Genomic Wide Study

ETAPELE PRINCIPALE ALE UNUI GWS RAFINAREA REZULTATELOR

Identificarea unor SNP-uri asociate bolii nu inseamna identificarea cauzei bolii. De cele mai multe ori SNP-ul este doar marker-ul care ajuta la identificarea genelor asociate bolii sau conditiei medicale respective.

Unele SNP-uri pot fi considerate ca factori predispozanti pentru anumite boli si altele pot influenta raspunsul la medicamente al anumitor persoane.

Page 32: Epidemiologie. Genomic Wide Study

ANALIZA REZULTATELOR Ca si in cazul studiilor epidemiologice clasice, asocierea nu este dovada cauzalitatii. Pe

baza rezultatelor de asociere obtinute s-a inceput crearea catalogului de adnotare; verificarea in catalogul de adnotare permite asocierea SNP-ului identificat cu o anumita trasatura functionala.

Desi cel mai frecvent SAIG sunt studii de tip caz control, ele pot fi pot fi utilizate si pentru studii de cohorta sau studii clinice (vezi exemplul de mai jos in care este redata doar partea din studiu in care este utilizatat SAIG).

Datorita faptului ca sunt studii de asociere, s-a creat deja un consens ca rezultatele unui SAIG sa fie reproduse in probe independente pentru a dobandi o dovada suplimentara (semnificativa statistic) de validare; de altfel multe lucrari nici nu sunt admise spre publicare fara o validare de acest tip.

Principalul aport al SAIG in dezvoltarea cunoasterii medicale este cel de a scoate in evidenta SNP-urile de interes pentru problematica respectiva si de a le cuantifica importanta in functie de pragul de semnificatie atins. Prin integrarea tuturor studiilor in baze de date publice, se face de fapt o meta analiza a acestor rezultate de studiu individuale.

Page 33: Epidemiologie. Genomic Wide Study

EXEMPLU In incercarea de a identifica substratul aparitiei durerilor articulare (sau a agravarii durerilor

articulare preexistente) la aproape 50% din femeile cu cancer la san tratate cu medicatie adjuvanta de tip inhibitor de aromataza de a treia generatie, s-a efectuat un SAIG pe 293 de cazuri si 585 de controale. Grupurile comparate au fost similare, mai putin prin doua caracteristici: pacientele au avut in antecedente o frecventa mai mare a tratamentului hormonal fata de grupul control (66% fata de 44%) si o incidenta a fracturilor usor mai mare (15% fata de 9% in grupul control). S-au utilizat 551,395 SNPs in analiza de asociere dupa ce s-au exclus: erorile de genotipare (n = 11,281), SNP-urile (n = 29,478) cu o frecventa a alelei minore <0.01

si SNPs care nu se situau la inceputul studiului in echilibrul Hardy-Weinberg (P < 1E-06) (n = 82).

Analiza de regresie a aratat 3 SNP-uri situate pe cromozmul 14 (rs7158782, rs7159713, rs2369049) care sunt in dezechilibru de linkare (linkage disequilibrium) sunt asociate reactiei adverse. Ca avand cele mai mici valori ale lui P (7.74E-07 to 2.23E-06), care se apropie de pragul lui Bonferroni de 1E-07.

Atribuirea si maparea fina ulterioara a identificat un SNP suplimentar (rs11849538) tot pe cromozmul 14 si tot in dezechilibru de linkare cu cele 3 initiale cu un P=6.67E-07.

Page 34: Epidemiologie. Genomic Wide Study

OBSERVATII

Sunt de notat in acest studiu: valoarea diferentelor initiale intre cele doua grupe de pacienti (tratamentul anterior,

prezenta unor modificari osoase) si anume stabilirea faptului ca nu sunt factori de confuzie

sunt prezentate clar grupurile de SNP-uri care au fost excluse etapa de asociere este specificata la un p mic (pragul Bonferroni este considerat a fi

pragul la care semnificatia statistica este mentinuta chiar si daca sunt selectatate succesiv stratificari ale populatiei initiale)

s-au utilizat procesele de mapare fina si de atribuire pentru a creste reprezentativitatea studiului.

Dezechilibrul de linkare: o asociere intre 2 alele localizate una langa alta pe acelasi cromozom, astfel incat sunt mostenite impreuna mai frecvent decat probabiliatea asteptata.

Page 35: Epidemiologie. Genomic Wide Study

REZULTATELE STUDIILOR DE TIPUL GWS

GENOMICA C7

Page 36: Epidemiologie. Genomic Wide Study

REZULTATE descoperirea implicarii unor noi mecanisme patogenice, necunoscute prin

metodele de investigatie si experimentale folosite alterior. Un exemplu concret este identificarea caii inflamatorii complement dependenta in

patogenia degenerescentei maculare legate de varsta. Aceasta a fost posibila prin identificarea a 5 variante care dubleaza riscul de aparitie a bolii si permit dezvoltarea cercetarii terapeutice in aceasta zona; un rezultat surprinzator pentru ca pana atunci se credea ca aceasta boala are un mecanism exclusiv degenerativ si sistemul complement nu fusese deloc cercetat in incercarile de a explica patogenia bolii.

Sunt inca studii de asociere la care prezumptia de asociere fals pozitiva persista (de ex. Asocierea locusului 8q24.22 cu markerii cancerului de prostata sau a markerilor ce apartin regiunii 5p13.1 asociati cu boala Crohn) desi reproductibilitatea lor a validat asocierea, pentru ca functia acestor zone in patogenia acestor boli nu este inca descifrata.

identificarea implicarii unor loci comuni pentru afectiuni intre care inainte nu se facea nici o asociere deschizand intrebarea asupra unor procese etiologice comune (de exemplu intre diabetul de tip 2 si melanomul invaziv, boala Crohn si boala Parkinson sau cancerul de prostata). Aceste asocieri, pe masura ce capata contur si validitate biologica pot sa creeze modele

noi de patogenie sau sa deschida posibilitati terapeutice inovative.

Page 37: Epidemiologie. Genomic Wide Study

REZULTATE (Manolio) Acuratetea metodelor de laborator (biologic si informatic) folosite este primul element de care trebuie tinut

cont in ORICE studiu de tip experimental. Verificarea metodologiei si a tehnicii de lucru este primul pas in identificarea unei surse de eroare sistematica: tehnica de laborator propriu zisa calitatea atribuirii, pasul de dupa genotipare; algoritmurile sistemelor informatice

Masurile de control standard:

frecventa a alelor minore, echilibrul Hardy-Weinberg equilibrium, eroarea de genotipare (proportia de tiparire eronata din procesul de genotipare datorat lipsei de specificitate a

testului, selectarea inadecvata a alelelor, sau a imperfectiunii randomizarii SNP-urile situate sub limita de semnificatie sunt eliminate.

Un lucru care trebuie avut in vedere este acela ca densitatea SNP-urilor influenteaza de asemenea atribuirea: cu cate scrierea lor (typing) este mai densa, cu atat acuratetea imputarii va fi mai mare.

Avantajul – si, paradoxal – dezavantajul - unui studiu al intregului genom este acela ca include in ipoteza de lucru toti factorii externi: si factorii de risc si factorii de protectie, ca si pe cei de confuzie

Page 38: Epidemiologie. Genomic Wide Study

LIMITARI SI OBSTACOLE ACTUALE

Omogenitatea populatiilor comparate - Stratificarea populatiei a fost considerata un factor care genereaza lipsa de reproductibilitate a studiilor.

SAIG compara doua populatii diferite; in principiu, frecventa alelelor in doua populatii diferite este in mod natural diferita, insa in SAIG scopul nu este de a identifica diferentele care nu au relevanta pentru subiectul analizat.

De aceea este uneori nevoie de determinarea subcategoriilor populationale. Acest lucru se poate realiza prin genotiparea unor markeri nelinkati intre ei si cautarea unei diferente

sistematice in frecventa alelelor. In cazul in care aceasta apare au fost propuse doua abordari pentru a corecta posibilul lor impact:

Metoda1: calculul testelor de distributie statistica care apoi sunt utilizate in validarea asocierii association (Pritchard si Rosenberg 1999; Devlin si Roeder 1999; Reich and Goldstein 2001).

Metoda 2 foloseste date aleatorii a markerilor non linkati (unlinked) pentru a identifica subpopulatii (Pritchard si colab 2000 b; Satten si colab 2001; Thornsberry si colab 2001), dupa care testele de asociere se aplica si subpopulatiilor pentru validare.

Indiferent de metoda folosita, omogenitatea populatiei studiate reprezinta un element esential in

interpretarea rezultatelor.

Page 39: Epidemiologie. Genomic Wide Study

EBM SI MEDICINA INTEGRATIVA

O prima incercare de aplicare a SIG la nivel individual este reprezentata de scanarea genomului individual.

In studiul individual al intregului genom (pentru care exista in prezent kit-uri disponibile) apar modificari ale SNP-urilor care nu au nici o relevanta clinica numite de Reed, “incidentaloma”; sunt mai degraba semne de intrebare decat raspunsuri si pana sa devina raspunsuri ele trebuie doar monitorizate de clinicieni.

Reed E. Pyeritz: The Coming Explosion in Genetic Testing — Is There a Duty to Recontact? N Engl J Med 2011; 365:1367-1369 2011) si Feero si Guttmacher (W. Gregory Feero, Alan E. Guttmacher,Genomic Medicine — An Updated Primer N Engl J Med 2010;362:2001-11.) fac o excelenta sinteza a implicatiilor secventierii individuale, aratand ca este dificil de stabilit in prezent relevanta clinica a scanarii genomului uman, datorita faptului ca; intre 5-30% din rezultatele acestui tip de test sunt variatii cu semnificatie necunoscuta. Cu toate ca sensibilitatea si specificitatea acestor teste este in jurul valorii 99.5%,

multitudinea variatiilor (SNP-urilor) care raman in procentul de eroare de 0.5% trebuie interpretatat cu circumspectie in decizia clinica.

Chiar cu o acuratete de 99.9999%, o secventiere a intregului genom contine 6000 de erori.

Page 40: Epidemiologie. Genomic Wide Study

DIRECTII DE DEZVOLTARE (West)

Exista 3 directii de dezvoltare pentru ca medicina personalizata sa corespunda exigentelor medicinii bazate pe evidente: testele care definesc profile care previzioneaza evenimente viitoare (cum sunt reactiile

adverse sau un raspuns particular la un tratament) trebuie sa intre in practica clinica formand baza pentru generatia urmatoare de studii clinice care vor utiliza aceste metodologii de stratificare a pacientilor

este necesara integrarea datelor genomice disponibile la ora actuala, in multiple surse; pentru aceasta datele relevante pentru fenotipurile clinice trebuie sa fie sintetizate pentru o descriere mai precisa a fenotipurilor clinice

intelegerea din profilele genice a mecanismelor care definesc pacientii cu risc crescut pot reprezenta noi oportunitati pentru interventiile terapeutice si aceste oportunitati terapeutice trebuie sa fie cercetate in studii clinice randomizate