BIOLOGIE GENERALĂ - moleculară şi celulară - CURS XIII · Metoda Sanger, cea ce utilizeză...

10
BIOLOGIE GENERALĂ - moleculară şi celulară - CURS XIII BLAST

Transcript of BIOLOGIE GENERALĂ - moleculară şi celulară - CURS XIII · Metoda Sanger, cea ce utilizeză...

Page 1: BIOLOGIE GENERALĂ - moleculară şi celulară - CURS XIII · Metoda Sanger, cea ce utilizeză terminatori marcaţi fluorescenţi şi metodele de nouă generaţie au permis acumularea

BIOLOGIE GENERALĂ

- moleculară şi celulară -

CURS XIIIBLAST

Page 2: BIOLOGIE GENERALĂ - moleculară şi celulară - CURS XIII · Metoda Sanger, cea ce utilizeză terminatori marcaţi fluorescenţi şi metodele de nouă generaţie au permis acumularea

Baze de date cu secvenţe

Metoda Sanger, cea ce utilizeză terminatori marcaţi fluorescenţi şi metodele de nouă generaţie au permis acumularea unui număr foarte mare de secvenţe ceea ce a dus la necesitatea organizării lor şi prelucrării lor computerizate – apare bioinformatica.

Bases SequencesDec 1982 680338 606

Nov 1983 2274029 2427

May 1984 3002088 3665

Sep 1984 3323270 4135

Oct 1984 3368765 4175

Nov 1984 3689752 4393

May 1985 4211931 4954

Sep 1985 5204420 5700

Feb 1986 5925429 6642

May 1986 6765476 7416

Aug 1986 8442357 8823

Nov 1986 9615371 9978

Oct 2014 181563676918 178322253

Dec 2014 184938063614 179295769

Feb 2015 187893826750 181336445

Apr 2015 189739230107 182188746

Bioinformatica – ansamblul de metode şi tehnici ce permit stocarea, manipularea şi interpretarea informaţiei genetice – definiţia restrânsă !!!!

ADN ARN Proteine

Complementaritatea bazelor azotate

universalaCodul Genetic

~universal

Informaţie Informaţie

1. Stocarea informaţiei genetice – baze de date cu secvenţe:A) ADN - GenBank - http://www.ncbi.nlm.nih.gov/genbank/

INSDC - http://www.insdc.org/B) ARN – RNACentral - http://rnacentral.org/

ARNr - Silva - http://www.arb-silva.de/C) proteine: – secveţe de aminoacizi - Protein database http://www.ncbi.nlm.nih.gov/protein- structuri 3D - wwPDB - http://www.wwpdb.org/

NCBI - National Center for Biotechnology Information – baze de date cu secvenţe, structuri, compuşi chimici, literatură, etc

Page 3: BIOLOGIE GENERALĂ - moleculară şi celulară - CURS XIII · Metoda Sanger, cea ce utilizeză terminatori marcaţi fluorescenţi şi metodele de nouă generaţie au permis acumularea

Baze de date cu secvenţe

2. Manipularea informaţiei genetice – informaţia este organizată în bazele de date sub formă de secvenţe. O secvenţă poate fi:● o însiruire de baze azotate ce descrie structura primară a unui fragment dintr-o moleculă de ADN sau

ARN. O secvenţă ADN poate cuprinde un fragment, o genă sau un grup de gene. ● o însiruire de aminoacizi ce descrie structura primară a unei proteine sau a unei porţiuni dintr-o

proteină

Indiferent de tip, o secvenţă este cel mai frecvent stocată sub forma unui fişier FASTA – un fişier text în care:- pe primul rând de text, marcat cu “>“ se află o serie de informaţii cu caracter opţional, precum numărul de ordine în GeneBank, specia sau denumirea genei (proteinei).- pe următoarele rânduri se află secvenţa propriu-zisă, în care nucleotidele/aminoacizii sunt reprezentaţi folosind codul standard IUPAC cu o singură literă

Page 4: BIOLOGIE GENERALĂ - moleculară şi celulară - CURS XIII · Metoda Sanger, cea ce utilizeză terminatori marcaţi fluorescenţi şi metodele de nouă generaţie au permis acumularea

Compararea secvenţelor

3. Interpretarea informaţiei genetice – cunoaşterea secevenţei de nucleotide a unui fragment de ADN sau a unei proteine nu înseamnă obligatoriu şi cunoaşterea rolului (funcţiei moleculei).

Pentru identificarea computerizată a funţiei unei proteine sau gene necunoscute se pleacă de la următoarele premize:

1. toate proteinele au evoluat din alte proteine prin mutaţia aleatoare a aminoacizilor din secvenţa primară

MAAKYRIGYFVGSLATGSINRVLSQALINLAPEDLEFSEIPIRDLPLYSYDYDADFPPEGR

3. Secvenţele de aminoacizi ale proteinelor nu au caracter randomic, ci prezintă mai degrabă un anumit grad de similaritate ceea ce permite compararea lor.

2. înlocuirea unui aminoacid cu altul într-o proteină nu este întoteauna aleatoare ci este rolul aminoacizilor în cadrul proteinei. Au fost 3 categorii distincte:

a) aminoacizi înalt conservaţi - nu sunt înlocuiţi decât extrem rar - sunt aminoacizii din situsul catalitic sau funcţional, responsabili în mod direct de realizarea funcţiei;

b) aminoacizi conservaţi - sunt înlocuiţi destul de rar - sunt aminoacizii implicaţi în

realizarea structurilor secundare şi terţiare; c) aminoacizi puţin conservaţi - sunt înlocuiţi frecvent

- sunt în general aminoacizii de pe suprafaţa proteinelor;

SELECŢIE

ANAAREMERE

ANARREMERE

ANAAREMERE

NNARREMERE

ALMAREESRE

ANCDREMSRE

AN

AA

RE

NE

RE

ANMSAREM

ERE

ANAAREMERE

ANAACRSDERE

Page 5: BIOLOGIE GENERALĂ - moleculară şi celulară - CURS XIII · Metoda Sanger, cea ce utilizeză terminatori marcaţi fluorescenţi şi metodele de nouă generaţie au permis acumularea

BLAST

BLAST (engl.Basic Local Aligment Search Tool) – program compară o secvenţă de interes cu o bibliotecă de secvenţe cu funcţie cunoscută dintr-o bază de date. Prin identificarea în baza de date a secvenţelor cunoscute care prezintă un înalt grad de similaritate cu secvenţa de interes, poate fi precizată funcţia acesteia din urmă.

BLAST utilizează următoarele noţiuni: 1. Alinierea a două sau mai multe secvenţe - fiecare aminoacid (nucleotid) din secvenţa A este comparat cu aminoacidul (nucleotidul) corespunzător din secvenţa B. O orespondenţăîntre doi aminoacizi (nucleotide) din aceeaşi poziţie pe cele două secvenţe poartă numele de identitate, iar o neconcordanţă se numeşte substituţie.

2. Similaritatea la nivel de secvenţă se referă la două secvenţe care prezintă asemănăriuna în raport cu cealaltă datorită unui număr mai mare sau mai mic de aminoacizi identici.

3. Omologia se referă la faptul că două secvenţe se aseamănă una cu cealaltă datorită evoluţiei dintr-un strămoş comun, dar nu sunt obligatoriu similare.

http://blast.ncbi.nlm.nih.gov/Blast.cgi - diverse variante de BLAST – blastn – pentru secvenţe de nucleotide, blastp – pentru secvenţe de aminoacizi

Page 6: BIOLOGIE GENERALĂ - moleculară şi celulară - CURS XIII · Metoda Sanger, cea ce utilizeză terminatori marcaţi fluorescenţi şi metodele de nouă generaţie au permis acumularea

Funcţionarea programului BLAST

Programul BLAST realizează în ordine:● Identificarea din baza de date a secvenţelor similare cu o secvenţă ţintă. Secvenţele

identificate poartă numele de secvenţe “subiect” - De ce nu nu e o singură secvenţă?● Cuantificarea nivelului de similaritate dintre secvenţa ţintă şi cele subiect prin utilizarea

unor matrici de substituţie. O matrice de substituţie arată frecvenţa cu care un aminoacid este înlocuit cu altul şi au la bază observaţiile experimentale.

Page 7: BIOLOGIE GENERALĂ - moleculară şi celulară - CURS XIII · Metoda Sanger, cea ce utilizeză terminatori marcaţi fluorescenţi şi metodele de nouă generaţie au permis acumularea

● Calcularea unui scor al alinierii prin însumarea punctelor pentru fiecare pereche aminoacid-aminoacid şi ierarhizarea secvenţelor ţintă funcţie de valoarea acestui scor. Cu cât scorul este mai mare, cu atât secvenţele sunt mai similare.

Funcţionarea programului BLAST

Page 8: BIOLOGIE GENERALĂ - moleculară şi celulară - CURS XIII · Metoda Sanger, cea ce utilizeză terminatori marcaţi fluorescenţi şi metodele de nouă generaţie au permis acumularea

Realizarea unei căutări folosind BLAST

A – căsuţa text în care a fost inserată secvenţa ţintă înformat FASTA; B – zona cu parametrii utilizaţi pentru restrângerea spaţiului de căutare;C – buton pentru lansarea investigării; D – zona cu parametrii algoritmului de căutare

Page 9: BIOLOGIE GENERALĂ - moleculară şi celulară - CURS XIII · Metoda Sanger, cea ce utilizeză terminatori marcaţi fluorescenţi şi metodele de nouă generaţie au permis acumularea

A – informaţii privind interogarea realizată; B – domeniile înalt conservate identificate;C – prezentarea grafică de ansamblu a rezultatelor; D – tabel cu secvenţele identificate;E – exemplu de aliniere între secvenţa de interes şi o secvenţă subiect identificată prinBLAST.

Page 10: BIOLOGIE GENERALĂ - moleculară şi celulară - CURS XIII · Metoda Sanger, cea ce utilizeză terminatori marcaţi fluorescenţi şi metodele de nouă generaţie au permis acumularea

Bibliografie recomandată

Biology, 6th Edition

Raven, Peter H.; Johnson, George B.

Published by McGraw-Hill, Boston, MA, 2002ISBN 10: 0073031208 / ISBN 13: 9780073031200

Structural Bioinformatics

2nd Edition

Jenny Gu (Editor), Philip E. Bourne (Editor)ISBN: 978-0-470-18105-81096 pagesApril 2009, Wiley-Blackwell

Biologie Moleculară

Metode experimentale

Mihăşan M., Olteanu Z., Ştefan M.,Editura Universităţii Alexandru I CuzaISBN: 978-973-703-816-6