QIEP

Pràctica de Relacions seqüència-estrcutura-funció

Pràctica de Relacions seqüència-estrcutura-funció

Exercicis relacions seqüència-estructura-funció

Preparació

  1. Instal·lació de Jalview
  2. Familiarització amb Pfam
  3. Tutorial de PFAM

EXERCICI 1) Exploració dels dominis d’una proteïna

Qüestió

Considereu la següent proteina. Fent servir informació dels dominis presents indiqueu de quin tipus de proteïna es tracta. Raoneu la vostra resposta: Indiqueu quins dominis presenta, a quines posicions, quines funcions porten associades, a quin clan PFAM, etc. Il·lustreu la vostra resposta amb alineaments trobats a PFAM, amb estructures del PDB, etc.

>protein x
MAEDDPYLGRPEQMFHLDPSLTHTIFNPEVFQPQMALPTDGPYLQILEQPKQRGFRFRYV
CEGPSHGGLPGASSEKNKKSYPQVKICNYVGPAKVIVQLVTNGKNIHLHAHSLVGKHCED
GICTVTAGPKDMVVGFANLGILHVTKKKVFETLEARMTEACIRGYNPGLLVHPDLAYLQA
EGGGDRQLGDREKELIRQAALQQTKEMDLSVVRLMFTAFLPDSTGSFTRRLEPVVSDAIY
DSKAPNASNLKIVRMDRTAGCVTGGEEIYLLCDKVQKDDIQIRFYEEEENGGVWEGFGDF
SPTDVHRQFAIVFKTPKYKDINITKPASVFVQLRRKSDLETSEPKPFLYYPEIKDKEEVQ
RKRQKLMPNFSDSFGGGSGAGAGGGGMFGSGGGGGGTGSTGPGYSFPHYGFPTYGGITFH
PGTTKSNAGMKHGTMDTESKKDPEGCDKSDDKNTVNLFGKVIETTEQDQEPSEATVGNGE
VTLTYATGTKEESAGVQDNLFLEKAMQLAKRHANALFDYAVTGDVKMLLAVQRHLTAVQD
ENGDSVLHLAIIHLHSQLVRDLLEVTSGLISDDIINMRNDLYQTPLHLAVITKQEDVVED
LLRAGADLSLLDRLGNSVLHLAAKEGHDKVLSILLKHKKAALLLDHPNGDGLNAIHLAMM
SNSLPCLLLLVAAGADVNAQEQKSGRTALHLAVEHDNISLAGCLLLEGDAHVDSTTYDGT
TPLHIAAGRGSTRLAALLKAAGADPLVENFEPLYDLDDSWENAGEDEGVVPGTTPLDMAT
SWQVFDILNGKPYEPEFTSDDLLAQGDMKQLAEDVKLQLYKLLEIPDPDKNWATLAQKLG
LGILNNAFRLSPAPSKTLMDNYEVSGGTVRELVEALRQMGYTEAIEVIQAASSPVKTTSQ
AHSLPLSPASTRQQIDELRDSDSVCDSGVETSFRKLSFTESLTSGASLLTLNKMPHDYGQ
EGPLEGKI

NOTA: A part del sequence search link a la web de PFAM també pots utilitzar el servidor HMMER de l’EBI, més ràpid. Selecciona la base de dades PFAM per fer la cerca).

Resposta

Usant la web de l’EBI, i fent una cerca de la seqüència, obtenim la imatge següent:

La taula mostra 4 clars dominis:

Com expliquem al Tutorial de PFAM, observem famílies PFAM (dominis RHD_DNA_bind, RHD_dimer i DEATH), així com dominis repetits (Ankyrin, en aquest cas).

La informació a les pàgines de PFAM ens mostra que:

Una cerca amb BLAST a NCBI ens mostra que, certament, es tracta de la proteïna NF-KB, i entrant amb més detall als resultats del BLAST obtenim informació sobre els dominis des del propi NCBI.

Finalment, és molt interessant usar el portal InterPro de l’EBI. Allà, amb una sola cerca per seqüència, podem accedir a informació sobre les diferents regions de la seqüència en una gran varietat de bases de dades i servidors. Aquí disposeu d’un fitxer PDF amb el resultat de la cerca de la nostra seqüència problema, confirmant que es tracta de la subunitat p105 del factor nuclear NF$\kappa$B, i podem accedir a les diverses bases de dades que descriuen els dominis de la proteïna (RHD_DNA_bind en vermell , RHD_Dimer en blau, ANK en verd i DEATH en groc):

>protein x
MAEDDPYLGRPEQMFHLDPSLTHTIFNPEVFQPQMALPTDGPYLQILEQPKQRGFRFRYV
CEGPSHGGLPGASSEKNKKSYPQVKICNYVGPAKVIVQLVTNGKNIHLHAHSLVGKHCED
GICTVTAGPKDMVVGFANLGILHVTKKKVFETLEARMTEACIRGYNPGLLVHPDLAYLQA
EGGGDRQLGDREKELIRQAALQQTKEMDLSVVRLMFTAFLPDSTGSFTRRLEPVVSDAIY
DSKAPNASNLKIVRMDRTAGCVTGGEEIYLLCDKVQKDDIQIRFYEEEENGGVWEGFGDF
SPTDVHRQFAIVFKTPKYKDINITKPASVFVQLRRKSDLETSEPKPFLYYPEIKDKEEVQ
RKRQKLMPNFSDSFGGGSGAGAGGGGMFGSGGGGGGTGSTGPGYSFPHYGFPTYGGITFH
PGTTKSNAGMKHGTMDTESKKDPEGCDKSDDKNTVNLFGKVIETTEQDQEPSEATVGNGE
VTLTYATGTKEESAGVQDNLFLEKAMQLAKRHANALFDYAVTGDVKMLLAVQRHLTAVQD
ENGDSVLHLAIIHLHSQLVRDLLEVTSGLISDDIINMRNDLYQTPLHLAVITKQEDVVED
LLRAGADLSLLDRLGNSVLHLAAKEGHDKVLSILLKHKKAALLLDHPNGDGLNAIHLAMM
SNSLPCLLLLVAAGADVNAQEQKSGRTALHLAVEHDNISLAGCLLLEGDAHVDSTTYDGT
TPLHIAAGRGSTRLAALLKAAGADPLVENFEPLYDLDDSWENAGEDEGVVPGTTPLDMAT
SWQVFDILNGKPYEPEFTSDDLLAQGDMKQLAEDVKLQLYKLLEIPDPDKNWATLAQKLG
LGILNNAFRLSPAPSKTLMDNYEVSGGTVRELVEALRQMGYTEAIEVIQAASSPVKTTSQ
AHSLPLSPASTRQQIDELRDSDSVCDSGVETSFRKLSFTESLTSGASLLTLNKMPHDYGQ
EGPLEGKI

EXERCICI 2) Dominis compartits

Qüestió

Considereu les proteïnes amb codis UNIPROT: P00749, P00734, P00750 i P00747. Quins tipus de dominis presenten aquestes proteïnes? Presenten algun tipus de dominis comuns? Podeu especular quelcom sobre la seva relació funcional basant-vos en la composició de dominis i la seva conservació? PISTA: Formen part de la cascada de coagulació.

Resposta

Comencem per accedir a Uniprot i explorar cadascun d’aquests codis.

Els dominis trobats a PFAM són:

uniprot nom dominis
P00749 UROK_HUMAN Kringle, Trypsin
P00734 THRB_HUMAN Gla, Kringle, Thrombin_light, Trypsin
P00750 TPA_HUMAN EGF, fn1, Kringle, Trypsin
P00747 PLMN_HUMAN Kringle, PAN_1, Trypsin

Observem que hi ha dos dominis comuns:

El fet de disposar de dominis d’interacció entre proteases (kringle) i de les pròpies proteases (domini tripsina) mostra clarament un seguit de proteïnes que treballen en cascada, amb interaccions entre elles i les proteïnes a catalitzar.

EXERCICI 3) Homologia

Qüestió

Considereu aquestes 3 proteïnes (codi Uniprot entre parèntesis):

Primer, definiu quin podria ser l’ancestre comú d’aquestes tres proteïnes, tenint en compte la seva composició de dominis. Justifiqueu la vostra resposta. Un cop definit l’ancestre comú, hipotetitzeu sobre el possible camí evolutiu d’aquestes tres proteïnes. Justifiqueu la vostra resposta.

Resposta

Aquest cop treballarem amb Interpro enlloc de PFAM, ja que ens ofereix un major ventall d’interrelacions, però la discussió és anàloga.

uniprot nom dominis
Q20318 LIN49_CAEEL, Lin-49 Bromodomain, EPHD, Znf_PHD
P55201 BRPF1_HUMAN, Peregrin EPL1, EPHD, Znf_PHD, Bromodomain
Q12311 NTO1_YEAST, NuA3 EPL1, EPHD, Znf_PHD

Començariem per aquella proteïna que presentés els dominis comuns a tots: PH i ZF. A partir d’aquí hauriem de pensar en diferents posibilitats per anar incorporant la resta: EPL1 i Bromodomain. És important veure que el EPL1 es comú a Peregrin i YOR031W però no esta present a Lin-49, per tant la primera especiació implica que una de les branques incorpora EPL1, però l’altra no. A partir d’aquestes dues branques, la que ha incorporat EPL1, es tornaria a bifurcar amb una proteina que ja no canviaria més: NuA3 i l’altra que incorporaria Bromodomain per donar lloc a Peregrin. La segona branca original que no va incorporar EPL1, incorporaria Bromodomain per donar lloc a Lin-49. El dominis Bromodomains estan presents a Lin-49 i Peregrin però s’haurien d’haver incorporat de forma independent, cadascun en la seva propia branca.