Estructura de les proteïnes: intro

modifica

Les proteïnes estan formades a base de seqüències d’aminoàcids formant estrures concretes, permetent així el seu correcte funcionament. El plegament de proteïnes és la recerca dirigida de l'espai conformacional que permet que la proteïna es plegui en una escala de temps biològicament factible. Anfinsen va mostrar que l'estat natiu d'una proteïna és termodinàmicament estable, la conformació està en el mínim global de la seva energia lliure. La paradoxa de Levinthal afirma que si una proteïna de mida mitjana mostrés totes les conformacions possibles abans de trobar la que té l'energia més baixa, tot el procés trigaria milers de milions d'anys. Les proteïnes normalment es pleguen en 0,1 i 1000 segons. Per tant, el procés de plegament de proteïnes s'ha de dirigir d'alguna manera a través d'una via de plegament específica. Les forces que dirigeixen aquesta recerca són probablement una combinació d'influències locals i globals, que tenen efectes en diverses etapes de la reacció.

S'ha descobert que el plegament aïllat d'un domini es pot donar al mateix ritme o a vegades més ràpid que el del domini integrat, suggerint que les interaccions desfavorables amb la resta de proteïnes poden ocórrer durant el plegat. Diversos arguments suggereixen que el pas més lent en el plegament de grans proteïnes és el maridatge dels dominis plegats. Això és perquè els dominis no es pleguen de manera completament correcte, o perquè els petits ajustos necessaris per a la seva interacció són energèticament desfavorables, com ara l'eliminació d'aigua d’un domini d’interfície.  

La dinàmica dels dominis proteics juga un paper clau en una multitud de processos de reconeixement molecular i senyalització. Els modes dinàmics resultants generalment no es poden predir a partir d'estructures estàtiques de tota la proteïna o de dominis individuals. No obstant això, poden ser inferits mitjançant la comparació de diferents estructures d'una proteïna (com en la base de dades de moviments moleculars). També es poden suggerir mitjançant mostreig en extenses trajectòries de dinàmica molecular i anàlisi de components principals, o es poden observar directament mitjançant espectroscòpics mesurats per espectroscòpia d'espín de neutrons.

Els dominis com a mòduls evolutius

modifica

L’estudi de l’evolució es basa en un procés probabilístic, ja que és molt menys costós, per tant, més probable, que en la natura es reutilitzin estructures pre-existents a que se’n generin de novo. Per tant, lo més habitual quan es genera una nova seqüència és que aquesta sigui una adaptació d’una seqüència que ja existia a la natura.

Els dominis són el material que utilitza la natura per generar noves seqüències; es poden pensar com a unitats genèticament mòbils, anomenades "mòduls". Els mòduls de proteïnes són un subconjunt de dominis proteics que es troben en una gamma de proteïnes diferents amb una estructura particularment versàtil. Es poden trobar exemples d’aquests mòduls en proteïnes extracel·lulars associades a la coagulació, fibrinolisi, el complement, la matriu extracel·lular, les molècules d’adhesió de la superfície cel·lular i els receptors de citoquines. Quatre exemples concrets de mòduls proteics generalitzats són: SH2, immunoglobulina, fibronectina tipus 3 i kringle.

L’evolució molecular dóna lloc a famílies de proteïnes relacionades amb seqüències i estructures semblants. No obstant, les semblances entre seqüències poden ser extremadament baixes entre proteïnes que comparteixen la mateixa estructura. Les estructures proteiques poden ser similars perquè les proteïnes han divergit d’un ancestre comú, malgrat les seqüències s’hagin anat diferenciant per adaptar-se a les noves funcions.  

D’altra banda, alguns plecs poden veure’s més afavorits que d’altres ja que representen disposicions estables d’estructures secundàries i algunes proteïnes poden convergir cap a aquests plecs al llarg de l’evolució. Actualment, es coneixen unes 110.000 estructures 3D, que s’han determinat experimentalment, i estan recollides i catalogades al Protein Data Bank (PDB). Tanmateix, aquesta base de dades conté moltes estructures idèntiques o molt similars. Totes les proteïnes s’han de classificar en famílies estructurals per entendre les seves relacions evolutives, ja que les comparacions estructurals s’aconsegueixen millor a nivell de dominis proteics.

La importància dels dominis com a blocs estructurals de construcció i elements d'evolució ha provocat molts mètodes automatitzats per a la seva identificació i classificació en proteïnes d'estructura coneguda. S’han desenvolupat molts algoritmes per assignar de forma automàtica dominis a estructures 3D ja conegudes i recollides en bases de dades, com la CATH domain database.. Els procediments automàtics per a l'assignació fiable de dominis són essencials per a la generació de les bases de dades de dominis, especialment a mesura que augmenta el nombre d'estructures de proteïnes conegudes.

Encara que els límits d'un domini poden ser determinats per la inspecció visual, la construcció d'un mètode automatitzat no és senzilla. Els problemes es produeixen davant de dominis discontinus o altament associats. El fet que no hi hagi una definició estàndard del que realment és un domini ha fet que les assignacions de dominis hagin anat variant enormement, ja que en moltes investigacions s’han utilitzat criteris diferents.

Un domini estructural és una subestructura compacta i globular que presenta un major nombre d’interaccions en el seu interior que amb la resta de proteïnes. Per tant, un domini estructural pot ser determinat per dues característiques visuals: la seva compactació i el seu grau d'aïllament. Les mesures de compactació local en proteïnes s'han utilitzat en molts dels primers mètodes d'assignació de dominis i en diversos dels mètodes més recents.

Últim mètode

modifica

En el seu estudi, Potestio et al.[1] han introduït un mètode general per identificar dominis dinàmics, és a dir, regions proteiques que es comporten aproximadament com a unitats rígides en el curs de les fluctuacions estructurals. Entre altres aplicacions, també s'ha utilitzat per comparar la consistència de les subdivisions dels dominis basades en dinàmiques en comparació amb les basades en l'estructura estàndard. El mètode, anomenat PiSQRD, està disponible públicament en forma de servidor web.[2] Aquest últim permet als usuaris subdividir de manera òptima proteïnes de cadena única o multimèriques en dominis quasi rígids basant-se en els modes col·lectius de fluctuació del sistema. Per defecte, aquests últims es calculen a través d'un model de xarxa elàstic; l’usuari pot carregar espais dinàmics essencials precalculats de forma alternativa.

Exemples de dominis proteics

modifica
  • Armadillo repeats: Aquest nom fa referència al nom de la proteïna Armadillo β-catenin-like de la mosca de la fruita, Drosophila.
  • Basic Leucine zipper domain (bZIP domain): Es troba en moltes proteïnes eucariotes d’unió a l’ADN. Una part del domini conté una regió que media les propietats específiques d'unió a l'ADN i la cremallera de Leucina que es requereix per a la dimerització de dues regions d'unió a l'ADN. La regió d'unió a l'ADN comprèn una sèrie d'aminoàcids, bàsics com l'arginina i la lisina
  • Repeticions de Cadherina: Les cadherines funcionen com a proteïnes d'adhesió entre cèl·lules, i són dependents de Ca2. Aquests dominis són regions extracel·lulars que medien la unió homòfila cel·lular entre cadherines a la superfície de les cèl·lules adjacents.
  • Death effector domain (DED): El domini effector de la mort permet la unió proteïna-proteïna mitjançant interaccions homotípiques (DED-DED). Les proteases caspasa desencadenen apoptosi a través de cascades proteolítiques. Pro-Caspase-8 i pro-caspase-9 s'uneixen a molècules adaptadores específiques a través de dominis DED i això condueix a l'autoactivació de les caspases.
  • EF hand: Es tracta d’un motiu estructural helix-turn-helix que es troba en cada domini estructural de la proteïna de senyalització calmodulina i en la proteïna muscular troponina-C.
  • Immunoglobulin-like domains: Els dominis similars a la immunoglobulina es troben en proteïnes de la superfamília d'immunoglobulina (IgSF). Contenen uns 70-110 aminoàcids i es classifiquen en diferents categories (IgV, IgC1, IgC2 i IgI) segons la seva mida i funció. Contenen un plec característic en el qual dos làmines beta formen un "sandvitx" que s'estabilitza per les interaccions entre cisteïnes conservades i altres aminoàcids carregats. Són importants per a les interaccions proteïna-proteïna en processos d'adhesió cel·lular, activació cel·lular i reconeixement molecular. Aquests dominis es troben de manera comuna en molècules amb rols en el sistema immunitari.
  • Dominis d'unió a la fosfortirosina (PTB): Solen unir-se a residus de tirosina fosforilada. Sovint es troben en proteïnes de transducció de senyals. L'especificitat d'unió del domini PTB està determinada pels residus de l’extrem amino-terminal de la fosforetina. Exemples: Els dominis PTB tant de L'SHC com de l'IRS-1 s'uneixen a una seqüència NPXpY. Les proteïnes que contenen PTB com l'SHC i l'IRS-1 són importants per a les respostes a la insulina de les cèl·lules humanes.
  • Domini d'homologia a la pleckstrin (PH) s'uneixen als fosfoinositoides amb una alta afinitat. S'ha observat especificitat per a PtdIns(3)P, PtdIns(4)P, PtdIns(3,4)P2, PtdIns(4,5)P2 i PtdIns(3,4,5)P3. Atès que les fosfoinositols són segrestats a diverses membranes cel·lulars (a causa de la seva llarga cua lipòfila) els dominis PH solen causar el reclutament de la proteïna en qüestió a una membrana on la proteïna pot exercir una certa funció en la senyalització cel·lular, la reorganització citoesquelètica o el tràfic de membranes.
  • Domini d’homologia a Src 2 (SH2): Els dominis SH2 es troben sovint en proteïnes de transducció de senyals. Els dominis SH2 confereixen vinculació amb la tirosina fosforilada (pTyr). El nom del domini d'unió de la fosfortirosina prové del domini src de l’oncogen viral, que és en si mateix una tirosina quinasa. Vegeu també: Domini SH3.
  • Zinc finger DNA binding domain (ZnF_GATA): Les proteïnes que contenen el domini ZnF_GATA solen ser factors de transcripció que normalment s'uneixen a la seqüència d'ADN [AT]GATA[AG] dels promotors.

Dominis de funció desconeguda

modifica

Una gran part dels dominis tenen una funció desconeguda. Un domini de funció desconeguda (DUF - Domain of Unknown Function) és un domini de proteïna que no té cap funció caracteritzada. Aquestes famílies s’han recopilat juntes a la base de dades Pfam mitjançant el prefix DUF, seguit d’un número, per exemple DUF2992 i DUF 1220. Ara hi ha més de 3000 famílies DUF dins d’aquesta base de dades, les quals representen més del 20% de les famílies conegudes. Sorprenentment, el nombre de DUF a Pfam ha augmentat del 20%, en el 2010, al 22%, en el 2019, principalment, a causa del nombre creixent de noves seqüències de genomes. La versió 32.0 (2019) de Pfam contenia 3961 DUF.


  1. Potestio, R.; Pontiggia, F.; Micheletti, C. «Coarse-Grained Description of Protein Internal Dynamics: An Optimal Strategy for Decomposing Proteins in Rigid Subunits» (en english). Biophysical Journal, 96, 12, 17-06-2009, pàg. 4993–5002. DOI: 10.1016/j.bpj.2009.03.051. ISSN: 0006-3495. PMC: PMC2712024. PMID: 19527659.
  2. Aleksiev, T.; Potestio, R.; Pontiggia, F.; Cozzini, S.; Micheletti, C. «PiSQRD: a web server for decomposing proteins into quasi-rigid dynamical domains». Bioinformatics, 25, 20, 20-08-2009, pàg. 2743–2744. DOI: 10.1093/bioinformatics/btp512. ISSN: 1367-4803.