Domini proteic

Un domini proteic és una agrupació globular de cadenes polipeptídiques que forma una regió molt conservada d’una proteïna, i que té una estructura terciària que pot existir, funcionar i evolucionar independentment de la resta de la cadena peptídica. Cada domini forma una estructura tridimensional compactada i sovint es troba plegada i estable de forma independent, i li confereixen a les proteïnes una aparença bi- o multilobular. De fet, la proteòlisi limitada d'una proteïna amb diversos dominis allibera sovint els seus dominis sense alterar gaire la seva estructura global. No obstant això, l'estructura d'una proteïna amb dominis no sempre és evident, ja que aquests poden establir contactes tan extensos entre si que la proteïna apareix com una entitat globular simple.

Proteïna amb set dominis diferents. Cada color correspon a un domini diferent.

La majoria dels dominis estan constituïts per entre 50 i 250 aminoàcids, cada un dels quals té un diàmetre aproximat de 25Å. L’evolució molecular ha utilitzat els dominis com a blocs de construcció, que es poden combinar amb diferents disposicions per crear proteïnes amb una gran varietat funcional. Un mateix domini pot aparèixer en diferents proteïnes. Els dominis més curts, com els dits de zinc (zinc fingers), es poden estabilitzar mitjançant ions metàl·lics o ponts disulfúrics. Els dominis sovint formen unitats funcionals, com el domini EF d’unió al calci de la calmodulina (calcium-binding EF hand domain of calmodulin).

Com que són dominis estables de forma independent, poden ser intercanviats mitjançant enginyeria genètica per produir altres proteïnes de fusió o quimèriques.

HistòriaModifica

L’any 1973, Wetlaufer[1] va definir per primera vegada el concepte de domini proteic com a unitats estructurals d’una proteïna que es poden plegar de manera autònoma, independent i estable.

Anteriorment, els dominis havien estat descrits com a unitats que tenien:

Cada una d’aquestes definicions és vàlida i sovint se superposa, ja que un domini estructural compacte que es troba en diverses proteïnes és probable que es plegui sobre ell mateix de manera independent, sense veure’s afectat pel seu entorn estructural.[5] En la natura, sovint trobem diversos dominis junts, formant proteïnes multidominis i multifuncionals. En una proteïna multidomini, cadascun dels dominis és capaç de realitzar la seva funció de manera independent, o bé de manera coordinada amb els seus dominis veïns. Els dominis també poden servir com a mòduls per construir complexos o conjunts més grans, com ara partícules de virus o fibres musculars. També poden proporcionar llocs catalítics o llocs d’unió específics, com els que es troben en enzims o proteïnes reguladores.

Exemple de la PKAModifica

Unió del substrat (S) al centre actiu de la subunitat catalítica de la PKA i formació del producte (P), en aquest cas, fosforilació d'altres proteïnes.

La Proteïna-cinasa A (PKA) és una família d’enzims amb activitat dependent dels nivells cel·lulars de Monofosfat d’Adenosina cíclic (cAMP). Per aquesta raó també se la coneix amb el nom de proteïna-cinasa dependent de cAMP. Té moltes funcions dins de la cèl·lula, com ara la regulació del glicogen, dels carbohidrats i del metabolisme dels lípids. La PKA està present en una gran varietat de cèl·lules i la seva regulació, mitjançant cAMP, està involucrada en un moltes vies de senyalització.

La subunitat reguladora inactiva la catalítica. La unió del cAMP a la subunitat reguladora permet el desacoblament de les dues subunitats, activant la subunitat catalítica.

Quan es troba inactiva, la PKA té una estructura formada per un tetràmer que consisteix en dues subunitats catalítiques i dues reguladores. La subunitat catalítica presenta el centre actiu, el qual uneix i hidrolitza Trifosfat d’Adenosina (ATP), i un domini que li permet unir-se a la subunitat reguladora. La subunitat reguladora, en canvi, té diversos dominis per unir-se al cAMP, dominis que permeten la interacció entre la subunitat catalítica i la subunitat reguladora i un domini autoinhibidor.[6]

Quan la subunitat catalítica es troba lliure i activa, pot migrar al nucli i fosforilar proteïnes reguladores de la transcripció, mentre que les subunitats reguladores romandran en el citoplasma, sense tenir accés al nucli.[7] Aquests són els gens que codifiquen per les PKA humanes:

Subunitat de la PKA humana Gens codificants
Subunitat catalítica PRKACA PRKACB PRKACG
Subunitat reguladora tipus I PRKAR1A PRKAR1B
Subunitat reguladora tipus II PRKAR2A PRKAR2B

Quatre molècules d'AMPc poden unir-se a les subunitats reguladores. Aquesta unió provocarà un canvi conformacional d’aquestes subunitats i farà que les subunitats catalítiques s’alliberin de les reguladores. Aquest alliberament permetrà l’activació de les subunitats catalítiques, les quals podran transferir fosfats terminals d’ATP a substrats de proteïna en residus de serina o treonina.

Estructura i plegament de les proteïnesModifica

Les proteïnes estan formades a base de seqüències d’aminoàcids formant estructures concretes, permetent així el seu correcte funcionament. El plegament de proteïnes és la recerca dirigida de l'espai conformacional que permet que la proteïna es plegui en una escala de temps biològicament factible. Anfinsen[8] va mostrar que l'estat natiu d'una proteïna és termodinàmicament estable, la conformació està en el mínim global de la seva energia lliure. La paradoxa de Levinthal[9] afirma que si una proteïna de mida mitjana mostrés totes les conformacions possibles abans de trobar la que té l'energia més baixa, tot el procés trigaria milers de milions d'anys. Les proteïnes normalment es pleguen en 0,1 i 1000 segons. Per tant, el procés de plegament de proteïnes s'ha de dirigir d'alguna manera a través d'una via de plegament específica.[10] Les forces que dirigeixen aquesta recerca són probablement una combinació d'influències locals i globals, que tenen efectes en diverses etapes de la reacció.[11]

S'ha descobert que el plegament aïllat d'un domini es pot donar al mateix ritme o a vegades més ràpid que el del domini integrat, suggerint que les interaccions desfavorables amb la resta de proteïnes poden ocórrer durant el plegat.[12] Això és perquè els dominis no es pleguen de manera completament correcta, o perquè els petits ajustos necessaris per a la seva interacció són energèticament desfavorables, com ara l'eliminació d'aigua d’un domini d’interfície.

La dinàmica dels dominis proteics juga un paper clau en una multitud de processos de reconeixement molecular i senyalització. Els modes dinàmics resultants generalment no es poden predir a partir d'estructures estàtiques de tota la proteïna o de dominis individuals. No obstant això, poden ser inferits mitjançant la comparació de diferents estructures d'una proteïna (com en la base de dades de moviments moleculars). També es poden suggerir mitjançant mostreig en extenses trajectòries de dinàmica molecular i anàlisi de components principals,[13] o es poden observar directament mitjançant espectres[14] mesurats per espectroscòpia d'espín de neutrons.

En el procés de plegament podem distingir 4 estructures:

 
Estructura primària d'una proteïna.

Estructura primàriaModifica

L'estructura primària és la cadena d'aminoàcids que codifica pel plegament tridimensional de la proteïna. Els aminoàcids hidrofòbics es troben formant el nucli de la proteïna, envoltats per una capa de residus hidrofílics.

Estructura secundàriaModifica

Com que els enllaços peptídics són polars, es neutralitzen mitjançant l'enllaç d’hidrogen entre ells quan es troben en un entorn hidrofòbic, formant patrons estructurals tridimensionals regulars coneguts com a estructura secundària.[15] Hi ha dos tipus d’estructures secundàries: la hèlix alfa i la làmina beta. Freqüentment es produeixen combinacions d’elements d’estructura secundària, donant lloc a motius o estructures supersecundàries.[16] Alguns exemples serien la beta-hairpin o el motiu beta-alfa-beta.

La unió covalent de dos dominis representa un avantatge tant funcional com estructural, ja que proporciona un increment de l’estabilitat en comparació amb les estructures que estan associades amb unions no-covalents.[17] D’altra banda, també té avantatges com la protecció dels intermediaris dins de butxaques enzimàtiques entre dominis que, d’una altra manera, poden ser inestables en entorns aquosos. Un altre avantatge que proporciona l’associació covalent és la relació estequiomètrica fixa de l’activitat enzimàtica necessària per a un conjunt seqüencial de reaccions.

Estructura terciàriaModifica

Diversos motius s’uneixen per formar unitats compactes, locals i semiindependents anomenades dominis. La majoria de les estructures 3D de les cadenes polipeptídiques es coneixen com a estructura terciària de la proteïna. Els dominis són les unitats fonamentals de l’estructura terciària, cada domini conté un nucli hidrofòbic individual que està format per unitats estructurals secundàries connectades per bucles.[18]

L’empaquetament del polipèptid acostuma a ser major en l’interior que en l’exterior del domini, generant un nucli sòlid i una superfície molt més fluida. Els residus del nucli acostumen a estar conservats en una família de proteïnes, mentre que els residus dels bucles són menys conservats, a no ser que estiguin involucrats en la funció de la proteïna.

L’estructura terciària de la proteïna es pot classificar segons el contingut estructural secundari del domini[19][20] en:

  • Dominis alfa: Formats exclusivament a partir d’hèlix-alfa.[21]
  • Dominis beta: Nucli compost per làmines beta antiparal·leles.[22]
  • Dominis alfa+beta: Són una barreja entre tots els motius alfa i beta. La classificació de les proteïnes en aquesta categoria és difícil a causa de les superposicions entre les altres 3 classes i, per tant, no és utilitzada en la CATH domain database.[23]
  • Dominis Alfa/Beta: Formats a partir de la combinació de motius beta-alfa-beta que, de forma predominant, formen una làmina beta paral·lela envoltada per hèlix-alfa amfipàtiques. Les estructures secundàries es disposen en capes o barrils.[24]
 
Estructura quaternària d'una proteïna.

Estructura quaternàriaModifica

Moltes proteïnes tenen una estructura quaternària, la qual consisteix en moltes cadenes polipeptídiques associades a una molècula oligomèrica. Cada cadena de polipèptids d’una proteïna d’aquest tipus s’anomena subunitat.

La mida dels dominis estructurals individuals varia dels 36 residus en la E-selectina, fins als 692 residus en lipoxigenasa-1, però la majoria (90%) tenen menys de 200 residus amb una mitjana d’aproximadament 100 residus.[25] Els dominis molt petits, menys de 40 residus, acostumen a estar estabilitzats per ions metall o ponts disulfur. Els dominis més grans, més de 300 residus, és probable que continguin múltiples nuclis hidrofòbics.

Aquests dominis es poden intercanviar: l’element secundari o terciari d’una proteïna monomèrica és reemplaçat pel mateix element d’una altra proteïna.[26] Aquest intercanvi de dominis contempla des d’elements de l’estructura secundària fins a qualsevol domini estructural. També representa un model evolutiu de les adaptacions funcionals per oligomerització.

Els dominis com a mòduls evolutiusModifica

L’estudi de l’evolució es basa en un procés probabilístic, ja que és molt menys costós, per tant, més probable, que en la natura es reutilitzin estructures preexistents a que se’n generin de novo.[27] Per tant, el més habitual quan es genera una nova seqüència és que aquesta sigui una adaptació d’una seqüència que ja existia a la natura.

Els dominis són el material que utilitza la natura per generar noves seqüències; es poden pensar com a unitats genèticament mòbils, anomenades "mòduls".[28] Els mòduls de proteïnes són un subconjunt de dominis proteics que es troben en una gamma de proteïnes diferents amb una estructura particularment versàtil. Es poden trobar exemples d’aquests mòduls en proteïnes extracel·lulars associades a la coagulació, fibrinòlisi, el complement, la matriu extracel·lular, les molècules d’adhesió de la superfície cel·lular i els receptors de citocines. Quatre exemples concrets de mòduls proteics generalitzats són: SH2, immunoglobulina, fibronectina tipus 3 i kringle.[29]

L’evolució molecular dona lloc a famílies de proteïnes relacionades amb seqüències i estructures semblants. Tanmateix, les semblances entre seqüències poden ser extremadament baixes entre proteïnes que comparteixen la mateixa estructura.[30] Les estructures proteiques poden ser similars perquè les proteïnes han divergit d’un ancestre comú, malgrat que les seqüències s’hagin anat diferenciant per adaptar-se a les noves funcions.

 Protein Data Bank[1]
 
Logo de Protein Data Bank

D’altra banda, alguns plegaments poden veure’s més afavorits que d’altres, ja que representen disposicions estables d’estructures secundàries i algunes proteïnes poden convergir cap a aquests plegaments al llarg de l’evolució. Actualment, es coneixen unes 110.000 estructures 3D, que s’han determinat experimentalment, i estan recollides i catalogades al Protein Data Bank (PDB).[31] Tanmateix, aquesta base de dades conté moltes estructures idèntiques o molt similars. Totes les proteïnes s’han de classificar en famílies estructurals per entendre les seves relacions evolutives, ja que les comparacions estructurals s’aconsegueixen millor en dominis proteics.

La importància dels dominis com a blocs estructurals de construcció i elements d'evolució ha provocat molts mètodes automatitzats per a la seva identificació i classificació en proteïnes d'estructura coneguda.[32] S’han desenvolupat molts algoritmes per assignar de forma automàtica dominis a estructures 3D ja conegudes i recollides en bases de dades, com la CATH domain database.[33] Els procediments automàtics per a l'assignació fiable de dominis són essencials per a la generació de les bases de dades de dominis, especialment a mesura que augmenta el nombre d'estructures de proteïnes conegudes.[34]

Encara que els límits d'un domini poden ser determinats per la inspecció visual, la construcció d'un mètode automatitzat no és senzilla. Els problemes es produeixen davant de dominis discontinus o altament associats.[35] El fet que no hi hagi una definició estàndard del que realment és un domini ha fet que les assignacions de dominis hagin anat variant enormement, ja que en moltes investigacions s’han utilitzat criteris diferents.

Un domini estructural és una subestructura compacta i globular que presenta un major nombre d’interaccions en el seu interior que amb la resta de proteïnes. Per tant, un domini estructural pot ser determinat per dues característiques visuals: la seva compactació i el seu grau d'aïllament. Les mesures de compactació local en proteïnes s'han utilitzat en molts dels primers mètodes d'assignació de dominis[36] i en diversos dels mètodes més recents.[37]

MètodesModifica

Un dels primers algorismes [38] va utilitzar un mapa de distàncies Cα-Cα juntament amb una agrupació jeràrquica que considerava les proteïnes com un conjunt de diversos segments petits, de 10 residus de longitud. Els segments inicials es van agrupar un darrere l'altre en funció de les distàncies entre segments; els segments amb les distàncies més curtes es van agrupar i es van considerar com a segments únics a partir d’aquell moment. L'agrupació per etapes finalment incloïa la proteïna completa. Totes les distàncies Cα-Cα possibles es representaven com a parcel·les diagonals en les quals hi havia patrons diferents per a hèlixs, cadenes esteses i combinacions d'estructures secundàries.[39]

El mètode de Sowdhamini i Blundell [35] agrupa estructures secundàries en una proteïna basada en les seves distàncies Cα-Cα i identifica els dominis del patró en els seus dendrogrames. Com que el procediment no considera la proteïna com una cadena contínua d'aminoàcids, no hi ha problemes en el tractament de dominis discontinus. Els nodes específics d'aquests dendrogrames s'identifiquen com a cúmuls estructurals terciaris de la proteïna. L'algorisme DOMAK s'utilitza per crear la base de dades de domini 3D.[40] Calcula un 'valor dividit' a partir del nombre de cada tipus de contacte quan la proteïna es divideix arbitràriament en dues parts. Aquest valor dividit és gran quan les dues parts de l'estructura són diferents.

El mètode de Wodak i Janin [41] es basa en les àrees d'interfície calculades entre dos segments de cadena escindits repetidament en diverses posicions de residus. Les àrees d'interfície es van calcular comparant les àrees superficials dels segments clivats amb la de l'estructura nativa. Els límits potencials del domini es poden identificar en un lloc on l'àrea de la interfície era mínima. Altres mètodes han utilitzat mesures d'accessibilitat al dissolvent per calcular la compactació.[42][43]

L'algorisme PUU [44] incorpora un model harmònic utilitzat per aproximar la dinàmica entre dominis. El concepte físic subjacent és que es produiran moltes interaccions rígides dins de cada domini i es produiran interaccions soltes (aïllades) entre dominis. Aquest algoritme s'utilitza per definir dominis a la base de dades de dominis FSSP.[45]

Swindells (1995) va desenvolupar el mètode DETECTIVE per a la identificació de dominis en estructures proteiques a partir de la idea que els dominis tenen un interior hidròfob. Es van trobar deficiències en el mètode quan els nuclis hidrofòbics de diferents dominis continuaven per la regió de la interfície.

RigidFinder [46] és un nou mètode per a la identificació de blocs rígids de proteïnes (dominis i bucles) a partir de dues conformacions diferents. Els blocs rígids es defineixen com a blocs on es conserven totes les distàncies entre residus a través de conformacions.

El mètode RIBFIND, desenvolupat per Pandurangan i Topf, identifica cossos rígids en estructures proteiques mitjançant la realització d'agrupacions espacials d'elements estructurals secundaris en proteïnes.[47] Els cossos rígids RIBFIND s'han utilitzat per ajustar de manera flexible estructures de proteïnes als mapes de densitat de criomicroscòpia electrònica.

En el seu estudi, Potestio et al.[48] han introduït un mètode general per identificar dominis dinàmics, és a dir, regions proteiques que es comporten aproximadament com a unitats rígides en el curs de les fluctuacions estructurals. Entre altres aplicacions, també s'ha utilitzat per comparar la consistència de les subdivisions dels dominis basades en dinàmiques en comparació amb les basades en l'estructura estàndard. El mètode, anomenat PiSQRD, està disponible públicament en forma de servidor web.[49] Aquest últim permet als usuaris subdividir de manera òptima proteïnes de cadena única o multimèriques en dominis quasi rígids basant-se en els modes col·lectius de fluctuació del sistema. Per defecte, aquests últims es calculen a través d'un model de xarxa elàstic; l’usuari pot carregar espais dinàmics essencials precalculats de forma alternativa.

Proteïnes amb multidominisModifica

 
Estructura d'una proteïna amb multidominis.

La majoria de proteïnes, dos terços en organismes unicel·lulars i més del 80% en metazous, són proteïnes multidominis.[50] No obstant això, altres estudis han conclòs que el 40% de les proteïnes procariotes consisteixen en múltiples dominis, mentre que els eucariotes tenen aproximadament un 65% de proteïnes multidomini.[51]

Molts dominis en proteïnes eucariotes multidominis es poden trobar com a proteïnes independents en procariotes,[52] suggerint que els dominis en proteïnes multidominis alguna vegada han existit com a proteïnes independents. Per exemple, els vertebrats tenen un polipèptid multi-enzimàtic que conté els dominis GAR sintetasa, AIR sintetasa i GAR transformilasa (GARs-AIRs-GARt; GAR: glicinamida ribonucleòtid sintetasa / transferasa; AIR: aminoimidazol ribonucleòtid sintetasa). En els insectes, el polipèptid apareix com a GARs- (AIRs) 2-GARt, en els llevats GARs-AIRs es codifica per separat de GARt i en els bacteris cada domini es codifica per separat.[53]

OrigenModifica

És probable que les proteïnes multidomini hagin sorgit de la pressió selectiva durant l’evolució amb la finalitat de crear noves funcions. Diverses proteïnes han divergit dels avantpassats comuns per diferents combinacions i associacions de dominis. Les unitats modulars es mouen sovint, per dins i entre sistemes biològics mitjançant mecanismes de barreja genètica:

  • Transposició d’elements mòbils incloent transferències horitzontals entre espècies.[54]
  • Reordenacions com inversions, translocacions, supressions i duplicacions.[55]
  • Recombinació homòloga.
  • Lliscament de la DNA polimerasa durant la replicació.

Els dominis no només es recombinen, sinó que hi ha molts exemples d’inserció d’un domini en un altre. La seqüència o similituds estructurals amb altres dominis demostren que els homòlegs de dominis inserits i dominis poden existir independentment. Atès que un domini es pot inserir en un altre, sempre hauria d’haver-hi, com a mínim, un domini continu en una proteïna multidomini. Aquesta és la principal diferència entre les definicions de dominis estructurals i dominis funcionals/evolutius. Un domini evolutiu es limitarà a una o dues connexions entre dominis, mentre que els dominis estructurals poden tenir connexions il·limitades, dins d’un determinat criteri de l’existència d’un nucli comú. Es podrien assignar diversos dominis estructurals a un domini evolutiu.[56]

Un superdomini consisteix en dos o més dominis conservats d’un origen suposadament independent, però posteriorment heretat com una unitat estructural/funcional única.[57] Un exemple de superdomini és el parell de dominis de proteïna tirosina fosfatasa-C2 en PTEN, tensina, auxilina i la proteïna de membrana TPTE2. Aquest superdomini es troba en proteïnes d’animals, plantes i fongs. Una característica clau del superdomini PTP-C2 és la conservació de residus d’aminoàcids a la interfície del domini.

Exemples de dominis proteicsModifica

  • Armadillo repeats: Aquest nom fa referència al nom de la proteïna Armadillo β-catenin-like de la mosca de la fruita, Drosophila.
  • Basic Leucine zipper domain (bZIP domain): Es troba en moltes proteïnes eucariotes d’unió a l’ADN. Una part del domini conté una regió que intervé entre les propietats específiques d'unió a l'ADN i la cremallera de Leucina que es requereix per a la dimerització de dues regions d'unió a l'ADN. La regió d'unió a l'ADN comprèn una sèrie d'aminoàcids, bàsics com l'arginina i la lisina.
  • Repeticions de Cadherina: Les cadherines funcionen com a proteïnes d'adhesió entre cèl·lules, i són dependents de Ca2+. Aquests dominis són regions extracel·lulars que medien la unió homòfila cel·lular entre cadherines a la superfície de les cèl·lules adjacents.
  • Death effector domain (DED): El domini efector de la mort permet la unió proteïna-proteïna mitjançant interaccions homotípiques (DED-DED). Les proteases caspasa desencadenen apoptosi a través de cascades proteolítiques. Pro-Caspase-8 i pro-caspase-9 s'uneixen a molècules adaptadores específiques a través de dominis DED i això condueix a l'autoactivació de les caspases.
  • EF hand: Es tracta d’un motiu estructural helix-turn-helix que es troba en cada domini estructural de la proteïna de senyalització calmodulina i en la proteïna muscular troponina-C.
  • Immunoglobulin-like domains: Els dominis similars a la immunoglobulina es troben en proteïnes de la superfamília d'immunoglobulina (IgSF).[58] Contenen uns 70-110 aminoàcids i es classifiquen en diferents categories (IgV, IgC1, IgC2 i IgI) segons la seva mida i funció. Contenen un plec característic en el qual dues làmines beta formen un "sandvitx" que s'estabilitza per les interaccions entre cisteïnes conservades i altres aminoàcids carregats. Són importants per a les interaccions proteïna-proteïna en processos d'adhesió cel·lular, activació cel·lular i reconeixement molecular. Aquests dominis es troben de manera comuna en molècules amb rols en el sistema immunitari.
  • Dominis d'unió a la fosfortirosina (PTB): Solen unir-se a residus de tirosina fosforilada. Sovint es troben en proteïnes de transducció de senyals. L'especificitat d'unió del domini PTB està determinada pels residus de l’extrem amino-terminal de la fosforetina. Exemples: Els dominis PTB tant del SHC com de l'IRS-1 s'uneixen a una seqüència NPXpY. Les proteïnes que contenen PTB com l'SHC i l'IRS-1 són importants per a les respostes a la insulina de les cèl·lules humanes.
  • Domini d'homologia a la pleckstrin (PH) s'uneixen als fosfoinositols amb una alta afinitat. S'ha observat especificitat per a PtdIns(3)P, PtdIns(4)P, PtdIns(3,4)P2, PtdIns(4,5)P2 i PtdIns(3,4,5)P3. Atès que les fosfoinositols són segrestats a diverses membranes cel·lulars (a causa de la seva llarga cua lipòfila) els dominis PH solen causar el reclutament de la proteïna en qüestió a una membrana on la proteïna pot exercir una certa funció en la senyalització cel·lular, la reorganització citoesquelètica o el tràfic de membranes.
  • Domini d’homologia a Src 2 (SH2): Els dominis SH2 es troben sovint en proteïnes de transducció de senyals. Els dominis SH2 confereixen vinculació amb la tirosina fosforilada (pTyr). El nom del domini d'unió de la fosfortirosina prové del domini src de l’oncogen viral, que és en si mateix una tirosina-cinasa. Vegeu també: Domini SH3.
  • Zinc finger DNA binding domain (ZnF_GATA): Les proteïnes que contenen el domini ZnF_GATA solen ser factors de transcripció que normalment s'uneixen a la seqüència d'ADN [AT]GATA[AG] dels promotors.

Dominis de funció desconegudaModifica

Una gran part dels dominis tenen una funció desconeguda. Un domini de funció desconeguda (DUF - Domain of Unknown Function) és un domini de proteïna que no té cap funció caracteritzada. Aquestes famílies s’han recopilat juntes a la base de dades Pfam mitjançant el prefix DUF, seguit d’un número, per exemple DUF2992 i DUF 1220. Ara hi ha més de 3000 famílies DUF dins d’aquesta base de dades, les quals representen més del 20% de les famílies conegudes.[59] Sorprenentment, el nombre de DUF a Pfam ha augmentat del 20%, en el 2010, al 22%, en el 2019, principalment, a causa del nombre creixent de noves seqüències de genomes. La versió 32.0 (2019) de Pfam contenia 3961 DUF.[60]

ReferènciesModifica

  1. 1. Wetlaufer D. Nucleation, Rapid Folding, and Globular Intrachain Regions in Proteins. Proceedings of the National Academy of Sciences. 1973;70(3):697-701.
  2. Richardson, Jane S. The Anatomy and Taxonomy of Protein Structure (en anglès). 34. Academic Press, 1981, p. 167–339. DOI 10.1016/s0065-3233(08)60520-3. 
  3. Bork, Peer «Shuffled domains in extracellular proteins» (en anglès). FEBS Letters, 286, 1-2, 1991, pàg. 47–54. DOI: 10.1016/0014-5793(91)80937-X. ISSN: 1873-3468.
  4. Wetlaufer, Donald B. «Nucleation, Rapid Folding, and Globular Intrachain Regions in Proteins» (en anglès). Proceedings of the National Academy of Sciences, 70, 3, 01-03-1973, pàg. 697–701. DOI: 10.1073/pnas.70.3.697. ISSN: 0027-8424. PMC: PMC433338. PMID: 4351801.
  5. Benson, Deanna L. «Of Molecules and Mechanisms». The Journal of Neuroscience: The Official Journal of the Society for Neuroscience, 40, 1, 01 02, 2020, pàg. 81–88. DOI: 10.1523/JNEUROSCI.0743-19.2019. ISSN: 1529-2401. PMC: 6939483. PMID: 31630114.
  6. Smith, F. Donelson; Esseltine, Jessica L.; Nygren, Patrick J.; Veesler, David; Byrne, Dominic P. «Local protein kinase A action proceeds through intact holoenzymes» (en anglès). Science, 356, 6344, 23-06-2017, pàg. 1288–1293. DOI: 10.1126/science.aaj1669. ISSN: 0036-8075. PMC: PMC5693252. PMID: 28642438.
  7. Byrne, Dominic P.; Vonderach, Matthias; Ferries, Samantha; Brownridge, Philip J.; Eyers, Claire E. «cAMP-dependent protein kinase (PKA) complexes probed by complementary differential scanning fluorimetry and ion mobility–mass spectrometry» (en anglès). Biochemical Journal, 473, 19, 01-10-2016, pàg. 3159–3175. DOI: 10.1042/BCJ20160648. ISSN: 0264-6021. PMC: PMC5095912. PMID: 27444646.
  8. Anfinsen, C. B.; Haber, E.; Sela, M.; White, F. H. «The Kinetics of Formation of Native Ribonuclease During Oxidation of the Reduced Polypeptide Chain» (en anglès). Proceedings of the National Academy of Sciences, 47, 9, 01-09-1961, pàg. 1309–1314. DOI: 10.1073/pnas.47.9.1309. ISSN: 0027-8424. PMC: PMC223141. PMID: 13683522.
  9. Zwanzig, R.; Szabo, A.; Bagchi, B. «Levinthal's paradox». Proceedings of the National Academy of Sciences of the United States of America, 89, 1, 01-01-1992, pàg. 20–22. DOI: 10.1073/pnas.89.1.20. ISSN: 0027-8424. PMID: 1729690.
  10. Ivankov, Dmitry N.; Finkelstein, Alexei V. «Solution of Levinthal's Paradox and a Physical Theory of Protein Folding Times». Biomolecules, 10, 2, 02 06, 2020. DOI: 10.3390/biom10020250. ISSN: 2218-273X. PMC: 7072185. PMID: 32041303.
  11. Dill, Ken A. «Polymer principles and protein folding» (en anglès). Protein Science, 8, 6, 1999, pàg. 1166–1180. DOI: 10.1110/ps.8.6.1166. ISSN: 1469-896X. PMC: PMC2144345. PMID: 10386867.
  12. Pinheiro, Glaucia M. S.; Amorim, Gisele C.; Iqbal, Anwar; Almeida, Fabio C. L.; Ramos, C. H. I. «Solution NMR investigation on the structure and function of the isolated J-domain from Sis1: Evidence of transient inter-domain interactions in the full-length protein». Archives of Biochemistry and Biophysics, 669, 07 15, 2019, pàg. 71–79. DOI: 10.1016/j.abb.2019.05.020. ISSN: 1096-0384. PMID: 31141701.
  13. Baron, Riccardo; Vellore, Nadeem A. «LSD1/CoREST is an allosteric nanoscale clamp regulated by H3-histone-tail molecular recognition» (en anglès). Proceedings of the National Academy of Sciences, 109, 31, 31-07-2012, pàg. 12509–12514. DOI: 10.1073/pnas.1207892109. ISSN: 0027-8424. PMC: PMC3411975. PMID: 22802671.
  14. Farago, Bela; Li, Jianquan; Cornilescu, Gabriel; Callaway, David J. E.; Bu, Zimei «Activation of Nanoscale Allosteric Protein Domain Motion Revealed by Neutron Spin Echo Spectroscopy» (en anglès). Biophysical Journal, 99, 10, 17-11-2010, pàg. 3473–3482. DOI: 10.1016/j.bpj.2010.09.058. ISSN: 0006-3495. PMC: PMC2980739. PMID: 21081097.
  15. Mishra, Soumya; Looger, Loren L.; Porter, Lauren L. «Inaccurate secondary structure predictions often indicate protein fold switching». Protein Science: A Publication of the Protein Society, 28, 8, 08 2019, pàg. 1487–1493. DOI: 10.1002/pro.3664. ISSN: 1469-896X. PMC: 6635839. PMID: 31148305.
  16. Koch, Ina; Schäfer, Tim «Protein super-secondary structure and quaternary structure topology: theoretical description and application». Current Opinion in Structural Biology, 50, 06 2018, pàg. 134–143. DOI: 10.1016/j.sbi.2018.02.005. ISSN: 1879-033X. PMID: 29558676.
  17. Zhou, Si-Duo; Lin, Yan-Fei; Xu, Xiao; Meng, Ling; Dong, Ming-Sheng «Effect of non-covalent and covalent complexation of (-)-epigallocatechin gallate with soybean protein isolate on protein structure and in vitro digestion characteristics». Food Chemistry, 309, 30-03-2020, pàg. 125718. DOI: 10.1016/j.foodchem.2019.125718. ISSN: 1873-7072. PMID: 31753688.
  18. Daly, Toni K.; Sutherland-Smith, Andrew J.; Penny, David «Beyond BLASTing: tertiary and quaternary structure analysis helps identify major vault proteins». Genome Biology and Evolution, 5, 1, 2013, pàg. 217–232. DOI: 10.1093/gbe/evs135. ISSN: 1759-6653. PMC: 3595041. PMID: 23275487.
  19. Gong, Haipeng; Rose, George D. «Does secondary structure determine tertiary structure in proteins?». Proteins, 61, 2, 01-11-2005, pàg. 338–343. DOI: 10.1002/prot.20622. ISSN: 1097-0134. PMID: 16104021.
  20. Shi, Shuoyong; Zhong, Yi; Majumdar, Indraneel; Sri Krishna, S.; Grishin, Nick V. «Searching for three-dimensional secondary structural patterns in proteins with ProSMoS». Bioinformatics (Oxford, England), 23, 11, 01-06-2007, pàg. 1331–1338. DOI: 10.1093/bioinformatics/btm121. ISSN: 1367-4811. PMID: 17384423.
  21. Khan, Taushif; Ghosh, Indira «Modularity in protein structures: study on all-alpha proteins». Journal of Biomolecular Structure & Dynamics, 33, 12, 2015, pàg. 2667–2681. DOI: 10.1080/07391102.2014.1003969. ISSN: 1538-0254. PMID: 25669306.
  22. Iglesias-Bexiga, Manuel; Szczepaniak, Malwina; Sánchez de Medina, Celia; Cobos, Eva S.; Godoy-Ruiz, Raquel «Protein Folding Cooperativity and Thermodynamic Barriers of the Simplest β-Sheet Fold: A Survey of WW Domains». The Journal of Physical Chemistry. B, 122, 49, 12 13, 2018, pàg. 11058–11071. DOI: 10.1021/acs.jpcb.8b05198. ISSN: 1520-5207. PMID: 29985628.
  23. Orengo, CA; Michie, AD; Jones, S; Jones, DT; Swindells, MB «CATH – a hierarchic classification of protein domain structures». Structure, 5, 8, 1997-08, pàg. 1093–1109. DOI: 10.1016/s0969-2126(97)00260-8. ISSN: 0969-2126.
  24. Bourne, Yves; Marchot, Pascale «Hot Spots for Protein Partnerships at the Surface of Cholinesterases and Related α/β Hydrolase Fold Proteins or Domains-A Structural Perspective». Molecules (Basel, Switzerland), 23, 1, 23-12-2017. DOI: 10.3390/molecules23010035. ISSN: 1420-3049. PMC: 5943944. PMID: 29295471.
  25. Wheelan, S. J.; Marchler-Bauer, A.; Bryant, S. H. «Domain size distributions can predict domain boundaries». Bioinformatics, 16, 7, 01-07-2000, pàg. 613–618. DOI: 10.1093/bioinformatics/16.7.613. ISSN: 1367-4803.
  26. Mascarenhas, Nahren Manuel; Gosavi, Shachi «Understanding protein domain-swapping using structure-based models of protein folding». Progress in Biophysics and Molecular Biology, 128, 09 2017, pàg. 113–120. DOI: 10.1016/j.pbiomolbio.2016.09.013. ISSN: 1873-1732. PMC: 7127520. PMID: 27867057.
  27. Husnik, Filip; McCutcheon, John P. «Functional horizontal gene transfer from bacteria to eukaryotes». Nature Reviews. Microbiology, 16, 2, 02 2018, pàg. 67–79. DOI: 10.1038/nrmicro.2017.137. ISSN: 1740-1534. PMID: 29176581.
  28. Campbell, I. D.; Downing, A. K. «Building protein structure and function from modular units». Trends in Biotechnology, 12, 5, 1994-05, pàg. 168–172. DOI: 10.1016/0167-7799(94)90078-7. ISSN: 0167-7799. PMID: 7764899.
  29. Alberts, Bruce,. Molecular biology of the cell. Sixth edition. ISBN 978-0-8153-4432-2. 
  30. Gilson, Amy I.; Marshall-Christensen, Ahmee; Choi, Jeong-Mo; Shakhnovich, Eugene I. «The Role of Evolutionary Selection in the Dynamics of Protein Structure Evolution». Biophysical Journal, 112, 7, 11-04-2017, pàg. 1350–1365. DOI: 10.1016/j.bpj.2017.02.029. ISSN: 1542-0086. PMC: 5390048. PMID: 28402878.
  31. «wwPDB.org. "wwPDB: Worldwide Protein Data Bank".». [Consulta: 20 desembre 2020].
  32. Lobb, Briallen; Doxey, Andrew C «Novel function discovery through sequence and structural data mining» (en anglès). Current Opinion in Structural Biology, 38, 01-06-2016, pàg. 53–61. DOI: 10.1016/j.sbi.2016.05.017. ISSN: 0959-440X.
  33. Sillitoe, Ian; Dawson, Natalie; Thornton, Janet; Orengo, Christine «The history of the CATH structural classification of protein domains». Biochimie, 119, 2015-12, pàg. 209–217. DOI: 10.1016/j.biochi.2015.08.004. ISSN: 1638-6183. PMC: 4678953. PMID: 26253692.
  34. Kaiser, Florian; Eisold, Alexander; Labudde, Dirk «A Novel Algorithm for Enhanced Structural Motif Matching in Proteins». Journal of Computational Biology: A Journal of Computational Molecular Cell Biology, 22, 7, 2015-07, pàg. 698–713. DOI: 10.1089/cmb.2014.0263. ISSN: 1557-8666. PMID: 25695840.
  35. 35,0 35,1 Sowdhamini, R.; Blundell, Tom L. «An automatic method involving cluster analysis of secondary structures for the identification of domains in proteins» (en anglès). Protein Science, 4, 3, 1995, pàg. 506–520. DOI: 10.1002/pro.5560040317. ISSN: 1469-896X. PMC: PMC2143076. PMID: 7795532.
  36. Rose, George D. «Hierarchic organization of domains in globular proteins» (en anglès). Journal of Molecular Biology, 134, 3, 05-11-1979, pàg. 447–470. DOI: 10.1016/0022-2836(79)90363-2. ISSN: 0022-2836.
  37. Taylor, William R. «Protein structural domain identification». Protein Engineering, Design and Selection, 12, 3, 1999-03, pàg. 203–216. DOI: 10.1093/protein/12.3.203. ISSN: 1741-0134.
  38. Crippen, Gordon M. «The tree structural organization of proteins» (en anglès). Journal of Molecular Biology, 126, 3, 15-12-1978, pàg. 315–332. DOI: 10.1016/0022-2836(78)90043-8. ISSN: 0022-2836.
  39. Go, N.; Taketomi, H. «Respective roles of short- and long-range interactions in protein folding» (en anglès). Proceedings of the National Academy of Sciences, 75, 2, 01-02-1978, pàg. 559–563. DOI: 10.1073/pnas.75.2.559. ISSN: 0027-8424. PMC: PMC411294. PMID: 273218.
  40. Sikder, Abdur R.; Zomaya, Albert Y. «Inferring boundary information of discontinuous-domain proteins». IEEE transactions on nanobioscience, 7, 3, 2008-09, pàg. 200–205. DOI: 10.1109/TNB.2008.2002283. ISSN: 1558-2639. PMID: 18779100.
  41. Wodak, Shoshana J.; Janin, Joel «Location of structural domains in proteins». Biochemistry, 20, 23, 01-11-1981, pàg. 6544–6552. DOI: 10.1021/bi00526a005. ISSN: 0006-2960.
  42. Zielezinski, Andrzej; Karlowski, Wojciech M. «Identification and Analysis of WG/GW ARGONAUTE-Binding Domains». Methods in Molecular Biology (Clifton, N.J.), 1640, 2017, pàg. 241–256. DOI: 10.1007/978-1-4939-7165-7_18. ISSN: 1940-6029. PMID: 28608348.
  43. Triant, Deborah A.; Pearson, William R. «Most partial domains in proteins are alignment and annotation artifacts». Genome Biology, 16, 15-05-2015, pàg. 99. DOI: 10.1186/s13059-015-0656-7. ISSN: 1474-760X. PMC: 4443539. PMID: 25976240.
  44. Holm, Liisa; Sander, Chris «Parser for protein folding units» (en anglès). Proteins: Structure, Function, and Bioinformatics, 19, 3, 1994, pàg. 256–268. DOI: 10.1002/prot.340190309. ISSN: 1097-0134.
  45. Daras, Petros; Zarpalas, Dimitrios; Axenopoulos, Apostolos; Tzovaras, Dimitrios; Strintzis, Michael Gerassimos «Three-dimensional shape-structure comparison method for protein classification». IEEE/ACM transactions on computational biology and bioinformatics, 3, 3, 2006-07, pàg. 193–207. DOI: 10.1109/TCBB.2006.43. ISSN: 1545-5963. PMID: 17048458.
  46. Abyzov, Alexej; Bjornson, Robert; Felipe, Mihali; Gerstein, Mark «RigidFinder: A fast and sensitive method to detect rigid blocks in large macromolecular complexes». Proteins: Structure, Function, and Bioinformatics, 78, 2, 01-02-2010, pàg. 309–324. DOI: 10.1002/prot.22544. ISSN: 0887-3585.
  47. Pandurangan, A. P.; Topf, M. «RIBFIND: a web server for identifying rigid bodies in protein structures and to aid flexible fitting into cryo EM maps». Bioinformatics, 28, 18, 12-07-2012, pàg. 2391–2393. DOI: 10.1093/bioinformatics/bts446. ISSN: 1367-4803.
  48. Potestio, R.; Pontiggia, F.; Micheletti, C. «Coarse-Grained Description of Protein Internal Dynamics: An Optimal Strategy for Decomposing Proteins in Rigid Subunits» (en anglès). Biophysical Journal, 96, 12, 17-06-2009, pàg. 4993–5002. DOI: 10.1016/j.bpj.2009.03.051. ISSN: 0006-3495. PMC: PMC2712024. PMID: 19527659.
  49. Aleksiev, T.; Potestio, R.; Pontiggia, F.; Cozzini, S.; Micheletti, C. «PiSQRD: a web server for decomposing proteins into quasi-rigid dynamical domains». Bioinformatics, 25, 20, 20-08-2009, pàg. 2743–2744. DOI: 10.1093/bioinformatics/btp512. ISSN: 1367-4803.
  50. Apic, Gordana; Gough, Julian; Teichmann, Sarah A «Domain combinations in archaeal, eubacterial and eukaryotic proteomes». Journal of Molecular Biology, 310, 2, 2001-07, pàg. 311–325. DOI: 10.1006/jmbi.2001.4776. ISSN: 0022-2836.
  51. Ekman, Diana; Björklund, Åsa K.; Frey-Skött, Johannes; Elofsson, Arne «Multi-domain Proteins in the Three Kingdoms of Life: Orphan Domains and Other Unassigned Regions» (en anglès). Journal of Molecular Biology, 348, 1, 01-04-2005, pàg. 231–243. DOI: 10.1016/j.jmb.2005.02.007. ISSN: 0022-2836.
  52. Davidson, Jeffrey N.; Chen, Kuey C.; Jamison, Robert S.; Musmanno, Lisa A.; Kern, Christine B. «The evolutionary history of the first three enzymes in pyrimidine biosynthesis» (en anglès). BioEssays, 15, 3, 1993, pàg. 157–164. DOI: 10.1002/bies.950150303. ISSN: 1521-1878.
  53. Henikoff, Steven; Greene, Elizabeth A.; Pietrokovski, Shmuel; Bork, Peer; Attwood, Teresa K. «Gene Families: The Taxonomy of Protein Paralogs and Chimeras» (en anglès). Science, 278, 5338, 24-10-1997, pàg. 609–614. DOI: 10.1126/science.278.5338.609. ISSN: 0036-8075. PMID: 9381171.
  54. Serrato-Capuchina, Antonio; Matute, Daniel «The Role of Transposable Elements in Speciation». Genes, 9, 5, 15-05-2018, pàg. 254. DOI: 10.3390/genes9050254. ISSN: 2073-4425.
  55. Liu, Haijun; Zhang, Hao; Orf, Gregory S.; Lu, Yue; Jiang, Jing «Dramatic Domain Rearrangements of the Cyanobacterial Orange Carotenoid Protein upon Photoactivation». Biochemistry, 55, 7, 23-02-2016, pàg. 1003–1009. DOI: 10.1021/acs.biochem.6b00013. ISSN: 1520-4995. PMC: 5201194. PMID: 26848988.
  56. Ribeiro, Lucas F.; Warren, Tiana D.; Ostermeier, Marc «Construction of Protein Switches by Domain Insertion and Directed Evolution». Methods in Molecular Biology (Clifton, N.J.), 1596, 2017, pàg. 43–55. DOI: 10.1007/978-1-4939-6940-1_3. ISSN: 1940-6029. PMID: 28293879.
  57. Haynie, Donald T.; Xue, Bin «Superdomains in the protein structure hierarchy: The case of PTP-C2» (en anglès). Protein Science, 24, 5, 2015, pàg. 874–882. DOI: 10.1002/pro.2664. ISSN: 1469-896X. PMC: PMC4420535. PMID: 25694109.
  58. Kato, K. «[Immunoglobulin superfamily]». Rinsho Byori. The Japanese Journal of Clinical Pathology, Suppl 102, 1996-09, pàg. 11–15. ISSN: 0047-1860. PMID: 9128068.
  59. Bateman, A.; Coggill, P.; Finn, R. D. «DUFs: families in search of function» (en anglès). Acta Crystallographica Section F: Structural Biology and Crystallization Communications, 66, 10, 01-10-2010, pàg. 1148–1152. DOI: 10.1107/S1744309110001685. ISSN: 1744-3091. PMC: PMC2954198. PMID: 20944204.
  60. El-Gebali, Sara; Mistry, Jaina; Bateman, Alex; Eddy, Sean R; Luciani, Aurélien «The Pfam protein families database in 2019». Nucleic Acids Research, 47, D1, 24-10-2018, pàg. D427–D432. DOI: 10.1093/nar/gky995. ISSN: 0305-1048. PMC: PMC6324024. PMID: 30357350.

Vegeu tambéModifica

A Wikimedia Commons hi ha contingut multimèdia relatiu a: Domini proteic