Usuari:Albaa crespo/proves

Història

modifica

La Gene Ontology va ser creada al 1998 com una colaboració entre tres bases de dades d’organismes model: FlyBase (base de dades de Drosophila), la Saccharomyces Genome Database (base de dades de Saccharomyces cerevisiae) i la Mouse Genome Informatics (base de dades del ratolí de laboratori). Moltes altres bases de dades d’organismes model s'han anat unint al Consorci de la Gene Ontology per tal d'aportar no només dades d’anotacions, sinó també contribuint al desenvolupament de les ontologies i de les eines per visualitzar i aplicar les dades.

Va sorgir de la necessitat d’organitzar i anotar rigorosament les propietats biològiques dels productes gènics. La quantitat d'informació biològica no deixa de crèixer, motiu pel qual va esdevenir important descriure i classificar objectes biològics, per tal que els biòlegs puguessin utilitzar la informació emmagatzemada en diferents bases de dades. És per això que el consorci Gene Ontology (GO) es va formar per desenvolupar vocabularis compartits i estructurats per a l’anotació de característiques moleculars entre organismes.

Tot i això, també es va fer evident que el conjunt combinat d’anotacions dels grups d’organismes model podria proporcionar un recurs útil per a tota la comunitat científica. Per tant, a més de desenvolupar vocabularis estructurats, el projecte GO va desenvolupar un recurs de base de dades que proporciona accés no només als vocabularis, sinó també a aplicacions d’anotació i consulta i a conjunts de dades especialitzats resultants de l’ús dels vocabularis a l’anotació de gens i/o productes gènics.

Al Juliol de 2019, la GO contenia 44.945 termes i 6.408.283 anotacions de 4.467 diferents organismes vius. Avui dia, la GO és una eina estàndard reconeguda a l’àrea de la bioinformàtica.

Anotacions GO

modifica

Una anotació GO és una definició sobre la funció d'un gen concret. Les anotacions GO es creen associant un gen o producte gènic a un terme GO. Per tant, les anotacions GO defineixen com funciona un gen a nivell molecular, on funciona a la cèl·lula i en quins processos biològics (vies, programes) està involucrat.

Una anotació GO inclou, com a mínim:

  • Producte gènic (pot ser una proteïna, un ARN, etc.)
  • Terme GO
  • Referència
  • Evidència científica

Principis generals de les anotacions GO

modifica
  • Les anotacions representen les funcions normals dels productes genètics.
  • Un producte gènic es pot anotar a cap o a diversos termes de cada ontologia.
  • Cada anotació està recolzada per uns Codis d'Evidència i una referència.
  • Els productes genètics s'anoten en el terme de l'ontologia que està recolzat per l'evidència disponible.
  • Pel principi de transitivitat, una anotació a un terme GO implica una anotació a tots els seus pares.
  • Les anotacions GO estan destinades a reflectir la visió més actualitzada del paper d'un producte genètic en biologia.
  • A causa de que el coneixement biològic canvia, les anotacions per a un producte genètic donat poden canviar per reflectir canvis en el coneixement i / o canvis en l'ontologia.
  • En cas que la funció d'un producte gènic es desconeixi, no es trobarà anotat.

Qualificadors d’anotacions

modifica

Algunes de les anotacions són modificades i se'ls assigna qualificadors, que tenen un significat específic. Aquests qualificadors són:

Qualificador NOT

modifica

NOT s’utilitza per informar que s’ha demostrat experimentalment que o bé un producte genètic no pot dur a terme una activitat concreta o bé s’ha demostrat que presenta pèrdues de funció al llarg de l’evolució. Això és particularment important en els casos en què s'ha d'evitar l'associació d'un terme GO amb un producte gènic. Per tant, qualificar una anotació amb el qualificador NOT permet als anotadors afirmar que un determinat producte genètic no està associat amb un terme GO concret. S'utilitza quan es podria esperar que un terme GO s'apliqui a un producte gènic, però un experiment, anàlisi de seqüències, etc. demostra el contrari. Per exemple, si una proteïna té similitud de seqüència amb un enzim (l’activitat de la qual és GO: nnnnnnn), però s’ha demostrat experimentalment que no té l’activitat enzimàtica, s’anota com NOT GO: nnnnnnn.

Qualificador contributes_to

modifica

Contributes_to apareix en una anotació GO quan s'ha anotat una funció a un complex proteic, però alguna de les subunitats del complex no realitza directament aquesta funció. Aquest qualificador pot ser útil per a anotar funcions moleculars en els casos en què un complex té una activitat, però no totes les subunitats que el conformen la fan. Per exemple, en un complex pot haver-hi una subunitat catalítica coneguda i una o més subunitats addicionals. Quan s'anota la funció molecular de les subunitats individuals que treballen com a complexos en els quals cap de les subunitat individuals té l'activitat s'ha d'incloure aquest qualificador a l'anotació.

Qualificador colocalizes_with

modifica

Colocalizes_with apareix en una anotació quan es vol indicar una associació transitòria de la proteïna amb un orgànul o complex. També es pot utilitzar en aquells casos en què no està suficientment clar si el producte gènic és un component de l'òrganul o complex. Per exemple, la despolimerasa de microtúbuls KIF2A es localitza dinàmicament als pols del fus mitòtic, regulant la degradació dels microtúbuls durant la progressió mitòtica. Per tant, KIF2A està anotat a GO: 0000922: spindle pole usant el qualificador colocalizes_with.

Evidència científica

modifica

Totes les anotacions GO es recolzen en la literatura científica, ja sigui directament o indirectament. A GO, l’evidència de suport es presenta en forma de Codis d’Evidència de GO i una referència publicada o una descripció de la metodologia utilitzada per crear l’anotació. Els Codis d’Evidència de GO descriuen el tipus d’evidència i indiquen fins a quin punt coincideix l’afirmació anotada amb l’evidència experimental directa, i si aquesta evidència va ser revisada per un expert.

Els Codis d'Evidència es divideixen en 6 punts categories:

  • Proves experimentals: indica que hi ha proves d’un experiment que recolza directament l’anotació del gen.
  • Evidència filogenètica: cal tenir en compte que els principis filogenètics proporcionen una manera poderosa d’obtenir informació sobre la funció dels gens, ja que reconstrueixen esdeveniments evolutius que permeten inferir relacions entre gens. Les anotacions basades en la filogenètica es deriven d’un model explícit de guany i pèrdua de la funció gènica en branques específiques d’un arbre filogenètic. Per cada anotació inferida es pot rastrejar les anotacions experimentals directes que es s'han utilitzat com a base per a aquesta afirmació.
  • Proves computacionals: indica que l’anotació es basa en una anàlisi in silico de la seqüència gènica i / o altres dades.
  • Afirmacions d'autor: indica que l’anotació s’ha fet a partir d’una declaració feta per l’autor o autors de la referència que es cita.
  • Declaracions curatorials: indica una anotació feta sobre la base d’un judici curatorial que no s’adapta a cap de les altres classificacions del codi de proves.
  • Anotacions generades automàticament: aquelles que no són revisades manualment. Es basen en última instància en l'homologia i / o en una altra informació experimental o de seqüència, però generalment no es poden rastrejar a una font experimental.