Ensembl

Navegador genòmic
(S'ha redirigit des de: Ensembl genome database project)

Ensembl és un projecte científic conjunt entre l'Institut Bioinformàtic Europeu i el Wellcome Trust Sanger Institute (ambdós amb seu a Cambridge, Regne Unit), el qual va ser fundat el 1999 com a resposta a la finalització imminent del Projecte del Genoma Humà.[2] Després de 10 anys d'existència, l'objectiu d'Ensembl segueixent sent proporcionar un recurs centralitzat per genetistes, biòlegs moleculars i altres investigadors que estudien els genomes de l'espècie humana i d'altres vertebrats i organismes model.[3] Ensembl és un dels recursos digitals més emprats de la xarxa de navegadors de genomes quant a recerca d'informació genòmica.

Projecte Ensembl
Ensembl logo.png
Logotip del projecte
Descripció
NomEnsembl
EinaNavegador genòmic
Primera publicacióHubbard, et al. (2002)[1]
Desenvolupament
Institucions involucradesInstitut Bioinformàtic Europeu
Wellcome Trust Sanger Institute
SeuCambridge, Regne Unit
Fundació1999
Accés
http://www.ensembl.org

Aquesta base de dades i d'altres similars es troben acollides al cercador genèric NCBI i a la Universitat de Califòrnia, Santa Cruz (UCSC).

Rerefons del projecteModifica

Al projecte Ensembl, les dades de la seqüència s'introdueixen en un sistema d'anotació de gens (una col·lecció de programari amb arquitectura en pipeline i escrit en Perl) que crea un conjunt d'ubicacions de gens predits i els guarda en una base de dades MySQL per a la seva posterior anàlisi i visualització. Ensembl converteix les dades en unes lliure accés per a la comunitat investigadora mundial. Totes les dades i el codi produït pel projecte Ensembl està disponible per a descarregar, i també hi ha un servidor de bases de dades d'accés públic que permet l'accés remot. A més a més, ofereix visualitzacions digitals de les dades seleccionades.[4]

Tot i que els seus orígens estaven centrats en el genoma humà, al llarg del temps el projecte s'ha expandit per incloure espècies addicionals - incloent-hi organismes de model clau com el ratolí, la mosca del vinagre i el peix zebra - així com una gamma més àmplia de dades genòmiques, incloent variacions genètiques i característiques reguladores. D'ençà abril de 2009, es va escindir un nou projecte associat, Ensembl Genomes, que ha estès l'abast de Ensembl a metazous, plantes, fongs, bacteris, i protists, mentre que el projecte original continua enfocat en vertebrats.[5]

Divisions i camps de treballModifica

El projecte actualment es divideix en 8 seccions de treball, que ocupen uns 50 treballadors:[6]

  • Genebuild: Crea els conjunts de gens per a les diferents espècies.
  • Programari Core: Manté el nucli de la Interfície de programació d'aplicacions (API).
  • Compara: Produeix dades comparatives i les API relacionades.
  • Variation: Produieix dades de variació i API.
  • Regulation: Controla l'estructura regulatòria i l'API FuncGen.
  • Web Team: Manté i desenvolupa el lloc web Ensembl a nivell general.
  • Production: Gestiona els cicles d'alliberament de noves versions de programari Ensembl i l'Ensembl BioMart.
  • Outreach: Proporciona servei d'assistència i tallers.

Visualització de dades genòmiquesModifica

 
Situació al cromosoma del gen BRCA2 a través d'una visualització de l'Ensembl.

Un dels conceptes principals d'Ensembl és l'habilitació automàtica de generar visualitzacions gràfiques de l'alineament de gens i altres dades genòmiques vers un genoma de referència. Aquestes visualitzacions són mostrades com a pistes de dades, en què les pistes individuals poden ser adaptades permetent l'usuari fer modificacions en la interfície segons convingui als seus interessos de recerca: zooms en diferents regions, moviments al llarg del genoma en qualsevol direcció, etc.

Per altra banda, hi ha opcions de visualització de cariotips sencers basant-se en seqüències nucleotídiques i aminoacídiques, o representacions d'arbres filogenètics de gens homòlegs a través d'una varietat d'espècies. Els gràfics es complementen amb pantalles tabulars, i en molts casos, les dades es poden exportar directament des de la pàgina en una varietat de formats d'arxiu estàndard, com ara el format FASTA.[4]

Les dades produïdess externament també poden ésser afegides a la pantalla, ja sigui a través d'un servidor DAS (Distributed Annotation System), o bé carregant un arxiu adequat en un dels formats suportats, com ara BAM, LLIT o PSL.

Els gràfics es generen usant un conjunt de mòduls de Perl personalitzats i basats en GD, el mètode estàndard Perl per a la visualització de gràfics.

Vegeu tambéModifica

Enllaços externsModifica

A Wikimedia Commons hi ha contingut multimèdia relatiu a: Ensembl

ReferènciesModifica

  1. Hubbard T., et al. «The Ensembl genome database project» (en anglès). Nucleic Acid Res., 30, 1, gener 2002, pàg. 38-41. PMID: 11752248 [Consulta: 27 febrer 2015].
  2. Flicek P, Amode MR, Barrell D, et al. «Ensembl 2011» (Database issue) (en anglès). Nucleic Acids Res, 39, novembre 2010, pàg. D800–D806. DOI: 10.1093/nar/gkq1064. PMC: 3013672. PMID: 21045057 [Consulta: 27 febrer 2015].
  3. Flicek P, Aken BL, Ballester B, et al. «Ensembl's 10th year» (Database issue) (en anglès). Nucleic Acids Res., 38, gener 2010, pàg. D557–62. DOI: 10.1093/nar/gkp972. PMC: 2808936. PMID: 19906699 [Consulta: 27 febrer 2015].
  4. 4,0 4,1 Birney, Ewan; Andrews, T. Daniel; Bevan, Paul; Caccao, Mario «An Overview of Ensembl» (en anglès). Genome Research, 14, 5, maig 2004, pàg. 925-928. DOI: 10.1101/gr.1860604.
  5. Kersey, P. J.; Staines, D. M.; Lawson, D; Kulesha, E. «Ensembl Genomes: An integrative resource for genome-scale data from non-vertebrate species» (en anglès). Nucleic Acids Research, 40 (Database issue), pàg. D91–D97. DOI: 10.1093/nar/gkr895.
  6. «About us» (en anglès). Ensembl Blog. [Consulta: 27 febrer 2015].