Ensembl

Navegador genòmic

Ensembl és un projecte científic conjunt entre l'Institut Bioinformàtic Europeu i el Wellcome Trust Sanger Institute (ambdós amb seu a Cambridge, Regne Unit), el qual va ser fundat el 1999 com a resposta a la finalització imminent del Projecte del Genoma Humà.[1] Després de 10 anys d'existència, l'objectiu d'Ensembl segueixent sent proporcionar un recurs centralitzat per genetistes, biòlegs moleculars i altres investigadors que estudien els genomes de l'espècie humana i d'altres vertebrats i organismes model.[2] Ensembl és un dels recursos digitals més emprats de la xarxa de navegadors de genomes quant a recerca d'informació genòmica.

Infotaula d'organitzacióEnsembl
lang=ca
Modifica el valor a Wikidata
Dades
Tipusbase de dades en línia
base de dades biològica Modifica el valor a Wikidata
Governança corporativa
Part deGENCODE (en) Tradueix
ELIXIR EMBL-EBI Node (en) Tradueix Modifica el valor a Wikidata

Lloc webensembl.org Modifica el valor a Wikidata
Twitter (X): ensembl Modifica el valor a Wikidata

Aquesta base de dades i d'altres similars es troben acollides al cercador genèric NCBI i a la Universitat de Califòrnia a Santa Cruz (UCSC).

Rerefons del projecte modifica

Al projecte Ensembl, les dades de la seqüència s'introdueixen en un sistema d'anotació de gens (una col·lecció de programari amb arquitectura en pipeline i escrit en Perl) que crea un conjunt d'ubicacions de gens predits i els guarda en una base de dades MySQL per a la seva posterior anàlisi i visualització. Ensembl converteix les dades en unes lliure accés per a la comunitat investigadora mundial. Totes les dades i el codi produït pel projecte Ensembl està disponible per a descarregar, i també hi ha un servidor de bases de dades d'accés públic que permet l'accés remot. A més a més, ofereix visualitzacions digitals de les dades seleccionades.[3]

Tot i que els seus orígens estaven centrats en el genoma humà, al llarg del temps el projecte s'ha expandit per incloure espècies addicionals - incloent-hi organismes de model clau com el ratolí, la mosca del vinagre i el peix zebra - així com una gamma més àmplia de dades genòmiques, incloent variacions genètiques i característiques reguladores. D'ençà abril de 2009, es va escindir un nou projecte associat, Ensembl Genomes, que ha estès l'abast de Ensembl a metazous, plantes, fongs, bacteris, i protists, mentre que el projecte original continua enfocat en vertebrats.[4]

Divisions i camps de treball modifica

El projecte actualment es divideix en 8 seccions de treball, que ocupen uns 50 treballadors:[5]

  • Genebuild: Crea els conjunts de gens per a les diferents espècies.
  • Programari Core: Manté el nucli de la Interfície de programació d'aplicacions (API).
  • Compara: Produeix dades comparatives i les API relacionades.
  • Variation: Produieix dades de variació i API.
  • Regulation: Controla l'estructura regulatòria i l'API FuncGen.
  • Web Team: Manté i desenvolupa el lloc web Ensembl a nivell general.
  • Production: Gestiona els cicles d'alliberament de noves versions de programari Ensembl i l'Ensembl BioMart.
  • Outreach: Proporciona servei d'assistència i tallers.

Visualització de dades genòmiques modifica

Un dels conceptes principals d'Ensembl és l'habilitació automàtica de generar visualitzacions gràfiques de l'alineament de gens i altres dades genòmiques vers un genoma de referència. Aquestes visualitzacions són mostrades com a pistes de dades, en què les pistes individuals poden ser adaptades permetent l'usuari fer modificacions en la interfície segons convingui als seus interessos de recerca: zooms en diferents regions, moviments al llarg del genoma en qualsevol direcció, etc.

Per altra banda, hi ha opcions de visualització de cariotips sencers basant-se en seqüències nucleotídiques i aminoacídiques, o representacions d'arbres filogenètics de gens homòlegs a través d'una varietat d'espècies. Els gràfics es complementen amb pantalles tabulars, i en molts casos, les dades es poden exportar directament des de la pàgina en una varietat de formats d'arxiu estàndard, com ara el format FASTA.[3]

Les dades produïdes externament també poden ésser afegides a la pantalla, ja sigui a través d'un servidor DAS (Distributed Annotation System), o bé carregant un arxiu adequat en un dels formats suportats, com ara BAM, BED o PSL.

Els gràfics es generen usant un conjunt de mòduls de Perl personalitzats i basats en GD, el mètode estàndard Perl per a la visualització de gràfics.

Notes modifica

  1. Flicek P, Amode MR, Barrell D, et al. «Ensembl 2011» (Database issue) (en anglès). Nucleic Acids Res, 39, novembre 2010, pàg. D800–D806. DOI: 10.1093/nar/gkq1064. PMC: 3013672. PMID: 21045057 [Consulta: 27 febrer 2015].
  2. Flicek P, Aken BL, Ballester B, et al. «Ensembl's 10th year» (Database issue) (en anglès). Nucleic Acids Res., 38, gener 2010, pàg. D557–62. DOI: 10.1093/nar/gkp972. PMC: 2808936. PMID: 19906699 [Consulta: 27 febrer 2015].
  3. 3,0 3,1 Birney, Ewan; Andrews, T. Daniel; Bevan, Paul; Caccao, Mario «An Overview of Ensembl» (en anglès). Genome Research, 14, 5, maig 2004, pàg. 925-928. DOI: 10.1101/gr.1860604.
  4. Kersey, P. J.; Staines, D. M.; Lawson, D; Kulesha, E. «Ensembl Genomes: An integrative resource for genome-scale data from non-vertebrate species» (en anglès). Nucleic Acids Research, 40 (Database issue), pàg. D91–D97. DOI: 10.1093/nar/gkr895.
  5. «About us» (en anglès). Ensembl Blog. [Consulta: 27 febrer 2015].

Vegeu també modifica

Enllaços externs modifica

A Wikimedia Commons hi ha contingut multimèdia relatiu a: Ensembl