La RefSeq —en anglès Reference Sequence, seqüència de referència— és una base de dades[1] d'accés obert, anotada i curada manualment, que conté seqüències nucleotídiques (ADN, ARN) i els seus productes proteics. Està mantinguda pel National Center for Biotechnology Information (NCBI) i, a diferència del GenBank, proporciona només un únic registre per a cada molècula biològica natural (ADN, ARN o proteïna) per a diferents organismes, tant virus i bacteris com eucariotes.

Infotaula de lloc webRefSeq
URLhttps://www.ncbi.nlm.nih.gov/RefSeq Modifica el valor a Wikidata
Tipusbase de dades biològica Modifica el valor a Wikidata
MantenidorNational Center for Biotechnology Information Modifica el valor a Wikidata

Per a cada organisme model, la RefSeq té registres separats i enllaçats tant per a l'ADN genòmic com per als transcrits i proteïnes que se'n deriven. La RefSeq es limita a aquells organismes importants que tenen prou dades disponibles, mentre que el GenBank inclou totes les seqüències que s'hi han tramès sense cap mena de restricció pel que fa a l'organisme.

Categories de RefSeqModifica

Categoria Descripció
NC Molècules genòmiques completes (p. ex., cromosomes)
NG Regió genòmica incompleta
NM mRNA
NR ncRNA
NP Proteïna
XM mRNA model predit
XR ncRNA model predit
XP proteïna model predita

NotesModifica

  1. Pruitt KD, Tatusova T, Maglott DR (2005)

Vegeu tambéModifica

Enllaços externsModifica