Obre el menú principal

Complexitat lingüística de seqüència

La complexitat lingüística de seqüència és una mesura de la 'riquesa del vocabulari' d'un “text genètic” dins seqüències gèniques.[1] Quan una seqüència de nucleòtids és escrita en format text utilitzant un alfabet de quatre lletres, la repetitivitat del text, és a dir, la repetició del seus N-caràcters (paraules), pot ser calculat i serveix com a mesura de la complexitat de seqüència. Per això, com més complexa siga una seqüència d'ADN, més ric serà el seu vocabulari de nucleòtids, mentre que seqüències repetitives solen tenir complexitats més baixes. Posteriorment, s'ha millorat l'algoritme original descrit en Trifonov (1990), sense canviar l'essència de l'aproximació de complexitat lingüística.[1][2][3][4]

ReferènciesModifica

  1. 1,0 1,1 Edward N. Trifonov. «Making sense of the human genome». A: Structure and Methods, Vol. 1. Albany, New York: Adenine Press, 1990, p. 69–77 (Human Genome Initiative and DNA Recombination; Proceedings of the Sixth Conversation in the Discipline Biomolecular Stereodynamics). 
  2. Gabrielian, A. «Sequence complexity and DNA curvature». Computers & Chemistry, vol. 23, 3–4, 1999, pàg. 263–201. DOI: 10.1016/S0097-8485(99)00007-8.
  3. Orlov, Y. L.; Potapov, V. N. «Complexity: An internet resource for analysis of DNA sequence complexity». Nucleic Acids Research, vol. 32, Web Server issue, 2004, pàg. W628–W633. DOI: 10.1093/nar/gkh466. PMC: 441604. PMID: 15215465.
  4. Janson, S.; Lonardi, S.; Szpankowski, W. «On average sequence complexity». Theoretical Computer Science, vol. 326, 2004, pàg. 213. DOI: 10.1016/j.tcs.2004.06.023.