Peak calling modifica

El Peak calling (en català: pic de senyal) és un mètode computacional que permet identificar els llocs d'unió de proteïnes putatives[1]. En concret, aquest mètode permet identificar àrees del genoma enriquides amb lectures alineades per haver fet una seqüenciació ChIP (ChIP-seq) o MeDIP-seq. Això permet analitzar, a travès d'una immunoprecipitació de cromatina (ChIP, de l'anglès Chromatin ImmunoPrecipitation), la interacció entre una proteïna i el DNAError de citació: L’etiqueta d’obertura <ref> s’ha formatat incorrectament o té un nom no permès, les quals es basen en reticulacions mediades per formaldehid[2]. Quan aquesta proteïna és un factor de transcripció, l'àrea enriquida és un lloc d'unió del factor de transcripció (o TFBS, de l'anglès Transcription Factor Binding Site).

El programari més popular inclou el MACS, que és un algoritme que identifica totes les ubicacions dels llocs d'unió de factors de transcripció o de cromatina, o modificacions d'histones que s'extreuen d'una seqüenciació ChIP[3]. En l'actualitat s'han recollit [... es toquen dos temes que potser els amplio més després].

Història modifica

A partir del 2000 es van començar a desenvolupar els mètodes de seqüenciació de nova o de segona generació (NGS, de l'anglès Next Generation Sequencing). Aquest nou mètode, junt amb la ChIP, han revolucionat l'habilitat d'analitzar les interaccions dins del genoma de proteïnes i DNA.[2]

La identificació dels llocs d'unió de les proteïnes genòmiques a través de la ChIP ha necessitat de noves eines computacionals, diferents a les emprades anteriorment per als experiments ChIP-Chip, la qual combinava la ChIP i els xips de DNA (en anglès, Chip). Actualment hi ha més d'una quarantena de programes analítics[2], molts dels quals es basen en algoritmes per a trobar pics.

Tècnica modifica

Una de les tasques principals dels cercadors de pics basats en ChIP-seq és discriminar entre els pics reals, que representen els llocs d'unió reals, dels llocs d'unió que són artefactes de la tècnica (falsos positius) i el soroll de fons.[2] Per això calen controlar la fracció de falsos positius (FPR, de l'anglès False Positive Rate) amb controls negatius, que normalment són mostres de DNA sense immunoprecipitar (controls de DNA total) o immunoprecipitades amb anticossos no-específics (controls d'IgG).

Com que fer experiments amb controls negatius augmenta el cost de la ChIP-seq, s'han desenvolupat algoritmes de pics de senyal que no necessiten control. Tot i això, els resultats són de menor qualitat per la falta de caracterització del senyal i el soroll de la ChIP-seq.[2]

Limitacions modifica

Els programes de pics de senyal utilitzen una gran varietat d'algoritmes. Tot i això, encara no està clar en quina mesura les diferents metodologies i sofisticacions matemàtiques es tradueixen en variacions substancials en la pràctica. El problema principal que impedeix corregir això és que no existeix una llista de tots els llocs d'unió com a dianes sota condicions experimentals.[4]


Enllaç generic peak calling program:

http://www.ebi.ac.

uk/˜swilder/SWEMBL/

  1. Wilbanks, Elizabeth G.; Facciotti, Marc T. «Evaluation of Algorithm Performance in ChIP-Seq Peak Detection» (en anglès). PLOS ONE, 5, 7, 07-08-2010, pàg. e11471. DOI: 10.1371/journal.pone.0011471. ISSN: 1932-6203. PMC: PMC2900203. PMID: 20628599.
  2. 2,0 2,1 2,2 2,3 2,4 Stanton, Kelly P.; Jin, Jiaqi; Lederman, Roy R.; Weissman, Sherman M.; Kluger, Yuval «Ritornello: high fidelity control-free chromatin immunoprecipitation peak calling». Nucleic Acids Research, 45, 21, 01-12-2017, pàg. e173. DOI: 10.1093/nar/gkx799. ISSN: 1362-4962. PMC: 5716106. PMID: 28981893.
  3. Wilbanks, Elizabeth G.; Facciotti, Marc T. «Evaluation of Algorithm Performance in ChIP-Seq Peak Detection» (en anglès). PLOS ONE, 5, 7, 07-08-2010, pàg. e11471. DOI: 10.1371/journal.pone.0011471. ISSN: 1932-6203. PMC: PMC2900203. PMID: 20628599.
  4. Nix, David A.; Courdy, Samir J.; Boucher, Kenneth M. «Empirical methods for controlling false positives and estimating confidence in ChIP-Seq peaks». BMC bioinformatics, 9, 05-12-2008, pàg. 523. DOI: 10.1186/1471-2105-9-523. ISSN: 1471-2105. PMC: 2628906. PMID: 19061503.