Viquiprojecte:Viquitrobada tècnica tardor 2012/apunts
Replace modifica
import sys sys.path.append('C:\pywikipedia') import wikipedia site=wikipedia.getSite('ca') page=wikipedia.Page(site, u"Barcelona") text=page.get() text=text.replace("Barcelona",u"Can Fanga") print text
Llistes modifica
import sys sys.path.append('C:\pywikipedia') import wikipedia site=wikipedia.getSite('ca') page=wikipedia.Page(site, u"Barcelona") text=page.get() text=text.replace("Barcelona",u"Can Fanga") llista = [['de','de de de'],["a","aaaaaaa"]] for el in llista: text=text.replace(el[0],el[1]) print text
Expressions regulars modifica
La línia coding cal perquè més avall hi ha text unicode (amb accents).
# -*- coding: utf-8 -*- import sys sys.path.append('C:\pywikipedia') import wikipedia import re site=wikipedia.getSite('ca') page=wikipedia.Page(site, u"Barcelona") text=page.get() text=re.sub(u"\[\[(.*?)\]\]", ur"AIXÒ ERA UN ENLLAÇ QUE M'HE CARREGAT: \1", text) print text
Replace és més eficient que les expressions regulars, quan sigui possible fer-lo servir.
Put modifica
# -*- coding: utf-8 -*- import sys sys.path.append('C:\pywikipedia') import wikipedia import re site=wikipedia.getSite('ca') page=wikipedia.Page(site, u"Barcelona") text=page.get() text=re.sub(u"\[\[(.*?)\]\]", ur"AIXÒ ERA UN ENLLAÇ QUE M'HE CARREGAT: \1", text) page=wikipedia.Page(site, u"usuari:Pere prlpz/taller") page.put(text,u"Comentari de prova")
Categories modifica
# -*- coding: utf-8 -*- import sys sys.path.append('C:\pywikipedia') import wikipedia,catlib import re site=wikipedia.getSite('ca') l=catlib.Category(site,u"Guerra freda").articlesList(recurse=0) print l