Usuari:PereBot/robot indexa categories

# -*- coding: utf-8 -*-
# Robot indexa categories.

import sys
sys.path.append('C:\pywikipedia')
import wikipedia,catlib,re,pagegenerators,urllib2

def main():
    tcat=u"Edicions de la París-Niça" #Poseu aquí la categoria a indexar
    tcats=u"París-Niça" #Poseu aquí la part del títol que no forma part de l'índex (no hi inclogueu "de", "del" i variants, que ja ho fa el programa tot sol).
    inicial=tcat[0]
    retcat=u"["+inicial.upper()+inicial.lower()+"]"+tcat[1:]
    cat=catlib.Category(site,tcat)
    for pag in pagegenerators.CategorizedPageGenerator(cat):
        textvell=pag.get()
        tit=pag.title()
        index=tit
        index=re.sub(u"^("+tcat+"|"+tcats+u") (del |de la |de l'|dels |de les )",u"",index)
        index=re.sub(u"^("+tcat+"|"+tcats+u") (de |d')",u"",index)
        index=re.sub(u"^("+tcat+"|"+tcats+u") ",u"",index)
        print index
        if index<>tit and len(index)>0:
            index=index[0].upper()+index[1:]
            print index
            noutext=re.sub(u"\[\[ ?[Cc]ategoria: ?"+retcat+u" ?\]\]",u"[[Categoria:"+tcat+u"|"+index+u"]]",textvell)
            print u"\[\[ ?[Cc]ategoria: ?"+retcat+u" ?\]\]"
            print u"[[Categoria:"+tcat+u"|"+index+u"]]"
            if noutext<>textvell:
                pag.put(noutext,u"Robot indexant l'article a la [[Categoria:"+tcat+u"]] amb l'índex '"+index+u"'")
    return

#El programa comença aquí
try:
    site=wikipedia.getSite('ca')
    main()
finally:
    wikipedia.stopme()