Usuari:TronaBot/Python/user-fixes.py: diferència entre les revisions

Contingut suprimit Contingut afegit
-family:wikipedia_o per a operar amb OrtoBot
+ ortobot.py
Línia 1:
<source lang=Python>
# -*- coding: utf-8 -*-
#30.04.13
#excepcions emprades en la majoria de 'fixes'
#replace.py -fix:elagem -recursive -always -query:125 -sleep:1 -family:wikipedia_o -start:AO
exceptions = {
'inside-tags': [
'comment',
#'link',
'interwiki',
'math',
'pre', # because of code examples
'source', # because of code examples
'startspace', # because of code examples
'hyperlink', # e.g. commas in URLs
'gallery', # because of filenames
'timeline',
'cite',
'nowiki',
#'noinclude',
#'includeonly',
#'math',
'ref',
#'table',
'template',
],
'inside': [
#omitim modificació imatges
ur'\[\[(?:[Ii]mat?ge|[Ff]i(?:txer|le)):.*?[\|\]]',
#omitim modificació interwikis
ur'\[\[[a-z\-]{2,12}:[^\]]+?\]\]',
#omitim modificació categories
ur'\[\[ *[Cc]ategor(?:ia|y) *:[^\]]+?\]\]',
#omitim modificació plantilles
ur'\{\{[^}]*?\}\}',
#omitim modificació enllaços
ur'\[\[[^|]*?\|',
#omitim paràmetres de plantilles amb fitxers imbricats
ur'(?i)\|[\w\d\s()\-_=]*?\.(?:gif|png|jpg|svg)\b',
#omitim paràmetres de plantilles
ur'\|[\w\d\t\s]*=.+',
#omitim paràmetres de plantilles
ur'[\w\s_]+=[\w\d\s_,\'\.\[\](){}<>\-/]*\|$',
],
}
 
#replace.py -fix:elagem -family:wikipedia_o -recursive -always -query:125 -sleep:1 -start:"Amando Vilaplana Gironés"
fixes['elagem']={
'regex': True,
'msg': {
'ca':u'[[Usuari:TronaBot/Python/user-fixes.py|Bot]]: corregint ela geminada i apòstrof.',
},
'replacements': [
(ur'(l[•.]l)', ur'l·l'),
(ur"(\b[sltmd])[´`](\w)", ur"\1'\2"),
](ur"(«) ", ur"\1")
#(ur"(\b[sltmd])[’´`]([\w[])", ur"\1'\2"),
'exceptions': {
#(ur"(\w)[´’`]((?:[sltm]|ns)\b)", ur"\1'\2")
'inside-tags': [
],
'nowiki',
'exceptions': exceptions
'comment',
}
'interwiki',
 
'math',
#COMPTE! necessita ortobot.py!!! [[Usuari:TronaBot/Python/Ortobot.py]]
'pre', # because of code examples
#ortobot.py -fix:auto -recursive -always -query:125 -sleep:1 -start:"Antoni Téllez i Solà"
'source', # because of code examples
fixes['auto']={
'startspace', # because of code examples
'regex': True,
'hyperlink', # e.g. commas in URLs
'msg': {
'gallery', # because of filenames
'ca':u'[[Usuari:TronaBot/Python/user-fixes.py|Bot]]: corregint',
'timeline',
]},
'insidecategories': [{
"acc": "l'accentuació",
#omitim modificació imatges
"apo": "els apòstrofs",
ur'\[\[(?:[Ii]mat?ge|[Ff]i(?:txer|le)):.*?[\|\]]',
"cst": "els castellanismes",
#omitim modificació categories i interwikis
"gem": "ela ur'\[\[[^IF]\w*:.*?\]'geminada",
"grm": "gramàtica",
#omitim modificació plantilles
"dsc": ur'\{\{.*?\}\}'"descuït",
"pnt": "puntuació",
#omitim modificació enllaços
"prn": ur'\[\[.+?\]\]'"pronoms",
},
ur'<cite>[^<]*</cite>',
'replacements': [
#omitim paràmetres de plantilles amb fitxers imbricats
(ur"(«) ", ur'(?i)"\|[\w\d\s(1", "pnt")\-_=]*?\.(?:gif|png|jpg|svg)\b',
(ur" (»)", ur"\1", "pnt"),
#omitim paràmetres de plantilles
#(ur"([a-zçàèíòúóé]) \.", ur'"\|[\w\d\t\s]+=1.*'", "pnt"),
#(ur"([.,])([A-ZÇÀÈÒÉÍÓÚ])", ur"\1 \2", "pnt"),
#omitim paràmetres de plantilles
#(ur"(:) *([A-ZÇÀÈÒÉÍÓÚ])", ur"\1 \2", "pnt"),
ur'[\w\s_]+=[\w\d\s_,\'\.\[\](){}<>\-/]+\|$',
(ur'(l[•.]l)', ur'l·l', ]"gem"),
(ur"(?i)(\b[sltmd])[’´`]([\w[])", ur"\1'\2", "apo"),
(ur"(?i)(\b[sltmd])[’´`](('''?)[\w]+\3)", ur"\1{{'}}\2", "apo"),
(ur"(\w)[’´`]((?:[sltm]|ns)\b)", ur"\1'\2", "apo"),
#(ur"('''?) (\w+(?: \w+)?) (\1)", ur"\1\2\3", "pnt"), dóna falsos positius ex.: ''[[a]]'' o el ''[[b]]''
(ur"([Hh]an? \w+)a't", ur"\1at", "grm"),
(ur"(\b)es ([cs][ei])", ur"\1se \2", "prn"),
(ur"Es ([cs][ei])", ur"Se \1", "prn"),
(
ur"\bEs (una|el|la|m[ée]s|molt|damunt|sobre|encara|de|per|a|que)\b",
ur"És \1", "acc"
),
(ur"\b([Ll]'|[Uu]n )us\b", ur"\1ús", "acc"),
(ur"\b(A|a)dem[eé]s\b", ur"\1 més", "cst"),
(ur"\b(A|a)ixo\b", ur"\1ixó", "acc"),
(ur"\b(A|a)lem[aà]\b", "\1lemany", "cst"),
(ur"\b(A|a)lem[àa]ni?a\b", ur"\1lemanya", "cst"),
(ur"\b(A|a)ll[oó]\b", ur"\1llò", "acc"),
(ur"(A|a)mbd[oò]s", ur"\1mbdós", "acc"),
(ur"\b(A|a)ntifàs\b", ur"\1ntifàç", "ort"),
(ur"\b(A|a)ss?[ae]ss?(i|í)(?!nato)", ur"\1ssass\2", "acc"),
(ur"\b(B|b)allen(a|es)", ur"\1alen\2", "cst"),
(ur"\b(B|b)ull(a|es)\b", ur"\1utll\2", "cst"),
],
'exceptions': exceptions
}
 
#COMPTE! necessita ortobot.py!!! [[Usuari:TronaBot/Python/Ortobot.py]]
}
#ortobot.py -fix:manual -family:wikipedia_o -recursive -query:125 -sleep:1 -start:"Amilopectina"
}
fixes['manual']={
'regex': True,
'msg': {
'ca':u'[[Usuari:TronaBot/Python/user-fixes.py|Bot]]: corregint',
},
'categories': {
"acc": "l'accentuació",
"apo": "els apòstrofs",
"cst": "els castellanismes",
"gem": "ela geminada",
"dsc": "descuït"
},
'replacements': [
(ur"\b(A|a)[cq][uü][aà]ti" , ur"\1quàti", "acc"),
(ur"([^[]\b[Aa])m\b", ur"\1mb", "dsc"),
(ur"\b[AÁ]udio\b" , ur"Àudio", "acc"),
(ur"\b[aá]udio\b" , ur"àudio", "acc"),
(ur"\b[AÁ]rab(s?)\b" , ur"Àrab\1", "acc"),
(ur"\b[aá]rab(s?)\b" , ur"àrab\1", "acc"),
(ur"\b[AÁ]rea\b" , ur"Àrea", "acc"),
(ur"\b[aá]rea\b" , ur"àrea", "acc"),
],
'exceptions': exceptions
}
</source>