Viquipèdia Discussió:AutoWikiBrowser/Typos/Arxiu 1

Darrer comentari: fa 11 anys per NicoV sobre el tema WPCleaner

s'ha de tenir en compte que alguna frase pot estar en una altra llengua que empre diferents tipus d'accentuació, també passaria en els cognoms de personatges. –Pasqual · bústia 16:42, 3 set 2006 (UTC)

Has d'incloure un que corregeixi els ll·ll a ll-ll, això és per evitar que intenti posar com a ela geminada paraules del tipus "Bell-lloc" o similars.--SMP (missatges) 17:24, 3 set 2006 (UTC)

El de la ll-ll ja l'he tinguda en compte. Per les paraules en altres llengues, ja he afegit (o estic afegint) el comentari que quan es vulguin arreglar articles on apareixen paraules estrangeres, s'han d'evitar certes entrades. Per exemple, d'aquí un moment introduiré que totes les y passin a i perquè en català, llevat del dígraf ny, la y no apareix (quasi) mai. Però si repassem els articles de la categoria d'Anglaterra, això pot ser desastrós. En tot cas, com que sempre s'han de revisar les correccions que es fan, no hauria d'haver problema.
Voleu col·laborar en la causa tipus a la wiki anglesa on tothom va afegint typos? I podem fer un fòrum d'usuaris d'AWB per resoldre problemes...--Xtv (que dius que què?) 17:38, 3 set 2006 (UTC)

Domineu les regular expressions?

És que hi ha algunes entrades que estic posant que veig que es podrien simplificar i si algú té més coneixement que jo... Per cert, jo estic fent correccions que jo crec que són incorrectes, però és possible que algunes hagin estat acceptades fa poc per l'AVL. Digue-m'ho si en veieu cap! (des que xinés és correcte... :S hahaha).--Xtv (que dius que què?) 17:41, 3 set 2006 (UTC)

Vivenda no és cap barbarisme, està admesa i jo l'he sentida a TV3. --Pepetps   (Podem discutir-ho) 18:30, 3 set 2006 (UTC)
Et recomane que et baixes el salt3. Hi ha un diccionari amb paraules d'ús valencianes. També hi ha col·loquialismes que no són normatius (hi posarà "col·loc"). --Pepetps   (Podem discutir-ho) 18:34, 3 set 2006 (UTC)
regexes... no gaire però a mi em semblen prou bé (mentre funcionin... :). Jo també he provat de trobar errades ortogràfiques aquest matí http://ca.wikipedia.org/wiki/Viquipèdia:Ortografia/ortobot el problema (crec jo) si les corregeixes una a una és que probablement a l'article on hi eren també hi haurà d'altres que no seran detectades per les regexes. O sigui que fora preferible que si en trobes una llegeixis l'article o al menys passesis un corrector automàtic. --62.57.93.166 18:41, 3 set 2006 (UTC)
Osti, ara veig que vivenda i tamany, que fins ara no eren normatives perquè no estan incloses al DIEC, ara el diccionari de l'AVL sí que les accepta... :-S Bé..., mal que em pesi les hauré de de donar per bones, doncs... (el fet que les diguin a TV3 no és cap justificació, ans al contrari...).
Sobre els altres errors que també hi haurà a un article passi aquesta llista, en certa manrera "em són igual" (amb moltes cometes, eh?). M'explico: l'ATB és un programa per fer feines mecanitzades, com un bot, però semi-automàticament. L'altre dia, per exemple, vaig canviar a tots els pobles de Catalunya que tenien la plantilla {{esborrany}} per {{esborrany de Catalunya}}. Fer-ho manualment hauria costat dies i amb aquest programa vaig estar-hi poques hores. Si aprofitant que estic fent aquest feina puc, de passada, corregir algunes faltes que són fàcilment detectables, millor. Ara bé, no em posaré a llegir els 2.000 articles i fer-ne revisió perquè no acabaré mai la meva feina principal que era canviar les plantilles i no pas corregir l'ortografia. Salut.--Xtv (que dius que què?) 18:51, 3 set 2006 (UTC)

Estic tenint dubtes metafísics per moments. Ara es veu que nóvio, l'AVL també l'accepta. I jo em pregunto, pot tenir un article paraules que l'IEC accepti i l'AVL no i viceversa alhora? és a dir, jo entenc que tamany o vivenda s'accepti a un article escrit en valencià, però si en un article s'està usant l'adverbi aquí (per exemple, no admès per l'AVL ja que a València dirien ací), pot contenir alhora tamany? És a dir: és correcte la frase tinc un nóvio aquí i un allà? Quin aiguabarreig, senyor!--Xtv (que dius que què?) 19:05, 3 set 2006 (UTC)

Doncs no, no devem mesclar variants diatòpiques, és deu conservar la varietat dialectal en tot l'article. Jo havia tingut un projecte en ment que mai he ficat a la pràctica, on volia aclarir des del principi en quina variant està redactat l'article per poder mantenir-la en tot l'article. Aixó forma part de les recomanacions dee Viquipèdia:Com escriure un bon article: Redacció, gramàtica i ortografia i no he pogut trobar on es diu exactamant que al principi de l'article hauria de constar en quina variant s'ha redactat el text -que d'alguna manera és el que pretenia ficar en marxa-. –Pasqual · bústia 22:40, 3 set 2006 (UTC)
Doncs justament jo he tingut avui a la mà aquest article on he vist allò de recomanar posar en quin dialecte està escrit l'article i clar, he al·lucinat perquè no ho havia vist enlloc fins ara. Tanmateix, si no teniu res en contra els valencianoparlants, canviaré vivenda per habitatge i tamany per mida, ja que he vist que ni tamany ni vivenda apareixen al DIEC i en canvi tant habitatge com mida apareixen tant al DIEC com al DAVL i així ens apropem a un nombre més gran de parlants. Aixímateix, si veieu algun canvi en l'altre sentit (alguna paraula que al DAVL no aparegui i en canvi trobeu alguna alternativa que sí que apareix a tots dos diccionaris, també ho canviaré (si us sembla bé, eh?)).
Respecte el què és l'AWB i en com em pots ajudar, ara t'estic escrivint una resposta a la teva discussió. Fins ara...--Xtv (que dius que què?) 23:48, 3 set 2006 (UTC)

Rodejar

Com modifiquem la cadena 'rodej*' o 'rodeg*' per 'envolt*', encara no m'he llegit els enllaços... –Pasqual · bústia 02:58, 4 set 2006 (UTC)

A barbarismes poses "\b[Rr]ode[gj]" i la substitució "envolt" --Xtv (que dius que què?) 03:01, 4 set 2006 (UTC)
No! $1nvolt !   –Pasqual · bústia 03:04, 4 set 2006 (UTC)
D'acord, aixó vol dir que no pot convertir la E en majúscula segons si la R ho està o no, llavors caldrien dues línies, una per a si la paraula comença amb majúscula i una altra per si és en minúscula, de no ser així ens trobarem que la substitució de "Rodejant la ciutat" ens donarà "envoltant la ciutat", sense respectar la majúscula de principi de frase, he vist uns quants així. –Pasqual · bústia 16:06, 4 set 2006 (UTC)
Jo no he sabut veure com fer-ho. Segurament deu existir la manera. Sí, si volem estalviar-nos haver de corregir les majúscules i minúscules, hauríem de fer les dues entrades. Ara bé: això voldria dir multiplicar per 2 un fotral d'entrades. Jo diria que a la wiki anglesa ho tenen com nosaltres (encara que no ho recordo exactament). De fet, les vegades que jo he usat l'AWB i que hagi hagut de corregir una minúscula que havia sigut majúscula són comptades (recordem que això no és un bot automàtic sinó que s'ha d'anar revisant els canvis que l'AWB proposa).--Xtv (que dius que què?) 16:37, 4 set 2006 (UTC)

Funció com a bot

Suposo que aquest arxiu no és compatible amb la funció de bot de l'AWB, no? Hi ha força correccions que necessiten ser comprovades.--SMP (missatges) 08:34, 4 set 2006 (UTC)

Què vols dir per la funció de bot? jo tinc un bot registrat per tal de fer les correccions de l'AWB, perquè en faig moltes molt ràpidament, però les repasso una a una igualment, tal com diu a la pàgina de l'AWB. En principi he fet aquesta llista preferint que trobi falsos positius però que alhora corregeixi molt, que no pas que no s'hagi de mirar la correcció (la qual cosa no s'ha de fer) i dexar passar moltes faltes. En tot cas podriem tenir dues llistes, una a TyposHard i l'altra a TyposSoft, i com que la majoria de vegades no usarem el programa alhora, quan un vulgui usar un tipus de plantilla, el copia a Typos i llestos. Després el que ve a darrera, agafa la que més li interessa i punt... no sé, dic jo...--Xtv (que dius que què?) 14:58, 4 set 2006 (UTC)
D'acord, ja m'has respost, la funció de bot és aquella per la qual no fa falta mirar-te els canvis sinó que ell sol va apretant el botó de "acceptar-los" cada 10 segons. És molt útil per a categoritzacions o canvis mecànics per l'estil.--SMP (d·+) 12:50, 26 set 2006 (UTC)

Perfilar la llista

Hola, alguns falsos positius a millorar;

  • estendre-la als nous territoris -> estendre-l'als nous territoris
  • Ohio -> Ohió
  • Interwikis:
    • [[am:...]] -> [[amb:...]]
    • [[be:...]] -> [[bé:...]]
    • ...

--Joanjoc (discussió) 02:50, 8 des 2006 (CET)

El cert és que aquesta llista que vaig fer, si només fes referència a textos en català, seria molt útil, però com que a la majoria de textos, si no apareix una paraula en llatí, n'apareix una en anglès, fa que aquesta llista sigui més aviat poc útil. Potser hauria (hauríem) de treure algunes línies posades amb molt bona intenció però gens eficaces. Quan veieu que una no funciona, traieu-la tranquil·lament!--Xtv (que dius que què?) 03:30, 8 des 2006 (CET)
Ei, sembla que el tema dels interwikis ja està solucionat des de la versió del 15/12/2006, tot i així crec que a la llista hauríem de seguir el model anglès de deixar els casos que no requereixin intervenció humana, així que tots els que diguin "ATENCIÓ", els aniré passant a la discussió, i si es pot millorar perquè no doni falsos positius ja l'hi tornarem a posar --Joanjoc (discussió) 15:41, 16 des 2006 (CET)
Em sembla molt bé. Si després podem millorar-los per tornar-los a incorporar, perfecte. Em sap una mica de greu pels es/és, son/són i els que apostrofen, ja que en molts articles donen un 99% de correccions correctes, però bé, s'ha de reconèixer que en molts casos no és pràctic...--Xtv (que dius que què?) 18:09, 16 des 2006 (CET)

Linies eliminades i motius

<Typo word="...iï. ATENCIÓ: Novii" find="ii\b" replace="iï" />

<Typo word="...ió. ATENCIÓ: No sempre" find="io\b" replace="ió" />

  • Convertia Ohio en Ohió

<Typo word="més ATENCIÓ: mes. Falla massa? eliminar?" find="\b(M|m)es\b" replace="$1és" />

<Typo word="són: ATENCIÓ: son " find="\b(S|s)on\b" replace="$1ón" />

<Typo word="nb!!!" find="nb" replace="mb" />

  • &nbsp; -> &mbsp;

Els he restaurat tots, son i mes, sense canvis i als altres he afegit un control de falsos positius... A veure com rutlla... --Joanjoc (discussió) 21:47, 17 des 2006 (CET)

Falsos positius

Hi ha alguna pàgina per als falsos positius? En el meu cas "ràdio" se'm transforma a "ràdió" per la transformació "-io" --> "-ió" que no és gaire fiable, la veritat.--SMP 16:53, 7 febr 2007 (CET)

  • També m'ha canviat "conexió" per "connexó", és a dir, arregla una cosa per a espatllar-ne una altra  . El pitjor és que no sé per quina comanda ha tret la "i".   Fet!
  • "Número" és incorrecte? (Ja se senyala que pot ser correcte)
  • "desprestigi" --> "despréstigi"   Fet!
  • "àudio" -->"àudió" (Ja se senyala que no sempre serà efectiu*)
  • "aconseguim" --> "aconseguïm"   Fet!

*Es podria fer una llista de mots acabats en -io que siguen plans o esdrúixols, per fer-ne l'excepció. Crec que en una ocasió vaig trobar un diccionar invers en línia, ara estudio el tema... –Pasqual · bústia 19:34, 7 febr 2007 (CET)

Llista de mots plans o esdrúixols en -io

Esta és una llista que he el·laborada jo consultant el DILC.

  • iaio
  • paio
  • io-io (però ió)
  • ràdio
  • àgio
  • adagio (però religió)
  • àudio (però ludió)
  • infòlio (però milió)
  • dàimio (però camió)
  • brio (però sarrió)
  • trio
  • dúrio (però turió)


Com que es tracta de terminacions que no vans seguides de "c","s" ni "x" es podria canviar a find="(c|s|x)io" replace="$1ió". –Pasqual · bústia 21:09, 7 febr 2007 (CET)

Una segona ullada m'ha fet entendre que hi ha casos de -pió, -nió, -mió, etc. que anul·len la meua proposta, hauré de pensar-ho una mica més... –Pasqual · bústia 21:24, 7 febr 2007 (CET)

Aquesta norma del ió efectivament és molt laxa. Podem deixar-la i considerar la llista aquesta de casos patològics a part (seria afegir-los i punt) i treure-la de la llista sense més.
Pel que fa als interwikis, les noves versions de l'AWB si ho demanes ja no els modifica, o sigui que no hi ha problema.
Aprofito per recordar que en principi aquesta llista la vaig fer jo per corregir un tipus d'articles molt concrets (de matemàtiques, per això canviava sempre número per nombre, tot i que en certs casos en altres àmbits número també és correcte) i contribucions d'alguns col·laboradors que feien sempre un tipus de faltes molt determinades. En el seu moment em van anar bé però per tal d'usar-lo generalment en els altres articles, potser cal una poda. Clar que és molt més interessant encara considerar els casos per separat, però és més difícil.--Xtv (que dius que què?) 00:40, 8 febr 2007 (CET)

Tema enllaços

Estem corregint External links com a enllaços externs i links com a enllaços, crec que esta darrera realment correspon a la de vegeu també on es mostren els enllaços interns. Crec que si és correcte hauríem d'unificar eixes seccions. A més a més opine que Enllaços externs sempre hauria d'anar en plural per ser part d'una secció fixa. I recordar que quan no hi ha bastants enllaços no és necessari crear eixa secció, per tant no és necessari una secció en singular.

Hi ha una altra possibilitat, la de crear una secció Vegeu també i a continuació dues subseccions (o apartats) anomenats enllaços interns i enllaços externs com fan en altres viquipèdies. Però, i permeteu-me dir-ho així, ací no és tradició. En tot cas aixó seria més un tema a tractar en el llibre d'estil. –Pasqual · bústia 11:45, 8 febr 2007 (CET)

Article la i les seues excepcions

Haurem de cabilar com poder fer per a les excepcions de l'article femení singular la

  • davant el prefix de negació a-
  • davant (h)i-, (h)u- àtones

Però de moment, prudència...

–Pasqual · bústia 16:33, 8 febr 2007 (CET)

De fet jo crec que hauríem de treure immediatament els casos de la+(h)i-, la+(h)u-.--SMP​·d​·+ 17:10, 8 febr 2007 (CET)
Sí és el més prudent! –Pasqual · bústia 23:59, 8 febr 2007 (CET)

detecció d'enllaços

Denomine erròniament detecció d'enllaços quan es preveu que l'element (article, pronom o preposició) ha d'elidir-se davant d'un enllaç. No sé si seria més correcte anomenar-los enllaços intercalats o alguna cosa més concreta.

He estat una bona estona pensant en com hauria de ser l'expressió que puguera d'una manera eficaç elidir l'article en tots els casos, és la següent: \b(D|d)e (\[\[[Hh]?[AEIOUaeiuoÀÈÉÍÒÓÚàèéíòóú]\w*[^|]\]\]|\[\[\w* ?\| ?[Hh]?[AEIOUaeiuoÀÈÉÍÒÓÚàèéíòóú]\w*|\[h.* [Hh]?[AEIOUaeiuoÀÈÉÍÒÓÚàèéíòóú]|[Hh]?[AEIOUaeiuoÀÈÉÍÒÓÚàèéíòóú])

Permet elidir:

  • de [[Escandinàvia]]
  • de [[Escandinàvia|escandinau]]
  • de Escandinàvia
  • de [http://ca.wikipedia.org exemple]

Impedix:

  • de la [[Escandinàvia|península]]

De moment no l'afegisc als Typos.

–Pasqual · bústia 23:59, 8 febr 2007 (CET)

A mi em sembla una bona idea. L'afegim doncs? (per cert, l'apartat "noves entrades" és més o menys per això, per propostes que encara no han estat del tot revisades).--Xtv (que dius que què?) 15:49, 27 març 2007 (CEST)
Em fa una mica de mandra mirar la sintaxi. Suposo que també corregeix
Buf! Ja he fet tard! La resposta era . –Pasqual · discussió · xat 23:58, 14 març 2009 (CET)

audió

Quin typo hi ha que canvia audio per audió en comptes de per àudio. No l'he sabut trobar. Un fet curiós és que àudio també me'l canviava per àudió.--Iradigalesc (discussions · +) 22:06, 24 març 2007 (CET)

Ja ho he arreglat, faltaven els caràcters /> d'acabar una comanda.--Xtv (que dius que què?) 15:49, 27 març 2007 (CEST)

Correcció o no?

A "paraules acabades en..." hi ha un cas que canvia io per ió a final de paraula, i aleshores s'ha afegit una línia que soluciona els falsos positius. Així, adagio passa a adagió i després torna a adagio. Tanmateix, si hi ha la paraula adàgio (incorrecta), la canvia a adàgió i després a adàgio un altre cop. No seria millor que la deixés com a adàgió i així es veuria que hi ha alguna cosa que no quadra? (bé, també podem afegir abans un que corregeixi adàgio per adagio, però no em refereixo només a aquest cas concret, sinó al concepte en general).--Xtv (que dius que què?) 15:49, 27 març 2007 (CEST)

Avanç / avenç

Ho havia posat a VP:O, però no havia vist que aquí també sortia. Aquí es demana substituïr avans per avanç en alguns casos, però avanç no és correcte en el sentit d' avenç, progrés, que és com s'utilitza en la majoria de casos. El problema és que avanç també és correcte en català, però només en aquestes situacions: Avanç al Grec. --Meldor 10:21, 12 oct 2007 (CEST)

Hittita

S'hi hauria d'afegir el canvi d'hitita per hittita («hittita». Diccionari de la llengua catalana de l'IEC. Institut d'Estudis Catalans.) i les seves variants. En tenim un fotimer.--Pere prlpz (discussió) 01:28, 15 març 2009 (CET)

Si us plau, no comenceu a implementar aquest canvi fins que s'hagi resolt la discussió al respecte. – Leptictidium (discussió) 09:24, 15 març 2009 (CET)

WPCleaner

Hi,

If you're interested, WPCleaner can now be configured to use the same list as AWB to detect spelling and typography mistakes and provide suggestions. --NicoV (disc.) 11:32, 23 set 2012 (CEST)

Torna a la pàgina de projecte "AutoWikiBrowser/Typos/Arxiu 1".