Tema de Viquipèdia:La taverna/Propostes

Tenim un problema en les traduccions

74
Resum per Paucabot
Paucabot (discussiócontribucions)

Realment tenim un problema. He trobat aquesta cerca que vaig posar aquí fa devers un any i torna a tenir 14 hits.

I això segur que només és la punta de l'iceberg...

Jmrebes (discussiócontribucions)

Al·lucino amb la traducció de la paraula anglesa Time a Estafi, un substantiu que no existeix en català. El problema apareix amb "Apertium" com a eina traductora, no pas amb els altres traductors. Aquí teniu la millor prova: quan Apertium ha de traduir la paraula anglesa "time" la tradueix per "estafi", com si fos una forma verbal del verb estafar. Està clar que cal corregir el corrector...

Cataleirxs (discussiócontribucions)

Suposo que l'error ve quan es tradueix un article des del castellà, que llavors entén aquest time com si fos una paraula d'aquest idioma enlloc del mot anglès.

Paucabot (discussiócontribucions)

Sí, sembla que hi ha un error en el traductor, però el que em preocupa és la manca de revisió (pròpia o d'altri) dels articles que traduïm. Per mostra, un botó: Categoria:Pàgines amb traduccions sense revisar no ha aturat d'augmentar des de que la vàrem crear i ara ja va pels 3000 articles.

Xavier Dengra (discussiócontribucions)
Leptictidium (discussiócontribucions)

El 2021, servidor va proposar restringir l'ús del ContentTranslation. Si us hi fixeu, la grandíssima majoria de les traduccions deficients es fan amb aquesta «eina».

Cal una mica de pastanaga i una mica de pal.

Pere prlpz (discussiócontribucions)

Pot ser que la grandíssima majoria de les traduccions deficients es facin amb aquesta eina, però per decidir prohibir-la caldria saber si la grandíssima majoria de les traduccions que es fan amb aquesta eina són deficients, que no és el mateix. Podria ser que la majoria de les traduccions correctes també es fessin amb aquesta eina i fossin moltes més.

I consti que jo prohibiria les traduccions, incloses les traduccions ben fetes, especialment si són des de llengües que els nostres lectors ja entenen.

Leptictidium (discussiócontribucions)

Les poques excepcions honroses que he vist són d'usuaris autoconfirmats (cosa que no vol dir, ni de bon tros, que tots els usuaris autoconfirmats en facin un bon ús). Restringint l'eina als autoconfirmats ens estalviaria, com a mínim, els usuaris que venen, ens encolomen una pila de traduccions mal revisades i se'n van.

I després, ja podríem centrar esforços i atenció en els autoconfirmats que continuessin donant problemes amb l'eina.

Cataleirxs (discussiócontribucions)

No em sembla pas malament.

Cataleirxs (discussiócontribucions)

Fent examen de consciència, part del meu aprenentatge va ser gràcies al Content Translate. No seria just si votés a favor de capar aquesta eina als novells, quan a mi em va anar bé.

Paucabot (discussiócontribucions)

Segurament, si restringíssim l'eina als autoconfirmats tendríem articles igual de mal traduïts i amb un desastre de format, amb múltiples problemes als enllaços interns, enllaços externs i les referències (que és el que el ContentTranslation fa molt bé).

En realitat, això ja ho podem comprovar ara mateix: tenim un editor que produeix quatre o cinc articles cada dia traduïts a mà. En aquests articles, als problemes de traducció, s'hi afegeixen els problemes de format que he esmentat més amunt.

Cataleirxs (discussiócontribucions)

(Si hi ha un usuari que constantment malmet la qualitat del projecte i fa cas omís de les advertències, consells i mediació, se l'hauria de blocar com a qualsevol altre vàndal; vulgues que si, vulgues ca no.)

Leptictidium (discussiócontribucions)

Aleshores el problema és que aquest usuari potser no hauria de ser autopatrullat...

Paucabot (discussiócontribucions)

No ho és. Les traduccions a pèl les pot fer qualsevol ara i reservant l'eina per als autopatrullats, qualsevol les podria seguir fent.

Leptictidium (discussiócontribucions)

Diria que el ContentTranslation té un efecte crida: gent a qui li faria peresa traduir un article a mà, s'hi llança perquè pensa que amb el ContentTranslation ho pot fer ràpid i sense preocupar-se'n gaire.

Pere prlpz (discussiócontribucions)

Aquest efecte crida el deu tenir tant sobre els que no se'n volen preocupar com sobre els que sí.

Leptictidium (discussiócontribucions)

Quants usuaris em pots trobar que 1) tradueixin habitualment amb ContentTranslate; i 2) ho facin bé?

Perquè del contrari n'hi ha a cabassos.

Cataleirxs (discussiócontribucions)

Jo el faig servir tot sovint :(

Leptictidium (discussiócontribucions)

Ets una de les «excepcions honroses» que servidor esmentava més amunt. Ara bé, per cada usuari exemplar que tenim com tu, en tenim una pila que fan servir el ContentTranslate sense cap mena de control de qualitat.

Pere prlpz (discussiócontribucions)
Leptictidium (discussiócontribucions)

Em dona bastant la raó. Entre les traduccions fetes per usuaris no autoconfirmats en els últims 30 dies n'hi ha:

  • una que parla de «Julio César» i «Domiciano» i té errors de puntuació grollers
  • una que, en les referències, «tradueix» el den alemany per un «donin» i un the complete works anglès per un «the completi works»
  • una que parla repetidament d'una persona difunta en present (senyal que no hi ha hagut ni la més mínima feina de revisió)
  • una en la qual la major part dels enllaços interns estan en forma d'interviquis a ES
  • un grapat de traduccions que han estat marcades per usuarificar i que em fa l'efecte que l'usuari en qüestió ni tan sols no entén el català
Pere prlpz (discussiócontribucions)

L'enllaç amb només els novells: https://ca.wikipedia.org/wiki/Especial:Canvis_recents?userExpLevel=unregistered%3Bnewcomer&hidebots=1&hidecategorization=1&hideWikibase=1&tagfilter=contenttranslation-v2&limit=500&days=30&urlversion=2

Jo no he arribat a mirar tots els 30 primers, però mirant els primers que surten els veig força aprofitables (i els que encara no, són d'un projecte docent i estan en construcció). Hi ha errors tipogràfics i de format (que em sorprèn que siguin del Content Translate) però això ja ho fan els novells encara que escriguin a mà.

Cataleirxs (discussiócontribucions)

No sé si vosaltres teniu la mateixa percepció que jo:

  • Les traduccions desastroses amb el ContentTr d'usuaris no autopatrullats acostumen a ser fetes per gent que no té ni fava de català. Va fent clics al programet i publica, sense mirar res. En fan uns quants durant uns dies i pleguen. Possible spam cross-wiki.
  • Les traduccions desastroses manuals ("a pèl", com diu en Pau) de no-autopatrullats (tret dels de sempre), són catalanoparlants que venen a vendre el seu peix i toquen el dos.
Jmrebes (discussiócontribucions)

De vegades em pregunto com és que gent amb nom d'usuari o amb IP poden crear desenes de pàgines en un dia. Bé, jo no tinc temps per fer-ho, i si tradueixo amb l'eina ContentTranste miro també les referències, tret els enllaços externs que no funcionen o que excedeixen un nombre lògic d'enllaços, etc. Per respecte a la Viquipèdia, no sé fer-ho d'una altra manera.

Cataleirxs (discussiócontribucions)

Correcte. Són normes de convivència bàsiques i hi ha qui no té cap interès en complir-les.

Paucabot (discussiócontribucions)
Jmrebes (discussiócontribucions)

Corregides les 14 pàgines

Paucabot (discussiócontribucions)
Cataleirxs (discussiócontribucions)

He caigut de la cadira XD

Jmrebes (discussiócontribucions)

Millora caure de la cadira que no pas caure de la figuera ;-)

"Entenimentades" corregides.

Cataleirxs (discussiócontribucions)

I jo que em preocupava pels Riu de Gener i els Són Paulo...

Paucabot (discussiócontribucions)
Leptictidium (discussiócontribucions)
Flamenc (discussiócontribucions)

M'adono que sovent articles de baixa qualitat en castellà, no s'amilloren en maltraduir-les en català. Sobretot amb els gerundis i altres formes verbals és una catàstrofe. Això per la gramàtica. Hi ha molta feina.

Quant al contingut, el que em sorprèn són les traduccions que no tenen sentit. Com si els autors no llegeixen els que escriuen. De vegades és humor involuntari, però no és seriós. Sovint, cal molta recerca per trobar qui és l'autor de l'error i enviar-lo un missatge pedagògic. És mala traducció o mala comprensió? Què podem fer? Exemples:

  • «Va estudiar estudis primaris…»
  • «els guerrers valorosos que donaven la seva vida per la mort»
  • «És … una artista multidisciplinari ja que treballa en diferents àmbits»
  • «L'aquari inclou dues aules temàtiques, les quals tenen la capacitat per a 40.000 estudiants»
  • sharktrust esdevé «confiem en el tauró»
  • i al primer gratacel de deu pisos van afegir «dues històries», stories, en aquest cas pisos.

Fora de correcions manuals, què podem automatitzar? No sé.

Leptictidium (discussiócontribucions)

«Com si els autors no llegeixen els que escriuen» << Quantes vegades deu passar exactament això...

Paucabot (discussiócontribucions)

Ara he vist que estafi té plural: estafis - 13

Si no podem fer cap altra cosa, almanco hauríem de revisar aquests casos regularment.

Jmrebes (discussiócontribucions)

Aquesta tarda ho miro

Paucabot (discussiócontribucions)
Pere prlpz (discussiócontribucions)

Alguns d'aquests sis potser tenen motiu d'esborrat o d'usuarificació.

Leptictidium (discussiócontribucions)

O de bloqueig, si és un problema reiterat, fent cas omís dels avisos...

Jmrebes (discussiócontribucions)

Ja no

Jmrebes (discussiócontribucions)
Pere prlpz (discussiócontribucions)

Els altres cinc no sé, però Armada de Mèxic segueix necessitant una bona llegida per molt que ja no digui Donis Moines.

Jmrebes (discussiócontribucions)

I tant!

Jmrebes (discussiócontribucions)

Només llegint aquesta frase ja tremolo: "Espanya, que es va aliar amb França després de les signatures de la Pau de Basilea, va implicar que després de la signatura del tractat de Sant Ildefons existís de nou compte una ruptura de relacions amb Gran Bretanya".

Jmrebes (discussiócontribucions)

"Estafis" controlats. De pas, he vist que hi ha 2.740 pàgines amb la paraula "accessed" en una o més referències. Entenc que no es tradueixi el títol d'un document (llibre, pàgina web) que originalment està en anglès, però no entenc que no es faci amb "accessed" ni amb els noms dels mesos (October, Novembre,...).

Cataleirxs (discussiócontribucions)

@Jmrebes Per bó o per dolent, el ContentTranslate no tradueix el text que hi ha dintre de les referències.

Paucabot (discussiócontribucions)

Estava corregint els habiti. N'hi ha molts. Els primers són tots falsos positius, però després comencen a aparèixer desenes i desenes de positius reals.

Jmrebes (discussiócontribucions)

Ja ho vaig veure ahir (els habiti). No es pot fer que el traductor per defecte sigui el de Google? Amb Apertium tenim aquests problemes, però no els tindríem pas amb Google.

Paucabot (discussiócontribucions)
Paucabot (discussiócontribucions)
Paucabot (discussiócontribucions)
Paucabot (discussiócontribucions)
Paucabot (discussiócontribucions)
Paucabot (discussiócontribucions)
Pere prlpz (discussiócontribucions)
Jmrebes (discussiócontribucions)
Paucabot (discussiócontribucions)

La majoria d'errors venen de la traducció de textos en anglès (normalment llistats d'obres o bibliografia) en articles que es tradueixen del castellà, però si els textos són en francès dins una pàgina traduïda del castellà, la cosa és igual de greu o pitjor.

Paucabot (discussiócontribucions)
Jmrebes (discussiócontribucions)

Demencial. Impossible fer recerques d'aquestes traduccions.

Mercè Piqueras (discussiócontribucions)

Hi ha errors de traducció de l'anglès que són fàcilment detectables, però d'altres que costa més perquè es fan servir paraules equivalents a l'original o amb una traducció que tot i ser correcta no escau al context de l'article traduït, o perquè es tradueix literalment. Fins i tot perquè en algun argot professional (passa bastant en medicina) l'ús d'algun terme mal traduït ja és freqüent Alguns exemples:

• code for (en genètica) → codifica per (en català i castellà no duu preposició)

• severe (en medicina) → sever (en comptes de 'greu', 'agut')

• immune system → sistema immune (en català és 'sistema immunitari')

• become → convertir-se (en comptes d''esdevenir' o 'arribar a ser')

• eventually → eventualment (en comptes de 'finalment')

• actually → actualment (en comptes de 'realment')

• evidence → evidència (en comptes de 'prova')

Això pel que fa al vocabulari, però també hi ha diferències en l'ús dels temps verbals i en l'ortotipografia. Fa anys vaig publicar un article sobre traducció científica i vaig dedicar-ne un apartat als errors freqüents en traduir de l'anglès.

Jmrebes (discussiócontribucions)

Per no parlar de les traduccions incorrectes del castellà al català, com ara cebada -> civada (en comptes d'ordi). Però el que destaca aquest fil són les traduccions de tercers idiomes passades pel traductor castellà->català, como ara traduir títols de publicacions en anglès (o francès) com si fossin títols en castellà.

Paucabot (discussiócontribucions)

Sí, els casos que jo he posat més amunt no són tan discrets com els que poses tu, ja que no peguen gens en el context perquè són traduccions d'un idioma que no toca.

Igualment, aquests altres casos que comentes també estaria bé documentar-los a Viquipèdia:Traduccions/Errors comuns per anar corregint-los regularment.

Marti.bdb (discussiócontribucions)

El sistema de traduccions que s'utilitza actualment té molts pocs controls de qualitat i els pocs que té fan aigües. Per exemple, el requisit de modificar un 15% els paràgrafs, que ja és poc, es pot evitar movent un paràgraf a un altre, eliminant el requisit en els dos paràgrafs.

És un tema complicat, jo potser provaria d'informar a la gent de forma intensiva que si surt a mitja traducció després la pot reprendre, no cal fer-la tota d'un cop. També estaria bé que el requisit de modificar un paràgraf anés variant respecte a la llargària del paràgraf. Si un paràgraf és molt llarg podria ser necessària una modificació d'un 30% del mateix mentre que un "paràgraf" d'una línia pot no necessitar cap modificació.

Paucabot (discussiócontribucions)

Com més en revís, més n'apareixen: Viquipèdia:Traduccions/Errors comuns. Qualcuns són fàcils de cercar () però devem tenir desenes o centenars de casos més on li no està acompanyat de monde i aquests altres no són gens fàcils de trobar.

Paucabot (discussiócontribucions)
Leptictidium (discussiócontribucions)
Jmrebes (discussiócontribucions)

He trobat un bon grapat d'òperes "reviscudes", traducció de la paraula francesa "repris" o "reprise", que es fa servir per indicar que després de molts anys es torna a representar una obra. No crec que en català es pugui dir "reviscuda", oi?

Pere prlpz (discussiócontribucions)

Diria que lliga amb un dels significats de reposició, però no amb els significats del verb reposar. Jo potser parlaria d'òperes reestrenades i de reestrenes o reposicions.

Leptictidium (discussiócontribucions)
Resposta a «Tenim un problema en les traduccions»