Tema de Viquipèdia:La taverna/Tecnicismes

Unjoanqualsevol (discussiócontribucions)

Hola, en la comunitat OSM hem detectat el que pensem pot ser un problema que afecta als mapes de la Viquipèdia. Ens agradaria confirmar les sospites, saber si en sou conscients i, en qualsevol dels casos, treballar des de les dues comunitats a una.

Problema "Pampalona": ara com ara (21 de gener de 2021), el mapa generat per maps.wikipedia.org en català de la zona de mostra «Pampalona» (nom en occità) en comptes de Pamplona (nom en català). En els pròxims dies és possible que aparegui Pamplona al mapa, perquè fa una estona s'han modificat dades a OSM. Aquest mapa es genera amb les dades d'OSM. Mirant les dades d'OSM sembla que el problema es manifesta si a OSM existeix l'etiqueta "name:oc" (nom en occità), però no existeix l'etiqueta "name:ca" (nom en català).


Aleshores, m'agradaria confirmar que el generador de mapes maps.wikipedia.org usa els valors de "name:oc" com a fallback per a català. En cas afirmatiu, cal que en siguem tots (Viquipèdia i OSM) conscients.


En el cas que es vulgui mantenir aquest fallback en els mapes de Viquipèdia, algú hauria d'encarregar-se que sempre a OSM hi hagi definit l'etiqueta "name:oc", cal definir l'etiqueta "name:ca", especialment si els noms són diferents. El cas de Pamplona ja s'ha apedaçat i estem esperant que es regenerin les tessel·les del mapa, però pot afectar a moltíssims més topònims d'OSM de tot el món.


Particularment, em penso que aquest fallback (que a mediawiki pot estar bé), no és adient per als mapes, i caldria desfer-lo.


Qualsevol de les dues opcions (mantenir o desfer el fallback cap a l'occità) té pros i contres. La meva intenció és donar visibilitat al problema (que només afecta els mapes generats per maps.wikipedia.org) i prendre decisions en la millora dels dos projectes i dels usuaris.

Toniher (discussiócontribucions)

Hola,

és molt bon apunt. Per a la determinació de la llengua de topònims a mostrar sembla que s'utilitza el sistema de localització de MediaWiki (https://www.mediawiki.org/wiki/Manual:Language#Fallback_languages) Vegi's les correspondències a: https://phabricator.wikimedia.org/T258492#6490574

Per tant https://maps.wikimedia.org/?lang=ca#12/42.8115/-1.6346 -> passant-li el paràmetre lang=ca, el que fa, és recollir de: https://www.openstreetmap.org/relation/344401 els name, si no hi és name:ca, se'n va a name:oc i després a name (nom oficial) entenc. Si no passem el paràmetre lang a l'URL, directament agafa el name només entenc: https://maps.wikimedia.org/#12/42.8115/-1.6346

Opcions que veig:

  • Suposant que el nombre de topònims potencialment problemàtics no hauria de ser gran, miraria d'importar a OSM tots els name:ca (exònims en català) realment necessaris. El punt feble és que a OSM hi hagi mai un abús d'exònims (en 'ca' o 'oc') que realment no siguin 'ca' o 'oc' (sinó 'es' o 'fr'). En tot cas, això seria una discussió a portar a la comunitat OSM.
  • Demanar en el phabricator que no s'apliqui el fallback de locale de MediaWiki per a l'extensió de mapes (o millor, permetre sobreescriure per a certes llengües, com pot ser 'ca'). Això és, introduir un altre paràmetre de configuració de l'extensió a nivell d'administració.
  • Demanar en general eliminar el fallback de localització de 'ca' a 'oc'. Això implicaria que el fallback passaria a ser 'en' en les traduccions d'interfície i en els mapes d'OSM sempre a name si no hi ha name:ca.
Pere prlpz (discussiócontribucions)

Suposo que amb Overpass es deu poder fer la consulta de tots els lloc amb name:oc sense name:ca. Seria un bon lloc per començar a veure la magnitud o la solució del problema.

I un dubte: on no hi ha exotopònim, és correcte posar com a name:ca l'endotopònim? Si fos així es podria copiar els títols dels articles de la Viquipèdia o els labels de Wikidata com a name:ca.

Toniher (discussiócontribucions)

Bo, pel suggeriment de dalt, @Pere prlpz. No he emprat mai Overpass, no sé si tu ho has fet, si no ja ho miraria en un futur...

Suposo que el segon és un punt a comentar a la comunitat OSM, però m'ensumo que no acabaria d'agradar i implicaria una feina recurrent... Per altra banda, a menys que ho féssim per name:oc també, que té menys etiquetes de Wikidata, no sé si faríem la guitza als usuaris (malgrat menys que 'ca') que utilitzin mapes amb lang=oc.

Unjoanqualsevol (discussiócontribucions)

Consulta a overpass-turbo per al cas Pampalona en els estats espanyol i francès, respectivament. He exhaurit la quota que consulta que ofereix el servidor overpass, i fins demà no podré fer més consultes :(


Deixant de banda la feina que representaria, i la tasca de manteniment, en principi no és correcte usar endotopònims (name:oc) en l'etiqueta name:ca. OSM té la màxima de no mapar per al renderitzador, en aquest cas el renderitzador de Wikimedia. Vull dir, per exemple, que si un municipi, riu, o muntanya, no té una forma toponímica en català, aleshores name:ca hauria de ser buit. I prou. I usar-se el name

Pere prlpz (discussiócontribucions)

Gràcies per les consultes.

El problema que hi veig de fer servir name quan no hi ha name:ca és que a la Viquipèdia el criteri és fer servir noms en la llengua local i no noms oficials, quan no hi ha un exotopònim català. Tot i que no estigués pensat per això, el fallback a oc seria útil a Occitània, però només a Occitània i segurament s'hauria de treure dels mapes (no de la interfície del Mediawiki). El que no sé com s'hauria d'arreglar són tots els llocs on el nom oficial no és el nom local. Una solució que no m'acaba d'agradar és pujar com a name:ca els noms locals (que poden coincidir amb els títols dels articles la Viquipèdia) quan no coincideixin amb el nom oficial. M'imagino que OSM no té una propietat de l'estil de Nom en la llengua original (P1705) que pugui servir pels endotopònims en la llengua local.

161.116.8.79 (discussiócontribucions)

OSM té, entre altres, les etiquetes loc_name (nom local), nat_name (nom nacional) i reg_name (nom regional), que podrien usar-se com a contenidor de l'endònim, però tenen poc ús, la veritat.


Sembla que estem d'acord que el generador de mapes en català de Viquipèdia no hauria d'usar el fallback en occità com a regla general i s'hauria de demanar que només usi les dades de name:ca i, si no existeixes, aleshores name. Qui se'n pot fer càrrec de sol·licitar-ho?

Pere prlpz (discussiócontribucions)

Més aviat diria que el que cal és canviar el fallback a loc_name si podem pujar-hi els endònims en llengües minoritzades. No conec gaire les eines automàtiques d'OSM, però fer-ne una llista a partir de la Viquipèdia o Wikidata no hauria de ser difícil i es podria pujar a OSM.

Unjoanqualsevol (discussiócontribucions)

Entenc que la proposta seria que el mapa usi, en aquesta prioritat, els valors de name:ca, loc_name, name. Això resol el problema plantejat i permet, via el valor de loc_name, usar endònims en comptes dels noms oficials. No hi estic en contra, és el criteri més semblant als títols d'article de la Viquipèdia en català, però pot obrir altres problemes amb el valor loc_name. La banda d'OSM pot ser una mica complexa, perquè tal vegada la comunitat local del territori en qüestió prefereix usar el loc_name per a una altra cosa, o en una altra llengua. i el valor no coincideixi amb el títol de la Viquipèdia en català. Les edicions automatitzades a OSM tampoc són gaire benvingudes. La part del generador de mapes (banda Wikimedia) es podria implementar i després afegir les dades a loc_name (banda OSM).

Tal com ho veig, estem d'acord que fer fallback cap a l'occità en els mapes no és desitjable. Aleshores, només hi veig duesa alternatives:

  1. Usar name:ca i després name. Senzill i fàcil d'entendre. El que fan la majoria de Viquipèdies, però es perden els endònims quan no coincideixen amb els noms oficials. Cal canviar el sistema de locales del generador de mapes.
  1. Usar name:ca, després loc_name, i finalment name. Requereix una implementació específica del generador de mapes (banda Wikimedia) i introduir i mantenir dades a loc_name (banda OSM), amb els conflictes que podrien aparèixer.


Sincerament, prefereixo la primera opció. Però són els mapes de la Viquipèdia. No ho he de decidir (només) jo. En qualsevol de les dues opcions, cal modificar el generador de mapes (banda Wikimedia).

Pere prlpz (discussiócontribucions)

Una tercera opció és fer servir name:ca per posar l'endònim quan sigui diferent del name. Entenc que no seria el nom en català però sí que seria el nom que fa servir gran part de les fonts en català, que és diferent del nom que fan servir les fonts en moltes altres llengües i que està a name. Amb aquesta opció no caldria canviar gran cosa del generador de mapes però sí que caldria carregar els endònims a name:ca a OSM.

Unjoanqualsevol (discussiócontribucions)

Aquesta 3a opció no encaixa gaire, per no dir gens, amb els criteris d'OSM :(

Vriullop (discussiócontribucions)
Unjoanqualsevol (discussiócontribucions)

Gràcies, Vriullop, per les referències. Confirmes el que havia deduït. I queda clar que es pot personalitzar prou bé al nostre gust.

Dubtes: el cas Pampalona apareix per les dades del node membre de la relació que té el rol admin_center. En aquest cas, per a la relació 34401 d'OSM (Pamplona) és el node 28849760 (que té name:oc=Pampalona). Els valors name:ca del node i relació anteriors es van afegir el dia que vam diagnosticar el problema. La diferència entre relació i node admin_center es veu més clara en el cas de Vielha e Mijaran, perquè la relació té el nom Viella i Mitjaran, però el node només té el nom Viella.

Tornant al problema dels mapes, ara tenim un mapa mundial en català que fa fallback cap a l'occità(!?). Per posar context, el gallec fa fallback cap al portuguès, l'aragonès i asturià cap a l'espanyol, l'occità cap el català i després cap al francès, el basc no fa fallback. Opcions:

  1. Deixar-ho com està. Entenc que no és desitjable.
  2. Fer fallback cap a l'anglès. És la llengua que té més topònims a OSM. El nom de name:en no sempre coincideix amb el nom internacional, però gairebé.
  3. Que no faci fallback, com fan l'anglès, l'espanyol o el francès. No hi perdríem gaire en relació amb la situació actual. El problema apareix en els topònims d'alfabet no llatí. Caldria treballar a OSM per a importar una toponímia important a name:ca, especialment en les zones on no s'usa l'alfabet llatí, però això ja seria una millora de la situació actual.
  4. Millorar el renderitzador de Wikimedia perquè permeti usar el valor de l'etiqueta int_name d'OSM i usar-lo com a fallback. En teoria això resoldria el problema d'usar l'anglès com a llengua franca.
  5. Cal altra?
Vriullop (discussiócontribucions)

Una millora provisional és canviar el fallback a l'anglès. Tot i que les transliteracions no siguin les que volem, resultarà menys llocs on afegir-hi el català.

Demanar usar una altra etiqueta es pot fer igualment, tot i que em temo que sigui més difícil. A m:Community Wishlist Survey 2020/Archive/Kartographer improvements deien que no farien canvis al Kartographer deixant-ho pendent d'una revisió d'infraestructura. Enguany a m:Category:Community Wishlist Survey 2021/Proposals hi ha dues propostes més, però cap relacionada amb el problema de llengües.

Unjoanqualsevol (discussiócontribucions)

Sí, crec que ara, per ara, l'opció 2: fer fallback cap a l'anglès (com fan grec i polonès) és la millor opció. Pots gestionar-ho, @Vriullop?

Vriullop (discussiócontribucions)
Pere prlpz (discussiócontribucions)

Pot servir com a solució provisional. Com a solució definitiva li veig els problemes que deia més amunt.

O sigui, a curt termini cap objecció.

Unjoanqualsevol (discussiócontribucions)

Entès. Demanen un enllaç amb el debat de la comunitat. No sé si aquest fil servirà o cal organitzar una votació formal.

Vriullop (discussiócontribucions)

Aquest fil ja serveix.

Vriullop (discussiócontribucions)
Vriullop (discussiócontribucions)

Algú amb més experiència que jo potser s'atreveix a fer un canvi a github tal com indiquen al tiquet de Phab. Així accelerem.

Pere prlpz (discussiócontribucions)
Toniher (discussiócontribucions)
Pere prlpz (discussiócontribucions)
Resposta a «Mapa en català»