Tema de Viquipèdia:La taverna/Novetats

La situació empitjora: #Googleencatalà

29
Xavier Dengra (discussiócontribucions)

Bon dia. La situació de les cerques en català a Google, des de fa hores o pocs dies, ha empitjorat notablement. Si cerqueu Catalunya Ràdio, Falles o Eivissa amb tota la configuració en català, ara el motor de cerca prioritza la taula lateral (snippet) en la Viquipèdia en anglès. S'han carregat l'únic bastió que quedava.

Ahir vaig parlar una estona amb en @Pere Orga sobre les visites a la Viquipèdia; en un històric des del 2015 sí que es pot veure una tendència lleugerament decreixent a partir del 2020 en el total d'accessos (no pas en dispositius únics o visites mòbils), però que sembla molt difícil d'atribuir específicament als algoritmes de Google. Jo penso que serà clau el monitoratge en les properes setmanes per saber si s'accentua.

Ara bé, tenint en compte que la WMF té línia directa amb Google, crec que com a comunitat hem de fer un pas molt endavant per posicionar-nos contra això i fer-los-ho saber. També amb la premsa, a parer meu. Fins ara hem fet alguna piulada de context, de sumar-nos a #Googlenencatalà i de respostes a usuaris, però no ens hem posicionat conjuntament per explicar com reaccionem a tot això i ara sí que hi ha una constatació que se'ns omet al cercador més important d'Internet. És difícil reaccionar a tantes interaccions sense saber que tots anem a l'uníson amb un discurs públic, si és que el volem fer i ens en el demanen.

Vriullop (discussiócontribucions)

Proposo una acció concreta i dràstica, posar Google a la llista negra, mentre ens tracti així de malament i com a mesura de protesta. Calculo que són 24.000 enllaços, alguns a simple vista francament prescindibles. A posteriori ja analitzarem cas a cas, hi poden haver alternatives, per exemple a Bing, o acceptar-ne alguns en articles corporatius com Google. El que no pot ser és que a sobre tinguem enllaços amb paràmetres hl=en o hl=es.

Cataleirxs (discussiócontribucions)

Els enllaços a Googlebooks quedarien afectats?

Xavier Dengra (discussiócontribucions)

Si passés, seria irrellevant, la veritat. No són pas l'única font d'accés ni la principal.

Xavier Dengra (discussiócontribucions)

Una nota de premsa molt contundent i declarant la llista negra a Google, amb sol·licitud urgent d'actuació de la WMF i dels responsables digitals dels governs catalanoparlants em semblaria una acció importantíssima.

Robertgarrigos (discussiócontribucions)

Em sembla bé la proposta que feu. Tota pressió que es pugui fer davant de Goliat és necessària.

Pere Orga (discussiócontribucions)

La situació és dramàtica, totalment d'acord amb això de la llista negra i la nota de premsa. (Però no estic segur que la situació a Bing sigui millor, tot i que el que passi a Bing crec que és molt menys rellevant)

Kippelboy (discussiócontribucions)

Per part meva, ok a fer nota de premsa i pressió als mitjans. Tema llista negra, ok, però més com a efecte simbòlic que pràctic.

Vriullop (discussiócontribucions)

Segur que se'n foten de 24.000 enllaços. Deixem-ho com una mesura a prendre mentre analitzem com Google ens perjudica, quines alternatives hi ha més respectoses amb la llengua, quines configuracions hauríem d'adoptar per assegurar l'accés en la llengua del projecte.

Xavier Dengra (discussiócontribucions)

No és perquè se'n fotin ells, sinó per la coacció i la pressió en l'opinió pública i als mitjans (on sí que hi tenim una molt bona incisió). La tancada de 3 dies fa uns anys contra la directiva de la UE no la vam considerar des de l'òptica de què en pensaria el Parlament, sinó en els parlamentaris del territori catalanoparlant que sí ens van veure com una comunitat a la qual tenir en compte. Aconseguir un cert "public shaming" que arribi a bons mitjans (si és possible no només en català), a d'altres llengües wiki minoritzades que puguin estar patint el mateix, i sobretot a la WMF em sembla una estratègia per la qual val la pena fer això de la llista negra.

Vriullop (discussiócontribucions)

Estem d'acord. Feia reflexions sobre efectes pràctics i simbòlics. No ens hem de quedar només aquí. Podem fer un projecte per analitzar-ho, fer recomanacions als usuaris i prendre mesures diverses.

Robertgarrigos (discussiócontribucions)

Totalment d'acord.

Pau Colominas (discussiócontribucions)

Totalment a favor de les mesures proposades: comunicació oficial a Google i Wikimedia, nota de premsa, llista negra i divulgació de tot plegat a xarxes.

AlbertRA (discussiócontribucions)

Endavant les atxes!

Pallares (discussiócontribucions)

D'acord. Endavant amb les propostes

Guillem Carreras (discussiócontribucions)

També estic d'acord amb les propostes. Es pot concertar una reunió oberta per concretar qui impulsa cada acció. D'acord amb en Xavier que l'objectiu ha de ser pressionar a Google, però sobretot instar instàncies més influents que nosaltres a prendre partit, evitar que puguin desentendre-se'n. És evident que les administracions tenen més capacitat de pressió que nosaltres, penso per exemple en tots els centres educatius que fan servir el Google Classroom. Es podria instar al Departament d'Educació que revisi aquests acords mentre Google discrimini Viquipèdia, i més extensament el català com a llengua de cerca. En paral·lel, saber si això també afecta altres llengües minoritzades, o bé si només passa amb les de l'Estat espanyol.

La situació és dolenta, però tenim un exemple que demostra que és reversible: l'audiovisual. Hi havia molt poc contingut en català, ha sorgit pressió social, les Administracions s'han posat una mica les piles, i si bé encara estem molt lluny de ser una llengua normalitzada, algunes productores ofereixen més sèries en català. Som-hi!

Jove (discussiócontribucions)

Totalment a favor d'emprendre accions en contra el canvi d'algoritme. En Pau Colominas ho ha resumit perfectament: «comunicació oficial a Google i Wikimedia, nota de premsa, llista negra i divulgació de tot plegat a xarxes».

Com a punt afegit, intentaria esbrinar si hi ha altres versions lingüístiques afectades per aquest canvi. Costa de creure que sigui un perjudici únic i exclusiu per a la comunitat catalanoparlant. Potser, així, Google s'ho repensaria amb més força.

Vriullop (discussiócontribucions)

He vist per Twiteer ucraïnians quejant-se que els surt en rus. Pot ser un problema general.

Amortres (discussiócontribucions)

Jo estic d'acord amb @Jove:, abans de fer res unilateralment no estaria de més consultar les altres versions idiomàtiques per si el problema és global o particular.

Xavier Dengra (discussiócontribucions)

Bon dia. El primer que ja he fet és demanar a alguns mitjans catalans que tenen versió en anglès per tal que tradueixin les seves notícies i reportatges sobre aquest tema (Ara, Vilaweb), atès que han parlat explícitament del cas Viquipèdia com a principal. I també que s'ho miri Catalan News de l'ACN,. Amb això, podem compartir fonts fiables a d'altres comunitats perquè vegin que és un tema prou cobert i sensible aquí i que el poden replicar on calgui. Sembla que aquests mitjans s'hi avindran prou bé.

Tanmateix, crec que paral·lelament a cercar complicitats i/o que se'ns puguin unir altres Viquipèdies en qualsevol acció que arribem a fer, hem de començar ja a perfilar bé què fem i estar alineats entre nosaltres i demostrar que anem prou a l'uníson. Posar Google a la llista negra o una petició formal a la WMF (o qualsevol altra acció que pugueu tenir al cap) és millor que passi per una presa de decisions. L'obro aquest mateix vespre.

Vriullop (discussiócontribucions)

No sé vosaltres, però tinc la impressió que alguna cosa està canviant, almenys en les cerques "només en català" o cosa que és el mateix amb el paràmetre "lr=lang_ca".

Crec que hauríem d'analitzar quina responsabilitat hi té la Fundació i quina nosaltres.

Com a usuaris:

  • M'he centrat a analitzar els resultats de la cerca "Eivissa", clar, concís i clarament català. Resulta que Eivissa el tenim com una desambiguació i segur que això no hi ajuda. Si aquesta és una cerca comuna hauria de tenir un article amb el títol comú. M'és igual si primer és l'ou o la gallina, però no és problema anar a l'illa si un vol la vila, o al revés. Penso que hauríem de revisar els criteris de les desambiguacions.
  • Cal manteniment dels enllaços. D'entrada haurien ser a google.cat. No té cap repercussió en els resultats de cerques, però és una qüestió de principi i cal evitar els dominis estatals. He vist algun article traduït que manté google.fr i resulta absurd.
  • Cal evitar el paràmetre hl=xx que indica la llengua de la interfície. O bé s'elimina perquè surti en la llengua de l'usuari o bé es corregeix a hl=ca, l'únic acceptable.
  • Cal fer recomanacions als usuaris sobre com usar Google i quines alternatives hi ha que resultin útils per la Viquipèdia.

Com a organització:

  • No sé si Amical ha fet algun pas en aquesta qüestió. Perdoneu-me el meu desconeixement. Cal traslladar el problema a la Fundació i cal coordinar-se amb altres capítols/grups afectats. Evidentment no seran capítols més centrats en àmbits estatals que lingüístics, però n'hi ha d'altres sensibles a qüestions lingüístiques. La Fundació hauria de tenir un interlocutor entre aquests grups afectats i Google.
  • Hem confiat que Wikimedia té resolt el tema multilingüístic. Tenir el codi en l'URL, com ca.wikipedia, sembla que no és suficient. Al final del codi font d'una pàgina apareixen els interwikis amb el format: <a href="https://xx.wikipedia.org/wiki/xxxx" title="xxxx" lang="xx" hreflang="xx" class="interlanguage-link-target">. Usar el paràmetre hreflang és el que toca per a indicar altres versions lingüístiques, però la documentació de Google diu d'usar-lo en la capçalera head amb el format: <link rel="alternate" hreflang="xx" href="url_of_page" />. Desconec si això és una recomanació d'algun estàndard, però podria ser una millora que algú (potser de Google mateix) ens hauria de confirmar.
    • Addicionalment, el Viccionari no té cap hreflang. Allà no s'usen els interwikis via Wikidata sinó amb mw:Extension:Cognate. Són projectes monolingües però de contingut multilingüe que enllacen automàticament títols coincidents. Aquesta manca d'etiquetes hreflang segur que no ajuden als cercadors per trobar una versió lingüística.
Pere prlpz (discussiócontribucions)

M'agrada que em faci aquesta pregunta. ;)

El reanomenament d'Eivissa ha estat proposat a la discussió durant un parell d'anys per si hi havia objeccions. Com que no n'hi ha hagut, ja he fet el reanomenament i he demanat als administradors que acabin la part que no puc fer sol.

Dit això, crec que les desambiguacions fetes amb no gaire bon criteri són un problema recurrent. Fins ara ho eren perquè causaven enllaços incorrectes, tant els existents en el moment de reanomenar intempestivament una desambiguació sense revisar els enllaços, com després quan els editors no comproven on van a parar els enllaços que creen i l'article no està on seria d'esperar. Si a més ens perjudiquen amb el Google, més motiu encara per ser curós amb les desambiguacions.

Un altre tema semblant sobre el que potser cal una reflexió és la política de títols de biografies, que ens porta a fer servir noms complets quan els usuaris busquen formes més curtes als cercadors. Hi ha motius enciclopèdics per la política actual però potser caldria veure si ens porta gaires perjudicis amb les cerques.

Robertgarrigos (discussiócontribucions)
  • Estic d'acord amb la necessitat de canviar els enllaços a google pel .cat.
  • Pel que fa a la teva consulta com a organització: demà tenim una reunió Amical-Softcatalà-Fundació.cat en què assistirem el Mèdol i jo mateix com a representants d'Amical a causa de l'impàs en què estem. També hi assistiran altres viquipedistes, com el Dengra i el Gerard Soler. Estic d'acord que hem de tenir un interlocutor amb Google, i altres companyies d'internet, en la línia que apunta avui mateix en Partal a la seva editorial. Us mantindrem informats dels resultats d'aquestes reunions.
  • No estic segur que el problema sigui el lloc on es posen els hreflang, tot i que segur que hi pot influir. El cas és que la cerca d'Eivissa al google troba la pàgina de caviqui, fins i tot quan el forces a buscar només pàgines en català, la qual cosa vol dir que entén que aquella pàgina és en català. El problema és que, fins i tot així, mostra la pàgina d'enwiki traduïda al destacat de la dreta i el primer resultat segueix essent el web de l'Ajuntament d'Eivissa en la seva versió en castellà, malgrat que té versió en català i degudament etiquetada a la capçalera amb el seu hreflang.
Cerca a Google en català: Eivissa
Codi html web Ajuntmanet Eivissa


Ja em disculpareu si pujar aquestes imatges a la discussió està mal vist o simplement mal fet. Si cal esborrar-les, feu-ho i m'espavilo a pujar-les a un altre lloc i deixar-hi l'enllaç.

Pere prlpz (discussiócontribucions)

Posar imatges en una discussió està molt ben fet i segurament ho hauríem de fer més sovint. Ara bé, pot ser que aquestes dues imatges acabin esborrades de Commons perquè incorporen elements no lliures. commons:Commons:Screenshots.

Vriullop (discussiócontribucions)

Per comparar:

  • aytosagunto.es Si entro directament surt en castellà. Cercant sense llengua determinada, també. Cercant només català deu detectar el hreflang i surt en català.
  • eivissa.es Entrant directament un javascript detecta la meva configuració i redirigeix a /ca. Cercant s'en va sempre a /es.

Intentant interpretar Google, la redirecció de la pàgina principal sembla que fa que no la interpreti. El hreflang és possible que només funcioni amb cerques en una llengua, no amb la configuració de l'usuari.

Xavier Dengra (discussiócontribucions)

És evident que com a discurs públic cal fomentar molt més el language-responsive en institucions i empreses. Però no sé si incloure això en el debat actual (per molt que sigui una interpretació plausible d'allò que hipotetitzem que pot afectar a Google) fa que fins i tot beneficiem Google perquè l'ajudem amb un discurs en què s'eximeix dels seus propis canvis a pitjor.

Vriullop (discussiócontribucions)

Tens raó. La resposta de Google traspassa la responsabilitat als dissenyadors web. És una excusa fàcil i tenia ganes de comprovar-ho. La responsabilitat és seva, si es fan les coses raonablement bé, i és evident que hi ha altres factors en el seu algoritme que no explicaran. He comparat les cerques amb mojeek.com i aquest fa el que s'espera que faci. Per exemple, sap trobar la pàgina en català de l'ajuntament d'Eivissa. Google té recursos de sobra per detectar el que vulgui.

Això no impedeix que des de la Viquipèdia fem el que estigui al nostre abast per posicionar-la millor en les cerques, si és que hi ha alguna oportunitat per petita que sigui.

Robertgarrigos (discussiócontribucions)

Desconeixia mojeek.com. Afegit. Una altra cosa que ens hem de plantejar és la promoció de cercadors alternatius.

Xavier Dengra (discussiócontribucions)

En aquest mateix exemple ("Eivissa"), així com en la cerca "metro L4" m'he basat aquest matí per explicar a dos mitjans que m'han preguntat si havíem vist millores significatives, que no és el cas.

Resposta a «La situació empitjora: #Googleencatalà»