Tema de Viquipèdia:La taverna/Tecnicismes

KajenCAT (discussiócontribucions)

Voldria preguntar si creieu que hi ha alguna manera més eficient de categoritzar els esportistes dels Jocs Asiàtics? Sembla que hi va haver més de 1.000 esportistes (amb article a cawiki) i, per no crear una categoria massa plena, s'hauria de crear categories per any, per origen i si és medallista, vaja, com els esportistes olímpics.

Per això, voldria preguntar si creieu que és millor en bot (sigui per automatitzar o semiautomatitzar el procès) o simplement s'ha de fer amb PagePile i Quickcategories? En el cas que fos aquesta última opció, hi ha alguna manera d'esbrinar quines subcategories es poden crear que no sigui manualment amb Petscan?

Gràcies!

Pere prlpz (discussiócontribucions)

Per categoritzar automàticament el primer pas és preguntar-se on on està la informació que voldràs fer servir. O sigui, un cop vegis que hi ha una informació que podria llegir una màquina i que pots categoritzar fent servir només aquesta informació (o sigui, sense llegir l'article ni fer res que no pugui fer-se automàticament), aleshores pots començar a pensar com faries a màquina el mateix procés que fa a mà.

Dit això, veig que a les categories no hi ha informació de manera que només se m'ocorre comprovar si a Wikidata hi ha en quins jocs asiàtics va participar cada esportista, representant a quin país i si va aconseguir medalla. Si hi ha tot això, suposo que es pot categoritzar amb PetScan (incloent al PetScan una consulta SPARQL), PagePila i QuickCategories. El mateix es podria fer amb bot però si val la pena o no depèn de quantes categories vulguis fer i si tens interès en aprendre a fer bots per fer més coses.

També hi ha opcions semimanuals a partir de fer servir el PetScan i comprova cada cas abans de categoritzar amb HotCat. Aquestes podrien ser les ideals si part de la informació fos al text de l'article.

KajenCAT (discussiócontribucions)

Sobre si surt a wikidata, he mirat 20 esportistes dels Jocs Asiàtics de manera aleatòria, i només 8 tenien declaracions en la propietat P1344 i l'ítem dels Jocs Asiàtics de l'any que van participar. En cap d'aquests ítems surten ni a quin país van representar (es podria creuar per nacionalitat o naixement, però clar no té perquè haver-hi correspondència de nacionalitat amb nacionalitat esportiva) ni si van aconseguir medalla.

La meva idea era optar per un d'aquests camins:

  1. La via automàtica. Soc conscient, que tot i no tenir ni fava de coneixements tècnics, el temps que es dedicaria per muntar seria major que dur a terme la segona opció, però si hi ha possibilitat de replicar, es podria aprendre per utilitzar-lo en altres ocasions. A més a més, és possible que em podria ajudar un amic meu amb coneixements informàtics (però sense coneixement en el món wiki). Des de la ignorància, potser es pot modificar el codi d'algun bot teu o d'un altre viquipedista que pugui servir.
  2. La via semiautomàtica amb PetScan + PagePile + QuickCategories que em vas ensenyar fa un temps PERÒ amb la pregunta si hi ha alguna manera més senzilla de saber quines categories es poden omplir i quines no, en aquest cas (ja que, per any, segur que n'hi haurà més de 5 esportistes). Si hi ha alguna manera, llavors la intenció és usar-la per altres ocasions, ja que no ha sigut la primera vegada que he hagut de comprovar país per país per saber quina categoria es pot crear i quina no.
Pere prlpz (discussiócontribucions)

No sé exactament quines categories vols crear (participants als Jocs Asiàtics de l'any X? participants als Jocs Asiàtics representant el país Y? participants als Jocs Asiàtics de l'any X el país Y?) però amb una consulta de Wikidata pots demanar que et llisti els participants ordenats per any o per país (o per les dues coses) i veuràs quins anys o països en tenen més de 5. També pots fer que te'ls compti i et digui quants n'hi ha per país o any.

I d'acord amb tu que deduir el país representat a partir de l'origen no és gens segur. Amb els Jocs Olímpics em vaig trobar amb força excepcions i per això no vaig categoritzar automàticament els participants i medallistes olímpics per país.

KajenCAT (discussiócontribucions)

La idea és, en la mesura que sigui possible, crear:

  • Esportistes als Jocs Asiàtics de 2018
  • Esportistes japonesos als Jocs Asiàtics
  • (objectiu secundari) Medallistes als Jocs Asiàtics de 2018
Pere prlpz (discussiócontribucions)
SELECT DISTINCT ?atleta ?atletaLabel ?jocs ?jocsLabel ?article WHERE {
  ?atleta wdt:P1344 ?jocs.
  ?jocs wdt:P3450 wd:Q483463.
  ?article schema:about ?atleta.
  ?article schema:isPartOf <https://ca.wikipedia.org/>.
  SERVICE wikibase:label {bd:serviceParam wikibase:language "[AUTO_LANGUAGE],ca,en,es,fr".}      
}
ORDER BY ?jocsLabel

Prova-ho !

Pot ser això el que busques?

Una curiositat és que d'algunes edicions en tenim moltes desenes de participants però d'una en tenim només dos articles.

KajenCAT (discussiócontribucions)
Pere prlpz (discussiócontribucions)
KajenCAT (discussiócontribucions)

D'acord, moltes gràcies, Pere, ja he parlat amb el meu amic, però com que caldrà un temps considerable hauré de deixar la primera via per més endavant, però m'apunto l'enllaç.

KajenCAT (discussiócontribucions)

Un moment, a que et refereixes amb SPARQL al Petscan?

Pere prlpz (discussiócontribucions)

Al PetScan hi ha una pestanya "Other sources" que et permet introduir una query. Si ho hagués de fer jo provaria és d'introduir-hi la query que selecciona participants en una edició donada dels Jocs Asiàtics.

Una alternativa més simple és fer servir el camp Uses items/props de la pestanya Wikidata, posant-hi l'item de l'edició dels jocs. Segurament donarà el mateix resultat a menys que hi hagi algú que faci servir l'item dels jocs però no sigui un participant (un organitzador? no sembla probable).

KajenCAT (discussiócontribucions)
Pere prlpz (discussiócontribucions)

Amb Part de (P361):

SELECT DISTINCT ?atleta ?atletaLabel ?jocs ?jocsLabel ?esdeveniment ?esdevenimentLabel ?article WHERE {
  ?atleta wdt:P1344 ?esdeveniment.
  ?esdeveniment wdt:P361* ?jocs.
  ?jocs wdt:P3450 wd:Q483463.
  ?article schema:about ?atleta.
  ?article schema:isPartOf <https://ca.wikipedia.org/>.
  SERVICE wikibase:label {bd:serviceParam wikibase:language "[AUTO_LANGUAGE],ca,en,es,fr".}      
}
ORDER BY ?jocsLabel

Prova-ho !

Crec que així surten 166 participacions més. Curiosament sembla que aquesta situació només es dóna amb el badminton.

KajenCAT (discussiócontribucions)

Sí, m'imagino... És feina de Florentyna, que l'havia descobert per pura casualitat. Merci de nou!

Resposta a «Categorització»