Tema de Viquipèdia:La taverna/Propostes

Darth vader 92 (discussiócontribucions)

Hola! Fa temps que amb en @Yuanga: estem pensant en fer servir un bot per a crear la gran majoria d'articles de minerals que falten, o si més no els menys rellevants. Cada espècie mineral hauria de tenir un article a la viquipèdia, el problema és que dels prop de 5100 minerals que existeixen, uns 4800 són poc importants en general; la proposta seria que amb l'ajuda d'un bot es poguessin crear els articles que falten i així ens podem dedicar a ampliar substancialment els articles de minerals realment importants o rellevants. En cas que es fessin els articles amb bot, s'hauria de determinar un nombre d'articles per dia o setmana per tal de que els podem anar corregint dia a dia. Ni en Yuanga ni jo tenim gaire idea de com crear ni de com fer anar un bot, llavors es podria fer amb un bot ja existent, que algú que en sabés programés un nou bot o que nosaltres n'aprenguessim (ho hem intentat però es requereixen coneixements previs difícils d'adquirir). Els articles es podrien crear agafant informació de 3 webs que són les que sempre utilitzem a l'hora de fer articles de minerals i plasmant-la en una infotaula tot traduint-la, a més a més el bot podria afegir 2 o 3 frases per descriure generalment el mineral un cop creada la pàgina, algú passaria a corregir-la i repassar-la i si fos necessari a afegir informació complementària. Crec que no m'he deixat res... Que us sembla?

Pere prlpz (discussiócontribucions)

Si ho estic entenent bé es tracta de que el bot llegeixi unes dades, hi afegeixi dues o tres línies estereotipades i ho pengi com si fos un article. Si es tracta de fer això, aquesta informació pot estar molt més bé en una taula que en un article.

Darth vader 92 (discussiócontribucions)

Es tractaria de crear una infotaula de mineral i a més a més escriure 2 o 3 línies de text amb la informació del mineral; aquests minerals poc importants no tenen més informació per escriure, sempre es podria posar un apartat de classificació, però suposo que això dificultaria molt la programació del bot. Un exemple de com quedarien els articles seria aquest: Agrinierita; això seria la base, desprès ampliaríem els articles segons ho requereixin; tot i això els minerals més rellevants no caldria fer-los ja que es farien manualment.

Pere prlpz (discussiócontribucions)

Per fer això, no tinc clar que un bot sigui capaç de fer correctament la infotaula, per tot el que hi ha a traduir i que és difícil d'estandarditzar, però el més difícil són les dues frases, que no són estereotipades i que s'han d'entendre de les fonts per redactar-les. A més, com que les dues webs que feu servir no són lliures, una traducció fidel, fins i tot si es pogués fer bé automàticament, no serviria perquè seria copyvio.

Paucabot (discussiócontribucions)

Una idea seria fer el bot a Wikidata i, poder aprofitar totes aquestes dades (per exemple, en forma d'infotaula), quan redactem l'article.

Darth vader 92 (discussiócontribucions)

No crec que hi hagi problema amb el copyright, ja que les dades que proporciona Mindat per exemple solen ser d'una paraula o dues, el que proposo és programar el bot perquè construeixi una frase senzilla tot incloent aquestes paraules. Per exemple: La Plantilla:Nom del mineral és un mineral de la classe dels Plantilla:Nom del grup traduït. Cristal·litza en el sistema Plantilla:Nom del sistema tot formant cristalls Plantilla:Morfologia dels cristalls. La seva localitat tipus es troba a Plantilla:Localitat tipus. On els paràmetres entre {{}} són els que s'agafarien de la web. El que diu en Paucabot també es podria fer tenint en compte de que crec que en un article així (de minerals poc importants) el que comporta més temps és la infotaula.

Pere prlpz (discussiócontribucions)

Si és així, que no és el cas d'agrinierita:

  • Tinc els meus dubtes sobre el copyright en copiar una base de dades més o menys sencera. No estic segur de com funciona, però en una base de dades a més dels drets que puguin tenir els continguts hi ha uns drets d'autor per la recopilació.
  • La informació d'aquesta frase de l'exemple pot estar millor en quatre camps de la taula: nom del grup, sistema, morfologia dels cristalls i localitat tipus. Per posar això no cal un article.

En canvi, si del que es tracta és de preparar infotaules perquè algú les posi en un article, a això no li veig problema.

Manlleus (discussiócontribucions)

Jo dono suport també a la idea de la creació semiautomàtica de taules i introduccions curtes, ja que també es podria reaprofitar el codi o el bot per articles d'asteroides o altres objectes astronòmics amb bones i llargues bases de dades a Internet per recollir automàticament i afegir referències. Posar aquesta informació en una sola taula obtindríem diversos articles amb centenars de milers d'octets, fent poc pràctica la navegació o consulta en ordinadors de pocs recursos o bé des de dispositius mòbils (pel pes de l'article). El que sí té sentit és fer articles amb llistes sobre cada subclasse o categoria principal per englobar cada tipus d'articles. Salutacions.

Pere prlpz (discussiócontribucions)

Estem parlant de només 5000 minerals. Si una taula amb 5000 minerals és massa gran per alguns mòbils antics, podem fer 10 taules de 500 per facilitar l'accés, però no cal fer 5000 microesborranys.

Manlleus (discussiócontribucions)

Lo que dius ja està fet, hi ha la llista de minerals general i les diferents subllistes per lletres de l'abecedari que fracciona la llista general (clavat al tema asteroides però aquest últim amb números), però el problema (ja des del principi) que si s'afegeix bastant informació, tenir una taula diguem-n'he per 500 minerals i posem que podrien contenir de mitjana 10 mil octets d'informació cadascun, doncs tindríem un article amb un pes de 5 milions d'octets amb la necessitat d'haver de fraccionar la llista encara més. Per tan impràctic, a més, les taules serveixen com a llistes amb informacions senzilles, poques línies o paraules per casella per anar bé. La gràcia aquí és que hi hagi l'article començat amb infotaula i introducció amb referències bàsiques per a que "l'equip d'usuaris de minerals" pugui afegir informació extra més còmodament. El mateix va passar amb el tema de Pokemon, que no estava clar si fer taula tot junt o articles separats, doncs es va fer tot, llista amb plan tipus taula+articles amb la línia evolutiva+articles de les diferents espècies que hi havia prou refes i informació.

EDITO: A més, els minerals tenen molta més informació i estan més estudiats per tan en poc temps caldrà article per tots ells en relativament poc temps (dels que hi ha en llista actualment). Cosa que no es pot dir tan dels asteroides o altres objectes astronòmics propers, però és qüestió de temps també.

Darth vader 92 (discussiócontribucions)

Jo crec que sí que té sentit fer-ho. Hem de pensar que el consens que hi ha pels articles de minerals diu que el que és correcte és fer un article per a cada espècie mineral aprovada per la IMA. La intenció és que el bot faci la base dels articles, i en cas de que es pugui ampliar ja ho farem nosaltres posteriorment. En cas de que no es pugui ampliar vol dir que no hi ha més informació rellevant per afegir. Pel que fa als drets d'autor, jo no hi entenc gaire, però el que proposo que faci el bot és el mateix que pot fer un usuari, la diferència és que aquest triga 30-40 minuts en escriure un article en condicions i el bot ho fa en 2 minuts, la gracia és que l'usuari es pot dedicar a fer articles que un bot no pot fer.

Paucabot (discussiócontribucions)
Pere prlpz (discussiócontribucions)

Si ens interessen aquesta mena de pàgines fetes a partir d'una taula de dades, crec que la línia no és incorporar-les a la Viquipèdia, que és un mitjà estàtic i que necessita una revisió humana article per article, sinó pujar les dades a Wikidata i contribuir al desenvolupament del Reasonator, que per poc que l'adaptéssim i s'acabés de desenvolupar ens permetria tenir de cop no només aquests cinc mil minerals (i tots els que ja tenen dades a Wikidata) sinó que de cop tindríem un projecte amb vint milions d'entrades que no tindrien res a envejar a les que podria fer un bot, i a més estarien contínuament actualitzades.

Darth vader 92 (discussiócontribucions)

No acabo d'entendre quin és el problema. El que demanem és simplement que un bot faci un article (un esborrany) per a treure'ns feina als que fem articles de minerals. Si el bot no ho pot fer l'article es farà igualment, però manualment, i llavors hi haurà dos, tres o deu usuaris creant articles de minerals sense gran rellevància en comptes d'ampliar articles de minerals o escrivint articles de qualitat de mineralogia. El tema de Viquidata el trobo bé, sempre i quan a partir de les dades de Viquidata es puguin acabar transformant en articles a la Viquipèdia.

Pere prlpz (discussiócontribucions)

Per mi, el problema és que agrinierita comença a ser un article, però les coses que fa un bot copiant dades d'una taula i farcint-les de palla en forma de text, com Belfonte, sv:Aspicilia mashiginensis o sv:Caño Castellón no són articles.

A més, quin avantatge té fer aquestes pàgines que només contenen dades en un projecte pensat per articles basats en el text com la Viquipèdia en comptes de fer-les en una base de dades com Wikidata, si a més es podrien llegir de manera automàtica amb el mateix estil de text estereotipat?

Manlleus (discussiócontribucions)

El Reasonator seria una bona eina, però no sé jo si es podria fer servir ja a diferència d'un bot, el que es busca ara és com en el projecte Monuments, que es creï l'article automàticament per a una revisió i ampliació posterior.

Paucabot (discussiócontribucions)

La diferència entre el bot dels monuments i aquest bot dels minerals és que el primer pot importar text en català, mentre que l'altre no ho pot fer. Crec que és una diferència substancial.

Darth vader 92 (discussiócontribucions)

Bé, en el cas dels minerals les dades gairebé mai són numèriques, a les webs hi ha informació sobre el color, textures, hàbits... Personalment em comprometo a corregir i modificar els articles per a que tinguin un format escaient en el cas de que es doni llum verda a la utilització de bots; suposo que en @Yuanga: també hi estarà d'acord. Corregir un article d'aquest tipus no comporta ni un 20% del temps en que es triga a fer només la infotaula. El que si que s'haurà de fer llavors és un nombre limitat d'articles creats per bot al dia, perquè es puguin corregir adequadament.

Yuanga (discussiócontribucions)

Jo també em comprometo. Potser el bot podria crear els articles només amb la infotaula com a pàgines d'usuari, i a mida que els anem ampliant i "desesborranyficant" els reanomenem i publiquem com a articles.

Yuanga (discussiócontribucions)

A banda de generar articles (o infotaules) també estaria bé tenit un pot per arreglar-ne infotaules, corregir dades, afegir classificacions... realment m'agradaria molt saber-ne!

Pere prlpz (discussiócontribucions)

A fer una pàgina amb la infotaula, categories, etc. i fins i tot una part fixa del text a l'espai d'usuari per fer un article a partir d'això no li veig cap problema. El problema seria pretendre que això és un article, que és el que jo entenia de la proposta inicial.

Darth vader 92 (discussiócontribucions)

Bé, doncs es pot fer això, un bot que escrigui en pàgines d'usuari les infotaules; a partir d'aquí que sigui l'usuari el que ampliï i modifiqui el text. El problema és que nosaltres no tenim massa idea de com funciona un bot, llavors hauriem d'aprendre'n o que algú programés un bot ja existent per a realitzar aquesta tasca. Jo personalment vaig passar-me una tarda llegint-me el manual de bots de la wikipedia i vaig començar a escriure'n un, però no va haver-hi manera de passar del segon pas.

Yuanga (discussiócontribucions)

Jo sé progamar, però amb els bots no m'hi he atrevit!

Darth vader 92 (discussiócontribucions)

Bé doncs parlava per mi doncs, jo no tinc ni idea de com funciona un bot, tampoc se programar, soc bastant desastre amb tot el tema de la informàtica, serà qüestió de posar-s'hi.

Manlleus (discussiócontribucions)

+1

Pere prlpz (discussiócontribucions)

Com a referència, la informació que ara hi ha a les infotaules dels 756 articles de minerals que tenim cap en uns 783 kilooctets (aproximadament 1k per mineral). Per posar la informació que pot anar a la infotaula de 5000 minerals (uns 5 milions d'octets) en una mida manejable, entre 10 i 20 llistes seria suficient.

Manlleus (discussiócontribucions)

A veure, jo he posat un exemple per deixar clar que hi ha prou informació per fer molts articles de minerals extensos, sinó vés a qualsevol biblioteca o llibreria catalana on trobaràs molts llibres de mineralogia i específics (per no citar ja de recursos d'altres idiomes...). Jo no sóc ningú per dir el que s'ha de fer però puc opinar, no? Exposo aquí el que penso:

No estic a favor:

  • En crear (o iniciar) articles automàtics amb NOMÉS la informació en el cos de l'article repetida en infotaula encara que sigui referenciada perquè és just lo que critica en Pere, que és informació que "podria" estar en la subllista sense necessitat d'article, el qual estic d'acord. Exemple: Els milers d'articles d'animalets que es van crear amb més/menys la informació de la infotaula també apareguda en el cos de l'article i que es va demanar esborrar i traslladar la info als articles superiors dels gèneres (lo que serien les llistes), però es va posar en marxa el Viquirepte de l'estiu 2014 per poder millorar els articles afegint informació addicional i evitar l'esborrament, per tant proposo lo següent:

Estic a favor:

  • Amb posar la informació de la infotaula que ha recollit en Pere prplz (amb les seves referències i dels minerals que falten) en les subllistes existents (per a que no siguin llistes simples) en forma de taula, de redactat o de manera semblant per a que s'enllaci millor els articles, i no quedin orfes i aïllats com passa amb els articles de les poblacions dels Estats Units (potser exemple ja típic i molest, ho sento ;-)
  • Si es compleix el punt anterior, doncs crear articles amb bots segons lo que es proposa en el primer post, amb l'avinentesa que s'afegeixi informació addicional en el cos de l'article (més informació lligada a referències). Personalment, proposo fer-ho de manera fraccionada i no "engegar" el bot de nou fins a tenir llestos els anteriors. Com s'ha fet al Repte Monuments 2015 però quedant amb els usuaris de minerals determinant la feina a fer.
  • Si l'article no compta amb prou informació arribant a un conflicte d'admissibilitat, perquè directament no s'ha estudiat prou o no està disponible, doncs es decideix només tenir la informació existent en la llista o articles relacionats.

Què en penseu?

Aviso, que igualment, amb bot o sense, s'acabaran realitzant aquests articles, però proposo a que ho fem d'aquesta manera, més ordenat, sense haver de realitzar esforços posteriors, no donar més feina a mantenidors d'articles, estalviar feina als mineròlegs viquipedistes i per a que més gent puguin donar un cop de mà. M'ofereixo a ajudar si cal. Salutacions!

Pere prlpz (discussiócontribucions)

D'acord amb en Manlleus. Les feines automàtiques o esquemàtiques estan molt bé quan serveixen per fer una base que algú al cap de poc convertirà en un article, i per això cal anar al ritme que es pugui assumir a mà. El problema és quan es creen milers de traduccions automàtiques, pseudo-articles robotitzats o esborranys d'animals, que després no s'arreglen ni a base de viquireptes.

Darth vader 92 (discussiócontribucions)

Sí, totalment d'acord, des d'un principi es va dir que en cas de que es creessin els articles amb bot, aquests s'haurien de corregir i ampliar dia a dia o setmana a setmana. El que es podria intentar fer és uns 70 articles per setmana (10 per dia) que entre 2, 3 o 4 persones corregint i ampliant periòdicament surten a 2 o 3 articles per dia i persona. Proposo fer una espècie de projecte en dues fases; la primera on es facin 10 articles per dia, amb els minerals menys rellevants, que agradi o no, com a molt arribaran als 1500-2000 octets comptant la infotaula ja que no hi ha tanta informació enciclpèdica per ampliar-los gaire més; la segona tongada por ser de 5 articles per dia; aquí es farien els minerals de mitja rellevància; aquests segurament ocuparan entre 2000 i 8000 octets, i se'n farien menys perquè es puguin ampliar sense problema. Finalment, els minerals més rellevants que encara no tenen article, s'haurien de fer a mà del principi al final. Si tots estem d'acord, com a mínim en les coses bàsiques, ara només queda decidir el tema del bot, com es fa, qui el fa, n'agafem un de creat...

Manlleus (discussiócontribucions)

Si esteu d'acord, doncs per fer les Fases 1 i 2, cal fer primer la Fase 0, que és enllaçar els possibles/futurs articles. Tenim Llista general de minerals, Llista per classe i Llista alfabètica per lletres: ABCDEFGHIJKLMNOPQRSTUVWXYZ La pregunta és com ho fem per colar tota aquesta informació ''base" a dins, abans de pensar en bots? Tenim la llista d'en Pere com a base però s'haurà de transformar una "mica" per a que sembli wiki-acceptable. Crec que la taula (>10) amb tants camps podria no ser acceptable (ja per estil), seria millor fer subseccions amb el nom del mineral, i a dins introducció curta o resum+fotografia (si n'hi ha)+informació restant de la infotaula en plan redactat+referències(1 o 2 generalitzadores). Això, per a tots els minerals excepte els que hi hagi poca informació que restarà tot en la secció corresponent. S'ha de tenir en compte, que hi ha varietats i minerals no acceptats. Però bé, seria una manera, mirant quina seria la millor, us podeu passar per alguna de les llistes de qualitat per prendre'n idees.

Pere prlpz (discussiócontribucions)

La llista de Usuari:PereBot/paràmetres plantilles/Infotaula de mineral no pretenia ser un esborrany d'article sinó només una manera de saber què tenim. Ara bé, suposo que no costaria gaire endreçar-la per acabar tenint una llista/taula presentable de l'estil de les llistes de monuments. De tota manera, la gràcia no hauria de ser tenir una llista amb el que ja tenim a les infotaules sinó incorporar-hi el que no hi tenim, i no veig gaire clar que sigui fàcil llegir amb bot una pàgina com http://www.mindat.org/min-2013.html , que tot i ser una fitxa la major part de les dades són text en anglès que no es deu repetir en altres pàgines. A priori, diria que tot el que es pot fer automàticament amb aquestes dades és preparar una taula o una infotaula mig en anglès perquè algú la tradueixi després quan faci l'article.

Yuanga (discussiócontribucions)

Em sembla que no he entès el que vols dir @Manlleus. Què vols dir amb "colar la informació base"?

Les llistes de minerals de la viquipèdia (la llista general i les llistes de cada lletra) ja exclouen les varietats i els minerals no acceptats.

Manlleus (discussiócontribucions)

Em referia a posar la informació de cada mineral (introducció+fotografia+informació restant de la infotaula en plan redactat+referències) en la seva corresponent subsecció en les llistes.

Sobre els minerals no acceptats caldria posar-ho també, com ho fan en la llista de la wiki castellana.

Darth vader 92 (discussiócontribucions)

Personalment crec que els minerals no acceptats per la IMA no haurien de tenir article a Viquipèdia. Qualsevol de nosaltres pot publicar demà 25 articles amb "nous" minerals que només són minerals existents amb lleugers canvis químics. En aquest cas la IMA no ho acceptaria, llavors no te gaire lògica que tinguin article a la Viquipèdia, no? A la Wiki castellana ho posen?

Manlleus (discussiócontribucions)

No parlo que hagin de tenir article, sinó que són llistats o citats en el wiki, igual que en l'article de cadascun dels minerals que estiguin relacionats, per exemple l'adularia o la valencianita que vé de l'Ortosa

Darth vader 92 (discussiócontribucions)

D'acord, t'estàs referint a un llistat de varietats, no? Això podria estar bé, però no conec cap base de dades ni cap llistat complet per a fer-ho. He donat un cop d'ulla la wiki castellana i realment tenen una mica de desordre amb el tema dels "minerals no acceptats", allà hi tenen posades varietats, minerals desacreditats, roques... és un calaix de sastre, i a més a més els hi falten la gran majoria de varietats. Posats amb el tema del bot; es podria fer una llista amb el bot sobre les diferents varietats?; crec que en el Mindat surten les varietats a les mateixes pàgines dels minerals.

Paucabot (discussiócontribucions)

Crec que potser podríem mirar de tancar aquest fil i migrar tota aquesta discussió a un altre lloc, com per exemple a Viquiprojecte:Minerals, on es podria explicar el projecte i anar-lo perfilant, tot usant la pàgina de discussió.

Manlleus (discussiócontribucions)

Com vulguis però no en veig el motiu. Jo enllaçaria la discussió i punt.

Paucabot (discussiócontribucions)

D'acord. Quan deia migrar aquesta discussió no em referia al que ja hem discutit sinó al que encara queda per discutir.

Manlleus (discussiócontribucions)

Bé, doncs seguint el suggeriment d'en Paucabot he iniciat el fil a la discussió del Viquiprojecte. Aniria bé tenir una discssió tipus Flow allà també però no sé com fer-ho.

Resposta a «Bot per articles de minerals»