Tema de Viquipèdia:La taverna/Ajuda

Evolució del nombre d'articles de la Viquipèdia

8
Jordiventura96 (discussiócontribucions)

Bon vespre,

Estic intentant actualitzar el següent fitxer, que mostra el nombre d'articles de la Viquipèdia en català al llarg del temps:

Fitxer:Articles a la Viquipèdia en català.svg

En el seu moment vaig extreure les dades en format csv d'alguna pàgina, però ara mateix no la trobo. Algú em sabria dir algun lloc d'on pugui extreure les mateixes dades actualitzades? Moltes gràcies

Xavier Dengra (discussiócontribucions)

Tirant d'hemeroteca, que crec que mai havíem fet una llista tan detallada:

  1. Primer article: 17 de març de 2001, àbac
  2. 1.000 articles: 8 de març de 2003, desconegut
  3. 7.000 articles: 7 de juliol de 2004, desconegut
  4. 8.000 articles: 19 de setembre de 2004, desconegut
  5. 10.000 articles: 16 de novembre de 2004, desconegut
  6. 15.000 articles: 21 de juny de 2005, desconegut
  7. 18.000 articles: 21 de setembre de 2005, desconegut
  8. 20.000 articles: 19 de novembre de 2005, desconegut
  9. 25.000 articles: 14 de febrer de 2006, desconegut
  10. 30.000 articles: 6 de maig de 2006, lunitari
  11. 40.000 articles: 20 de setembre de 2006, enginyeria d'aliments
  12. 50.000 articles: 4 de gener de 2007, lesbianisme o mar de fons (disputat)
  13. 75.000 articles: 31 d'agost de 2007, Eutidem (filòsof)
  14. 100.000 articles: 18 de gener de 2008, arrel cúbica
  15. 115.000 articles: 30 d'abril de 2008, desconegut
  16. 120.000 articles: 13 de juliol de 2008, desconegut
  17. 125.000 articles: 12 d'agost de 2008, desconegut
  18. 130.000 articles: 10 de setembre de 2008, desconegut
  19. 140.000 articles: 7 de novembre de 2008, desconegut
  20. 150.000 articles: 28 de desembre de 2008, desconegut
  21. 170.000 articles: 7 d'abril de 2009, desconegut
  22. 180.000 articles: 13 de juny de 2009, desconegut
  23. 190.000 articles: 1 d'agost de 2009, desconegut
  24. 200.000 articles: 21 de setembre de 2009, Carnaval de Solsona
  25. 250.000 articles: 29 de juny de 2010, Mare de Déu del Claustre
  26. 300.000 articles: 22 de desembre de 2010, desconegut
  27. 350.000 articles: 25 agost 2011, Campanar d'Isanta
  28. 400.000 articles: 12 d'abril de 2013, Heli-4
  29. 450.000 articles: 3 de febrer de 2015, desconegut
  30. 500.000 articles: 11 de març de 2016, Oda Krohg
  31. 600.000 articles: 6 de gener de 2019, Pura Velarde
  32. 700.000 articles: 24 d'abril de 2022, Hey, Hey Rise Up!

A {{Viquipèdia en català}} està ordenat numèricament al gràfic en només alguns casos, però crec que en aquesta llista que et passo he traçat més exhaustivament algunes xifres i el nom dels articles en qüestió, per si els vols afegir.

A veure si algú més pot ajudar a aportar més llum sobre altres xifres o el nom dels articles en qüestió d'alguna de les fites que manquen!

Xavier Dengra (discussiócontribucions)

Estaria bé una pàgina en què un bot anés apuntant els números rodons cada 5.000 o 10.000 articles, de manera que en sapiguem el nom, dia i autor. Ens permetria fer bones regressions numèriques sobre el ritme de progrés (indicatiu de la participació o de la prioritat de la comunitat) i com a memòria històrica interna.

Xavier Dengra (discussiócontribucions)
Leptictidium (discussiócontribucions)
Pere prlpz (discussiócontribucions)

@Jordiventura96 M'imagino que la pàgina d'on vas treure les dades originals era https://stats.wikimedia.org/CA/TablesWikipediaCA.htm o una de relacionada, però no s'actualitza des del 2018.

Per treure els articles amb números rodons, "només" caldria baixar tots els articles amb la seva data de creació, ordenar-los i comptar-los. Ara bé, compte que segurament no sortiria el mateix que es va comptar a mà en el seu moment, encara que només sigui pels articles esborrats o pels articles que no eren articles (redireccions, per exemple), que ara ho són.

Jordiventura96 (discussiócontribucions)
Jordiventura96 (discussiócontribucions)

Ja he penjat una versió actualitzada del fitxer. Aprofito per adjuntar a aquest missatge el codi Matlab que he utilitzat per crear la gràfica, per si pot ser de servei.


close all

A = readtable('undefined.csv');

n=[];

i=1;

m=size(A(:,1));

s="";

s2="";

while i<=m(1)

    b=table2struct(A(i,3));

    c=strsplit(b.Var3,',');

    d=c(2);

    ni=str2double(d);

    n=[n,ni];

    s=append(s,num2str(ni),',');

    i=i+1;

end

t=2001:1/12:2023+1/12;

j=1;

while j<=length(t)

    s2=append(s2,num2str(t(j)),",");

    j=j+1;

end

figure

h=plot(t,n,'LineWidth',1.2);

grid on

xlabel('Any')

ylabel('Nombre d''articles')

title('Evolució del nombre d''articles a la Viquipèdia en català')

yticks([0 1 2 3 4 5 6 7 8]*100000)

yticklabels({'0','100k','200k','300k','400k','500k','600k','700k','800k'})

ax = gca;

ax.YAxis.Exponent = 0;

set(gcf,'color','w');

xlim([2001 t(end)])

r=[1000,10000,20000,50000,100000,250000,500000,600000,700000];

j=1;

while j<=length(r)

    hold on

    plot(t(sum(n<r(j))+1),n(sum(n<r(j))+1),'ro','MarkerSize',7)

    disp(t(sum(n<r(j))+1))

   j=j+1;

end

Resposta a «Evolució del nombre d'articles de la Viquipèdia»