archive.today (abans archive.is) és un lloc web que emmagatzema instantànies de pàgines web.[1] Recupera una pàgina de manera similar a WebCite, de menys de 50 MB cadascuna, però amb suport per a llocs pesants de JavaScript com Google Maps i aplicacions web com Twitter.

Infotaula de lloc webArchive.today
URLhttps://archive.is/, https://archive.ph/, https://archive.vn/, https://archive.fo/, https://archive.md/, https://archive.li/, http://archiveiya74codqgiixo33q62qlrqtkgmcitqx5u2oeqnmn5bpcbiyd.onion/ i https://archive.today/ Modifica el valor a Wikidata
Tipuslloc web, arxiu web i extensió del navegador Modifica el valor a Wikidata
Llenguamúltiples llengües Modifica el valor a Wikidata
Llançament16 maig 2012 Modifica el valor a Wikidata
EstatTxèquia Modifica el valor a Wikidata
Rànquing Alexa9.725 (15 juny 2021)
277.525 (15 juny 2021)
17.117 (15 juny 2021)
55.370 (15 juny 2021)
46.722 (15 juny 2021)
112.690 (15 juny 2021)
246.870 (15 juny 2021) Modifica el valor a Wikidata
Blog oficialhttps://blog.archive.today/ Modifica el valor a Wikidata
Twitter (X): archiveis Modifica el valor a Wikidata

Archive.today registra simultàniament dues "instantànies" diferents d'una pàgina web. Una és la "pàgina web" que inclou els enllaços en viu funcionals que es troben a l'original. L'altra és "captura de pantalla" que proporciona una visualització estàtica i no interactiva de la representació.[2]

Característiques modifica

Funcionalitat modifica

Archive.today pot capturar pàgines individuals en resposta a peticions explícites de l'usuari.[3][4][5] Des del seu inici, Arxiu. Avui és compatible amb el rastreig de pàgines amb URL que contenen un fragment de hash-bang obsolet (#!).[6]

Archive.today només registra text i imatges, excloent el vídeo, XML, RTF, full de càlcul (xls o ods) i altres continguts no estàtics. Realitza un seguiment de l'historial de les instantànies desades, retornant a l'usuari una sol·licitud de confirmació abans d'afegir una nova instantània d'una adreça d'Internet ja desada.[7]

Les pàgines es capturen amb 1024 píxels d'amplada del navegador. CSS es converteix en CSS en línia, eliminant el disseny web responsiu i selectors com :hover i :active. El contingut generat amb JavaScript durant el procés de rastreig apareix en estat congelat.[8] Els noms de classes HTML es conserven dins de l'atribut old-class.

Quan se selecciona el text, una miniaplicació JavaScript[Cal aclariment] genera un fragment d'URL vist a la barra d' URL del navegador que ressalta automàticament aquesta part del text quan es torna a visitar.

Les pàgines web no es poden duplicar des de archive.is a web.archive.org com a còpia de seguretat de segon nivell, ja que archive.is exclou Wayback Machine i no desa les seves instantànies en format WARC. El contrari —de web.archive.org a archive.is— és possible,[9] però la còpia sol trigar més temps que una captura directa. Alguns llocs web se suprimeixen de les llistes d'Internet Archive de manera retroactiva o es bloqueja la possibilitat de desar-los a causa del seu fitxer robots.txt, però Archive.today no l'utilitza. 

La barra d'eines d'investigació permet operadors de paraules clau avançades, utilitzant * com a caràcter comodí. Un parell de cometes davant de la recerca d'una seqüència exacta de paraules clau presents en el títol o en el cos de la pàgina web, mentre que els restringeix operador insisteix a un domini específic d'Internet.[10]

Un cop arxivada una pàgina web, cap usuari d'Internet no la pot eliminar directament.[11]

Mentre es desa una llista dinàmica, la cerca a archive.today només mostra un resultat que enllaça la secció anterior i la següent de la llista (per exemple, 20 enllaços per a la pàgina).[12] La resta de pàgines web desades es filtren i, de vegades, es poden trobar per alguna de les seves ocurrències. 

La funció de cerca està recolzada per Google CustomSearch. Si no proporciona resultats, archive.is intenta utilitzar Yandex Search

Si ja s'ha arxivat una pàgina, archive.is demana a l'usuari que confirmeu l'arxiu d'una nova revisió, en lloc d'arxivar-la immediatament. 

Mentre es carrega una pàgina, es mostra una llista d'URL a elements de pàgina individuals entre les mides de contingut, els estats HTTP i els tipus MIME. Aquesta llista només es pot visualitzar durant el procés de rastreig. 

Es poden descarregar pàgines arxivades com a fitxer ZIP, excepte les pàgines arxivades des del 29 de novembre de 2019, quan Archive Today va canviar el motor del seu navegador de PhantomJS a Chromium.[13]

Des del juliol de 2013, archive.today admet la interfície de programació d'aplicacions (API) de Memento Project. [14][15]

Història modifica

Archive.today es va fundar el 2012. El lloc es va denominar originalment archive.today, però el maig del 2015 va canviar el mirall principal a archive.is.[16]

Al gener de 2019, va començar a depreciar el domini archive.is en favor del mirall archive.today.

Disponibilitat a tot el món modifica

Austràlia modifica

El març del 2019, diversos proveïdors d'internet australians van bloquejar el lloc durant sis mesos després dels trets de la mesquita de Christchurch, en un intent de limitar la distribució de les imatges de l'atac.[17][18]

Segons GreatFire.org, archive.today està bloquejat a la Xina des del març del 2016,[19] archive.li des del setembre del 2017,[20] i archive.fo des del juliol del 2018.[21]

Finlàndia modifica

El 21 de juliol de 2015, els operadors van bloquejar l'accés al servei de totes les adreces IP finlandeses, afirmant a Twitter que ho van fer per evitar escalar una disputa que presumptament tenien amb el govern finès.[22]

Rússia modifica

A Rússia, només és possible l'accés HTTP; Les connexions HTTPS estan bloquejades.[23][24]

Arreu del món modifica

Archive.today bloqueja actualment les sol·licituds del resolutor DNS recursiu de Cloudflare , 1.1.1.1. Archive.today insisteix que els resolutors de DNS recursius inclouen la geolocalització de l'usuari que fa la cerca de DNS. Per motius de privadesa, Cloudflare no inclou específicament la geolocalització de l'usuari que fa la sol·licitud. Com a resultat, els servidors DNS archive.today retornen intencionadament respostes no vàlides quan el resoledor de DNS recursiu de Cloudflare ho consulta.[25]

Referències modifica

  1. Brinkmann, Martin. «Create publicly available web page archives with Archive.is». Ghacks, 22-04-2015. Arxivat de l'original el 12 d’abril 2019. [Consulta: 13 juny 2015].
  2. Brunelle, Justin F.; Kelly, Mat; Weigle, Michele C.; Nelson, Michael L. International Journal on Digital Libraries, 17, 2, 25-01-2015, pàg. 95–117. DOI: 10.1007/s00799-015-0140-8.
  3. Dascalescu, Dan. «Web page archiving – Dan Dascalescu's Wiki (review)». Wiki.dandascalescu.com, 18-02-2013. Arxivat de l'original el 22 setembre 2013. [Consulta: 3 octubre 2013].
  4. Koebler, Jason. «Dear GamerGate: Please Stop Stealing Our Shit». Motherboard, 29-10-2014. Arxivat de l'original el 27 maig 2019. [Consulta: 22 març 2017].
  5. «archive.is/faq» (en anglès). archive.is. [Consulta: 15 febrer 2019].
  6. «Home page of Archive.is in 2013». Arxivat de l'original el 12 gener 2013.
  7. «Example snapshot history on archive.is».
  8. JavaScript-generated loading animation of Dailymotion video appearing in a frozen state
  9. «Exemple: Pàgina desada del Web Archive a Archive.is». Arxivat de l'original el 20 de maig 2013. [Consulta: 23 octubre 2019].
  10. For example, the string insite: {{format ref}} https://en.wikipedia.org "World Cup" returns the "World+Cup"/ related snapshots
  11. «Some Frequently Asked Question». archive.is blog, 24-01-2013. Arxivat de l'original el 26 setembre 2013. [Consulta: 12 novembre 2018].
  12. «Example of dynamic list retrieved by Worldcat».
  13. «Archive.is blog», 17-07-2020. Arxivat de l'original el 3 octubre 2020.
  14. Nelson, Michael L. «Archive.is Supports Memento». Research and Teaching Updates. Web Science and Digital Libraries Research Group at Old Dominion University, 09-07-2013. Arxivat de l'original el 27 juliol 2013. [Consulta: 17 setembre 2013].
  15. «archive.is». Memento Protocol Information. Memento Development Group. Arxivat de l'original el 15 setembre 2013. [Consulta: 17 setembre 2013].
  16. «Why did you change the URL back from archive-today to archive-is?». Archive.is Blog, 03-05-2015. Arxivat de l'original el 1 juny 2015. [Consulta: 6 gener 2019].
  17. «ISPs in AU and NZ start censoring the internet without legal precedent». Private Internet Access, 19-03-2019. Arxivat de l'original el 28 d’abril 2023. [Consulta: 20 març 2019].
  18. «New Zealand ISPs Say They're Blocking Sites That Fail To Remove Christchurch Shooting Video». Gizmodo Australia, 19-03-2019. Arxivat de l'original el 18 maig 2019. [Consulta: 20 març 2019].
  19. «archive.is is 100% blocked in China». GreatFire Analyzer, 12-08-2018. Arxivat de l'original el 12 agost 2018.
  20. «archive.li is 100% blocked in China». Great Fire Analyzer, 12-08-2018. Arxivat de l'original el 12 agost 2018.
  21. «archive.fo is 100% blocked in China». Great Fire Analyzer, 12-08-2018. Arxivat de l'original el 12 agost 2018.
  22. Lapintie, Lassi. «Suomalaisilta estettiin haktivistien suosimalla verkkosivulla käynti» (en finès). Iltalehti, 22-07-2015. Arxivat de l'original el 27 maig 2019. [Consulta: 4 març 2016].
  23. Elistratov, Vladimir. «Roskomnadzor zablokiroval servis archive.is, khranyashchiy kopii veb-saytov» (en rus). TJournal, 29-01-2016. Arxivat de l'original el 30 agost 2017. [Consulta: 30 gener 2016].
  24. Cushing, Tim. «Russia Blocks Another Archive Site Because It Might Contain Old Pages About Drugs». Techdirt, 04-02-2016. Arxivat de l'original el 23 març 2019. [Consulta: 26 febrer 2016].
  25. [enllaç sense format] https://news.ycombinator.com/item?id=19828702

 

Vegeu també modifica

Enllaços externs modifica