Obre el menú principal

International Internet Preservation Consortium

L'International Internet Preservation Consortium (Consorci Internacional per a la Preservació d'Internet) és una organització internacional formada per biblioteques nacionals i universitàries, arxius, museus i institucions de patrimoni cultural i de recerca d'arreu del món, dedicada a promoure la col·laboració internacional per tal de preservar el coneixement i la informació continguda a Internet i fer-la accessible a les futures generacions, fomentant el desenvolupament i ús d'eines, tècniques i estàndards comuns que permetin la creació d'arxius internacionals i recolzant a les biblioteques nacionals dels diferents països per afrontar l'arxivament web i llur preservació.[1]


HistòriaModifica

L'Internacional Internet Preservation Consortium (IIPC) va ser oficialment constituït el juliol de 2003 amb la participació de 12 institucions, entre elles l'Internet Archive i onze biblioteques nacionals liderades per la Biblioteca Nacional de França, arran de l'intercanvi d'opinions i experiències que van tenir lloc als Tallers de l'anteriorment anomenada Conferència Europea sobre Biblioteques Digitals (ECDL) de 2001 i 2002.[2]

Els primers tres anys es va limitar l'accés a nous socis per poder crear unes eines mínimes amb les quals treballar, participant i finançant conjuntament projectes que els permetessin assolir els seus objectius.[3] A partir del 2006 es va permetre l'accés a nous membres i el nombre ha anat creixent de mica en mica fins a arribar als 49 que hi ha actualment.[4]

MembresModifica

Hi ha organitzacions de més de 25 països:

Biblioteques i arxius nacionalsModifica

Biblioteques i Organitzacions sense ànim de lucreModifica

  • Internet Archive
  • Arxiu Web Portuguès
  • Biblioteca d'Alexandria
  • Internet Memory Foundation
  • National Film Board of Canada

Biblioteques universitàries i de recercaModifica

  • Biblioteca de la Universitat Harvard
  • Biblioteca de Recerca del Laboratori Nacional de Los Alamos
  • Biblioteca Digital de Califòrnia
  • Biblioteques de la Universitat de Colúmbia
  • Biblioteques de la Universitat de North Texas
  • Biblioteca de la Universitat de Stanford
  • Biblioteques de la Universitat George Washington
  • Departament de Ciències de la Computació de la Universitat Old Dominion

Proveïdors de serveisModifica

FuncionamentModifica

El Consorci treballa a dos nivells. Per una banda, en grups de treball dirigits per un dels membres, on els diferents col·laboradors aporten la seva experiència per seguir avançant en l'arxivament web i, per l'altra, en projectes tècnics, educatius o de recerca i desenvolupament específics, basats en els objectius plantejats per l'IIPC i que impliquen com a mínim a dos membres, mitjançant el seu finançament o intercanviant dades i eines de prova.[5]

El Comitè Directiu del Consorci és l'encarregat d'aprovar els objectius estratègics dels grups de treball, donar suport als projectes i atorgar-los finançament, i també de fer el seguiment dels seus progressos.

Grups de treballModifica

Cada grup de treball està centrat en un aspecte diferent de l'arxivament web.[6] Actualment n'hi ha tres:

Grup de treball de recollidaModifica

Es dedica al desenvolupament de tècniques de captura del web, especialment del rastrejador web (web crawler) de software lliure Heritrix de l'Internet Archive,[7] i a desenvolupar nous cercadors intel·ligents que millorin la recollida tant de la web profunda, com de vídeos, com de mitjans de comunicació en streaming.

Grup de treball d'accésModifica

Es centra en totes les qüestions relacionades amb l'accés als arxius web, tant d'investigació tècnica i desenvolupament com de temes legals, ètics i econòmics, així com de l'accés als arxius web per part dels usuaris finals, les administracions i els curadors digitals.

Grup de treball de preservacióModifica

Es concentra en les polítiques, pràctiques i recursos que donen suport a la preservació del contingut i accessibilitat dels arxius web, tenint en compte que hi podria haver nous productes digitals en un futur que també haurien d'ésser arxivats o característiques especials d'arxius web que podrien necessitar enfocaments diferents.

A més, treballa en la recomanació i millora d'eines, guies pràctiques i normes de preservació per a la seva implantació en institucions relacionades amb l'arxivament web.

ProjectesModifica

Projectes actualsModifica

  • Memento: Pretén mostrar els recursos web del passat tal com eren en aquell moment d'una manera tan senzilla com ho és accedir al Web d'ara, oferint una versió del recurs en la data que es vulgui només posant l'adreça HTTP a la barra del cercador i la data desitjada. Per aconseguir-ho s'han d'afegir les metadades als arxius web per fer-los més recognoscibles als rastrejadors.[8]
  • Patrocini d'estudis de doctorat: És una beca de tres anys que dona suport als estudis de doctorat del Programa de Ciències de la Informació Interdisciplinàries, amb pràctiques a les biblioteques de la Universitat de North Texas i a l'Internet Archive i participant en les activitats del Consorci, amb l'objectiu de fomentar i entrenar acadèmicament les capacitats dels futurs investigadors per als múltiples reptes que planteja la preservació i l'arxivament web.
  • Intercanvis de personal: Té per objectiu que els membres de l'IIPC que encara usen el rastrejador web Heritrix 1 puguin rebre assessorament expert, assistència i orientació en el procés de migració cap al rastrejador Heritrix 3 amb estades de dues setmanes en altres institucions membres que ja l'utilitzin. Es tracta de mostrar-los la millor manera d'afrontar-ho, el temps que pot durar i quines dificultats poden sorgir en el camí.
  • Estadístiques i Indicadors de qualitat per a l'arxivament web: S'estan elaborant unes directius per a la gestió i l'avaluació de les activitats i productes de l'arxivament web.

Projectes anteriorsModifica

  • Eines per a l'arxivament web: Són eines desenvolupades en codi obert que permeten als enginyers de rastreig, arxivers web, investigadors i d'altres usuaris explorar les col·leccions contingudes en els arxius web gràcies a l'adopció del format Web ARChive (WARC),[9] llençat oficialment com la norma ISO 28500:2009, per emmagatzemar i conservar els documents recol·lectats a la web.
  • Twittervane: És un prototip d'aplicació capaç d'analitzar Twitter per esbrinar quins llocs web són compartits amb més freqüència entre els seus usuaris en un determinat període i considerar així el seu arxivament, estalviant molt temps als curadors web.[10]
  • Crowdsourcing: Tractava d'esbrinar com es pot equilibrar la disparitat tan gran que s'ha produït entre la gent involucrada en desenvolupar la web i la manca de personal en les institucions implicades en l'arxivament mitjançant activitats de col·laboració oberta que augmentin la mà d'obra disponible en les diferents etapes del flux de treball de l'arxivament web de les institucions membres.
  • JHoNas: L'objectiu general del projecte era millorar les eines existents per tal de facilitar l'adaptació de WARC com el format d'arxiu preferit per a la preservació digital. Es van escollir dues aplicacions per tal de cobrir tot el flux de treball de preservació digital: JHOVE2 i NetarchiveSuite.

ReferènciesModifica

  1. «Missió» (en anglès). [Consulta: 21 març 2015].
  2. «2nd ECDL Workshop on Web Archiving 2002» (en anglès). [Consulta: 30 març 2015].
  3. Lupovici, Catherine. «[http://archive.ifla.org/IV/ifla71/papers/194e-Lupovici.pdf Web archives long term access and interoperability: the International Internet Preservation Consortium activity]». 71tn IFLA General Conference and Council, 2005. [Consulta: 30 març 2015].
  4. «Membres» (en anglès). [Consulta: 21 març 2015].
  5. «Projectes» (en anglès). [Consulta: 21 març 2015].
  6. «Grups de treball» (en anglès). [Consulta: 21 març 2015].
  7. «Heritrix» (en anglès). [Consulta: 5 abril 2015].
  8. «Memento Project». [Consulta: 4 abril 2015].
  9. «WARC». Library of Congress. [Consulta: 4 abril 2015].
  10. «Twittervane: Crowdsourcing selection». UK Web Archive blog, 02-12-2011. [Consulta: 5 abril 2015].

Enllaços externsModifica