Usuari:Xxxmarcxxx/proves

Format (Preservació Digital)

Un format és una codificació estructurada de dades per a la seva gestió i representació per mitjà de software informàtic. Tot i existir-hi altres definicions alternatives, la més recent i fidel al camp de la preservació digital va ser elaborada pel Grup de Treball de PREMIS:

“Es una estructura preestablerta i específica per l’organització d’un fitxer, una cadena de bits o una cadena d’arxius[1]

Tipologies de Formats

modifica

Tot i que actualment existeixen milers de formats en el món, s’ha intentat des de fa anys establir una classificació genèrica dels formats segons la seva tipologia, tot i que encara no s’ha arribat a un consens acadèmic sobre una d'única. Existeixen, això si diferents projectes per dur a terme la correcta identificació de tots els formats existents, com el United Kingdom Digital Curation Centre’s Representation Information Registry[2], la Global Digital Format Registry[3], o PRONOM[4], entre altres. Tot i aquesta disparitat de projectes, es poden identificar 3 tipologies bàsiques, o comunament emprades, de formats, a més d’una última centrada específicament en la preservació digital de documents a llarg termini.

Esquemes de tipologies de formats

modifica

Per Gènere

modifica

La tipologia per gènere permet agrupar els formats en tretze grans categories que serveixen perquè siguin ordenats amb facilitat per diferents tipus d'audiències encara que aquestes no estiguin familiaritzades amb el món de la informàtica.Un dels seus principals promotors és la National Library of Australia[5], que està dissenyant en la actualitat una base de dades col·laborativa on pér mitjà d'aquest tipologia genèrica ajuda als usuaris a identificar els diferents tipus de formats d'arxiu.

  • General: gamma àmplia de materials
  • Documents d'arxiu i correus electrònics
  • Materials audiovisuals
  • Art digital i literatura electrònica
  • Jocs digitals, realitat virtual i programari
  • Manuscrits digitals
  • Imatges
  • Materials miscel•lanis
  • Recursos web i d'informació en línia
  • Materials digitals en suports físics
  • Dades científiques, estadístiques i d'investigació
  • Dades geoespacials i semblants
  • Recursos de notícies i d'una altra informació d'actualitat

Per suport

modifica

La tipologia de format per suport es de les més emprades popularment, sobre tot en el camp de la informàtica. És la tipologia més comuna de classificació de formats, on s'identifiquen els fitxers en funció de l'extensió d'arxiu i es determina d'aquesta manera al grup al que pertanyen.

Per propòsit

modifica

La tipologia per propòsit, proposada principalment pel Projecte DELOS i la Digital Preservation Coalition[6] va elaborar la tipologia de formats segons el objectiu o funció que els arxius tenien alhora de ser emprats.

  • Document o similar a un document (o "document-like")
  • Imatges
  • So
  • Imatges en moviment
  • Dades en brut
  • Gràfics estructurats
  • Bases de dades
  • Col•leccions
  • Configuració i metadada

Per gestió a llarg termini

modifica

Aquesta es la tipologia més important quan es tracten els formats des de la perspectiva de la preservació digital. Tot i que en la actualitat molt del programari existent es desenvolupa amb la capacitat de ser compatible amb arxius de versions anteriors, permetent així un cert grau de interoperabilitat entre programes, la opció més segura per garantir l’accés a les dades d’un arxiu a llarg termini és convertir dita informació en un format estàndard que segui interpretable per la major quantitat de programes possibles, fent-lo així més apte per ser processat amb la mínima pèrdua d’informació. La United Kingdom Data Archive ha dissenyat[7] amb aquest objectiu una sèrie de recomanacions referents als formats de dades i programari més adequats per preservar la informació que contenen.

Tipus de Dada Formats d'arxiu recomanats per compartir, editar i preservar a llarg termini
Dades quantitatives amb metadades extensives. Conjunt de dades amb etiquetes variables, etiquetes codificades i amb valors absents definits, a més a més de les matrius de dades SPSS format portable(.por. Arxiu de comandament ('setup') i text delimitat (SPSS, Stata, SAS,etc.)que conte informació de metadades arxiu. també pot contenir parcial o totalment text amb informació de metadades, com per exemple un arxiu DDI XML
Dades quantitatives amb metadades mínimes. Matriu de dades amb o sense encapçalaments de columna o noms variables però sense cap altre metadada o etiquetatge Arxius amb valors separats per comes (.csv)Arxius delimitats (.tab), incloent text delimitat d'un donat conjunt de caracters amb instruccions de definició de dades SQL si escau
Dades geoespacials. Dades de 'Vector' i 'Raster' ESRI Shapefile (essencialment: .shp, .shx, .dbf; optional: .prj, .sbc, .sbn), Geo-referenciat TIFF (.tif, .tfw), Dades CAD (.dwg) i dades d'atributs GIS tabulats
Dades Qualitatives. Textuals Text amb llenguatge 'eXtensible Mark-up'(XML)d'acord amb un apropiat tipus de document (DTD) o es esquema (.xml). Format de Text enriquit (.rtf). Dades de text pla, ASCI (.txt)
Dades d'Imatge Digital TIFF versió 6 sense comprimir (.tif)
Dades d'Àudio Digitals Còdec d'àudio lliure sense pèrdua (FLAC) (.flac)
Dades de Vídeo Digital MPEG-4 (.mp4), motion JPEG 2000(.jp2)
Documentació Format de text enriquit (.rtf), PDF/A o PDF (.pdf), Text OpenDocument (.odt)

Vegeu també

modifica

Referències

modifica

Bibliografia

modifica
  • Giralt, Olga; Alòs-Moner, Adela «PREMIS Workshop en Roma». El profesional de la información, 18, 4, Julio-Agosto 2009.

Enllaços externs

modifica
  • [1] Digital Preservation Coalition (anglès)
  • [2] Digital Curation Center (anglès)
  • [3] Digital Preservation and Records Management Programs (anglès)
  • [4] The National Archives, UK (anglès)
  • [5] PLANETS (Preservation and Long-term Acces through Networked Services) (anglès)
  • [6] NESTOR (Network of Expertise in Long-Term Storage of Digital Resources) (anglès)