Migració de dades: diferència entre les revisions

Contingut suprimit Contingut afegit
Cap resum de modificació
Cap resum de modificació
Línia 8:
; Migració sobre la demanda: Es tracta de separar el codi binari del seu entorn i suport original en el moment en què es diposita el recurs i guardar el conjunt de [[metadades]] tècniques que especifiquen com s'han de migrar a altres entorns:<ref>{{Ref-web|url = http://www.ukoln.ac.uk/metadata/cedars/|títol = Guia Cedars sobre Preservació de Metadades|consulta = 25/03/2015|llengua = Anglès|editor = |data = }}</ref> Aquesta estratègia permet concentrar els esforços i recursos en els documents que generen una major demanda entre els usuaris i evita realitzar migracions periòdiques de tota la col·lecció, ja que es conserva el codi binari original i les metadades tècniques de cada document per separat.
 
; Migració a un format estàndard: Aquesta tècnica es refereix a la conversió del document original a un [[estàndard tècnic]], preferentment a un [[format obert]] com per exemple [[XML]] o [[PDF]], amb una previsió de vida útil més alta.:
: Formats de migració més comuns<ref>{{Ref-web|url = http://ccdoc-automatizacion.blogspot.com.es/2014/03/la-migracion-de-datos-exportacion-e.html|títol = Automatización de unidades de información|consulta = 12/4/2015|llengua = |editor = Blázquez Ochando, Manuel|data = 2014}}</ref>:
:* .CSV (''Comma-separated values''): molt senzill, permet representar les dades en forma de taula, i això fa que s'adapti a la tipologia de bases de dades i especificacions de cada camp independentment de la seva naturalesa numèrica, textual o de data. A més no requereix un set de caràcters concrets amb la qual cosa assoleix una gran interoperabilitat entre aplicacions. Es caracteritza per utilitzar comes "," per a diferenciar les columnes de les taules creant un salt de línia per representar una filera de dades nova.
:* .TAB: pren el nom de tabulació ja que utilitza tabuladors o espais per separar cada columna de dades: cada salt de línia correspon a una filera o registre nou de la taula. No resulta un format adequat d'exportació ja que genera excessius caràcters en blanc per poder fer coincidir a cada columna la informació corresponent a un camp.
:* . XML: és un llenguatge de marques extensible que depèn d'un ''Schema'' o ''Document Type Description'' per a la seva verificació cosa que facilita l'ús de normes o regles de catalogació establertes com ara el format MARC XML. Estableix etiquetes d'inici i tancament dels continguts definint de forma senzilla el nom dels camps, atributs i valors. Redueix errors i pèrdues d'informació ja que permet la separació dels assentaments bibliogràfics o registres als arxius sense límits físics.
:* ISO 2709 Unimarc: es caracteritza per utilitzar quatre seccions: capçalera del registre amb longitud fixa, el directori, el camp de dades (que conté la informació bibliogràfica) i el separador de registres.
 
Línia 27:
- Neteja i consolidació de les taules de la Base de Dades
 
- Mapejat de les taules i definició de format d'orígenorigen i destí
 
- Ruta de Saltssalts de format a la migració
 
- Definició del Setset de Caràcterscaràcters d'orígenorigen i destí
 
- Comprovació dels delimitadors de camps
Línia 54:
== Inconvenients ==
 
* No es pot evitar l’alteració del document, és a dir, es perden propietats significatives o elements essencials del document original. Es tracta de propietats que van més enllà del contingut intel•lectualintel·lectual, com ara l’aparença o la funcionalitat. Ens referim al concepte en anglès conegut com el ''look and feel'': aquelles qualitats que representen l’essència del recurs tal i com el va crear l’autor i com ho van experimentar els usuaris quan es va fer públic, és a dir, l’experiència que tenien al “veure’l i tocar-lo / sentir-lo”.
* És difícil programar la migració per a objectes digitals complexos.
* Altera el document amb el risc de la pèrdua d'elements importants.