| 3 Conservación
digital
Procesos de conservación en los documentos digitales
La adherencia a los estándares es un requisito previo importante
para la disponibilidad y la legibilidad a largo plazo de cualquier
documento electrónico. Poder asegurar la viabilidad y la integridad
de la colección es premisa fundamental en el caso de las revistas
científicas. Las ediciones electrónicas ofrecen más opciones y
funcionalidades que sus versiones impresas, y también incluyen cada
vez más el material suplementario que no es parte de la versión
impresa.
Uno de los temores existentes es que la conservación digital sea
más costosa que el mantenimiento y almacenaje de documentos impresos.
Además, es difícil asignar responsabilidades sin saber los costes
exactos y las implicaciones a largo plazo de los archivos digitales.
En general, los expertos se decantan por la necesidad de adaptarse
a los estándares internacionales.
En principio, esta misión es responsabilidad de diferentes organismos:
bibliotecas, editores, instituciones de los autores, etc. Si todas
las normas se cumplen, se puede afirmar sin ningún temor, que un
documento en papel podrá ser leído durante 5 siglos. Sin embargo,
con los documentos electrónicos es difícil asegurar un periodo
de tiempo fijo donde se tenga la absoluta certeza de que el documento
pueda ser leído o recuperado para leerse. En el proceso de conservación
de los documentos es necesario tener en cuenta aspectos como los
siguientes:
Obsolescencia tecnológica
Este hecho se está produciendo de forma continua tanto en hardware
como en software. Por tanto, debe preverse a través de diferentes
medidas y garantizar la conservación, acceso, lectura e integridad
de los documentos.
Los procedimientos que se recomiendan están relacionados
con los siguientes temas:
Para asegurar la preservación de la información, el formato elegido
debe ser legible por una aplicación durante el mayor tiempo posible.
Esto implica evitar formatos propietarios cerrados, como documentos
en Word (en cualquiera de las versiones). Lo recomendable es utilizar
formatos propietarios pero abiertos, como el formato TIFF,
o mejor aún, formatos no propietarios como el ASCII. La razón es
evidente: los documentos Word, por ejemplo, es necesario migrarlos
a otros formatos Word más modernos no pudiéndose garantizar que
estas migraciones no ocasionen pérdidas de información o cambios
en la presentación de los documentos. Además existe otra razón importante
para evitar el uso de formatos propietarios ¿Quién puede asegurar
la supervivencia en un futuro de empresas por importantes que éstas
sean en la actualidad?
La utilización de un formato de codificación simple y universal
como XML
permite perpetuar los documentos electrónicos. XML es el formato
ideal ya que además de ser un formato no propietario, y por tanto
ofrecer garantía de preservación de la información (ASCII), permite
estructurar la información y el intercambio de información a todos
los medios.
Con este tipo de formato, se pueden utilizar técnicas de migración
sin dificultad ya que sólo contienen texto puro. Para asegurar
la integridad de los documentos que contienen objetos electrónicos
(imágenes, sonidos, modelos, fórmulas, hiperenlaces..) se debe emplear
la misma filosofía que con la información textual. Los formatos
imagen considerados mejores para la conservación son el TIFF
(Tagged Imege File Format) que su compresión no experimenta
ninguna pérdida de calidad, el PNG
(Portable Network Graphics), cuya compresión experimenta apenas
pérdidas en la resolución y además es muy ligero y el JPEG.
En cuanto a los Formatos mixtos los mejores son el Postscript,
que puede ser enviado a cualquier periférico que soporte este lenguaje,
sin tener en cuenta su resolución, produciendo un resultado adaptado
a cada tipo de periférico y el PDF
(Portable Document Format), basado en el Postscript, propietario
pero abierto de la casa Adobe y que facilita un programa gratuito
para poder leer este tipo de documentos.
En la tabla se presentan de forma esquematizada los formatos recomendados:
|
Tipo de archivo |
Criterios de elección |
Formatos |
| Archivos texto |
Formatos estándard |
XML, HTML, TXT |
| Archivos imagen |
Estándard o propietarios
abiertos. Sistema de compresión que evite la pérdida de calidad
|
TIFF, PNG, JPEG |
| Archivos mixtos |
Estándard o propietarios
abiertos. |
Postcript, PDF |
En la siguiente tabla se presentan los formatos utilizados en ocho
programas dedicados a la conservación de documentos electrónicos:
- Soportes utilizados en la conservación
Normalmente las instituciones suelen realizar copias de seguridad
en todo tipo de soportes: Soportes magnéticos (discos, cintas) y
soportes ópticos (CD y DVD).
Los soportes magnéticos sufren un doble deterioro: por un lado
el agotamiento progresivo del campo magnético que necesita una actualización
periódica, y por otro, las condiciones ambientales que contribuyen
a su destrucción (humedad, temperatura, polución, etc..). Los soportes
magnéticos, aunque mas duraderos, también están sujetos al deterioro
causado por factores ambientales y a la durabilidad de los materiales
utilizados en su construcción.
Los lugares destinados al almacenaje de estos materiales deben
de tener una serie de características: Deben ser espacios bien protegidos
exentos de luz y polvo y con un campo magnético tan débil como sea
posible, evitando la proximidad de motores o transformadores eléctricos.
Los controles de temperatura y de humedad deben de mantenerse a
unos 20ºC y un 40% de humedad. Los materiales deben de estar almacenados
en cajas para evitar cualquier tipo de daño físico.
Las estrategias empleadas para asegurar la conservación y accesibilidad
a los documentos electrónicos esencialmente son: Actualización
y migración de los datos a soportes diversificados y fiables
y la emulación. La emulación consiste en imitar el
funcionamiento de un ordenador o de un determinado software sobre
otro ordenador más moderno y potente de una generación actual. De
esta forma, los documentos electrónicos conservan su aspecto, su
originalidad y por supuesto su contenido.
Las bibliotecas han creado un modelo de archivo distribuido para
la información en línea: LOCKSS
(Lots of Copies Keeps Staff Safe). Esta iniciativa de tipo voluntario,
permite el archivo de material on-line seleccionado por las organizaciones
que han firmado el acuerdo y permite que las bibliotecas conserven
sus fondos electrónicos en ordenadores locales. Esta información
no se borra nunca y es comparada continuamente con los archivos
on-line de los que proceden, para asegurar el buen estado de los
mismos. En el caso de que se detecten daños en los archivos, éstos
son inmediatamente restaurados. Para participar en este acuerdo,
los productores de las revistas tienen que aceptar las condiciones
técnicas de compatibilidad.
¿De quién es la responsabilidad de la conservación de las revistas?
La Ley del Depósito Legal especifica la responsabilidad de las
bibliotecas nacionales en la conservación de todas las publicaciones
editadas en el país correspondiente. Sin embargo, en el caso de
las publicaciones electrónicas no existen infraestructuras nacionales
reconocidas y por tanto la responsabilidad de su conservación queda
sujeta a diversas iniciativas que de forma voluntariosa se están
tomando para asegurar la colecciones. Por ejemplo, Canadá, Australia,
Francia, Suiza, Reino Unido y Alemania son ejemplo de este tipo
de iniciativas. Varios informes sugieren (Task
Force in Archiving of Digital Information) que los editores
sean los primeros responsables en la conservación y almacenaje de
sus colecciones. Posteriormente, las bibliotecas nacionales una
vez implantado el depósito legal para las publicaciones on-line,
serían las encargadas de su conservación.
Es preciso definir roles y responsabilidades puesto que la preservación
digital involucra a todos: diseñadores de sistemas de información,
distribuidores, creadores, editores, gestores de información, administración,
proveedores de acceso, bibliotecas, autores y sus instituciones.
Todos tienen un papel que jugar en la preservación del acceso a
la información digital. Es necesaria su coordinación y cooperación,
porque todos se ven afectados mutuamente por las decisiones que
se tomen.
Papel de los creadores y editores
Es necesario que los autores y los editores asuman el compromiso
de implementar metadatos y adherirse a estandares. En este sentido
es fundamental la cooperación entre los autores y el comité editorial.
El papel de los editores está siendo muy debatido. Si ellos no
se responsabilizan de la preservación, deben de facilitar el trabajo
y el material a las bibliotecas y desarrollar en consecuencia productos
y mecanismos que faciliten la dicha conservación. El primer
paso es que adopten los mejores estándares y las mejores prácticas.
Integridad y autenticidad de los contenidos
Tanto por parte de los autores como de los lectores, garantizar
la autenticidad e integridad del contenido de las revistas son premisas
fundamentales. Básicamente, existen dos procedimientos para garantizar
que el contenido no ha sido ni cambiado ni manipulado:
Encriptado:
Consiste en convertir un texto legible en otro ilegible si no se
utiliza una clave que permita reestablecer al documento en su forma
inicial. Es decir, los documentos se codifican y solo pueden ser
leídos si se dispone de la clave. Este procedimiento presenta el
problema de la perdurabilidad de la editorial y consecuentemente
de la posibilidad de que se pierda la clave de codificación.
Digital
Signature Initiative: Esta iniciativa se está
desarrollando a través de un grupo de trabajo del World
Wide Web Consortium. Consiste en desarrollar una sintaxis XML
que represente la firma de los recursos de Internet. Estas firmas
permitirán garantizar los datos y la autentificación de los documentos.
El objetivo último es el establecer el “Web de la Verdad”
Bibliografía
|