Especiales e-revistas  
Tecnociencia
Octubre 2004
 Revistas científicas electrónicas
 
3 Conservación digital

Procesos de conservación en los documentos digitales

La adherencia a los estándares es un requisito previo importante para la disponibilidad y la legibilidad a largo plazo de cualquier documento electrónico. Poder asegurar la viabilidad y la integridad de la colección es premisa fundamental en el caso de las revistas científicas.  Las ediciones electrónicas ofrecen más opciones y funcionalidades que sus versiones impresas, y también incluyen cada vez más el material suplementario que no es parte de la versión impresa.

Uno de los temores existentes es que la conservación digital sea más costosa que el mantenimiento y almacenaje de documentos impresos. Además, es difícil asignar responsabilidades sin saber los costes exactos y las implicaciones  a largo plazo de los archivos digitales. En general,  los expertos se decantan por la necesidad de adaptarse a los estándares internacionales.

En principio, esta misión es responsabilidad de diferentes organismos: bibliotecas, editores, instituciones de los autores, etc. Si todas las normas se cumplen, se puede afirmar sin ningún temor, que un documento en papel podrá ser leído durante 5 siglos. Sin embargo, con los documentos electrónicos es difícil asegurar un  periodo de tiempo fijo donde se tenga la absoluta certeza de que el documento pueda ser leído o recuperado para leerse.  En el proceso de conservación de los documentos es necesario tener en cuenta aspectos como los siguientes:

Obsolescencia tecnológica

Este hecho se está produciendo de forma continua  tanto en  hardware como en  software. Por tanto,  debe preverse a través de diferentes medidas y garantizar la conservación, acceso, lectura e integridad de los documentos.

Los procedimientos que se recomiendan están relacionados con los siguientes temas:

  • Selección de formatos

Para asegurar la preservación de la información, el formato elegido debe ser legible por una aplicación durante el mayor tiempo posible. Esto implica evitar formatos propietarios cerrados, como documentos en Word (en cualquiera de las versiones). Lo recomendable es utilizar formatos propietarios pero abiertos, como el formato TIFF, o mejor aún, formatos no propietarios como el ASCII. La razón es evidente: los documentos Word, por ejemplo, es necesario migrarlos a otros formatos Word más modernos no pudiéndose garantizar que estas migraciones no ocasionen pérdidas de información o cambios en la presentación de los documentos. Además existe otra razón importante para evitar el uso de formatos propietarios ¿Quién puede asegurar la supervivencia en un futuro de empresas por  importantes que éstas sean en la actualidad?

La utilización de un formato de codificación simple y universal como XML permite perpetuar los documentos electrónicos. XML es el formato ideal ya que además de ser un formato no propietario, y por tanto ofrecer garantía de preservación de la información (ASCII), permite estructurar la información y el intercambio de información a todos los medios.

Con este tipo de formato, se pueden utilizar técnicas de migración sin dificultad ya que sólo contienen texto puro. Para asegurar la integridad de los documentos que contienen objetos electrónicos (imágenes, sonidos, modelos, fórmulas, hiperenlaces..) se debe emplear la misma filosofía que con la información textual. Los formatos imagen considerados mejores para la conservación son el TIFF (Tagged Imege File Format) que su compresión no experimenta ninguna pérdida de calidad, el PNG (Portable Network Graphics), cuya compresión experimenta apenas pérdidas en la resolución y además es muy ligero y el JPEG.

En cuanto a los Formatos mixtos los mejores son el Postscript,  que puede ser enviado a cualquier periférico que soporte este lenguaje, sin tener en cuenta su resolución, produciendo un resultado adaptado a cada tipo de periférico y el PDF (Portable Document Format), basado en el Postscript, propietario pero abierto de la casa Adobe y que facilita un programa gratuito para poder leer este tipo de documentos.

En la tabla se presentan de forma esquematizada los formatos recomendados:

Tipo de archivo Criterios de elección Formatos
Archivos texto Formatos estándard XML, HTML, TXT
Archivos imagen Estándard o propietarios abiertos. Sistema de compresión que evite la pérdida de calidad TIFF, PNG, JPEG
Archivos mixtos Estándard o propietarios abiertos. Postcript, PDF

En la siguiente tabla se presentan los formatos utilizados en ocho programas dedicados a la conservación de documentos electrónicos:

Nombre proyecto
 y país
URL Formatos
Pandora (Preserving and Accessing Networked Documentary Resources of Australia). Australia http://pandora.nla.gov.au/ PDF, SGML, HTML
HighWire.  Estados Unidos http://highwire.stanford.edu/  SGML, HTML
Muse. Estados Unidos http://muse.jhu.edu/ HTML, PDF
Allen Press. Estados Unidos http://www.allenpress.com/ SGML
Institute of Electrical and Electronic Engineers. Estados Unidos http://www.ieee.org/portal/index.jsp SGML, PDF
American Astronomical Society. Estados Unidos http://www.aas.org/publications/index.htm SGML
American Institute of Physics. Estados Unidos http://www.aip.org/ojs/service.html PDF SGML
Danemark. Legal Deposit in Denmark. Dinamarca http://www.kb.nl/infolev/liber/articles/dupont11.htm ASCII Text, TIFF (formato imagen)
  • Soportes utilizados en la conservación

Normalmente las instituciones suelen realizar copias de seguridad en todo tipo de soportes: Soportes magnéticos (discos, cintas) y soportes ópticos (CD y DVD).

Los soportes magnéticos sufren un doble deterioro: por un lado el agotamiento progresivo del campo magnético que necesita una actualización periódica, y por otro, las condiciones ambientales que contribuyen a su destrucción (humedad, temperatura, polución, etc..). Los soportes magnéticos, aunque mas duraderos, también están sujetos al deterioro causado por factores ambientales y a  la durabilidad de los materiales utilizados en su construcción.

Los lugares destinados al almacenaje de estos materiales deben de tener una serie de características: Deben ser espacios bien protegidos exentos de luz y polvo y con un campo magnético tan débil como sea posible, evitando la proximidad de motores o transformadores eléctricos. Los controles de temperatura y de humedad deben de mantenerse a unos 20ºC y un 40% de humedad. Los materiales deben de estar almacenados en cajas para evitar cualquier tipo de daño físico.

Las estrategias empleadas para asegurar la conservación y accesibilidad a los documentos electrónicos esencialmente son: Actualización y migración de los datos a soportes diversificados y fiables y la emulación. La emulación consiste en imitar el funcionamiento de un ordenador o de un determinado software sobre otro ordenador más moderno y potente de una generación actual. De esta forma, los documentos electrónicos conservan su aspecto, su originalidad y por supuesto su contenido.

Las bibliotecas han creado un modelo de archivo distribuido para la información en línea: LOCKSS (Lots of Copies Keeps Staff Safe). Esta iniciativa de tipo voluntario, permite el archivo de material on-line seleccionado por las organizaciones que han firmado el acuerdo y permite que las bibliotecas conserven sus fondos electrónicos en ordenadores locales. Esta información no se borra nunca y es comparada continuamente con los archivos on-line de los que proceden, para asegurar el buen estado de los mismos. En el caso de que se detecten daños en los archivos, éstos son inmediatamente restaurados. Para participar en este acuerdo, los productores de las revistas tienen que aceptar las condiciones técnicas de compatibilidad.

¿De quién es la responsabilidad de la conservación de las revistas?

La Ley del Depósito Legal especifica la responsabilidad de las bibliotecas nacionales en la conservación de todas las publicaciones editadas en el país correspondiente. Sin embargo, en el caso de las publicaciones electrónicas no existen infraestructuras nacionales reconocidas y por tanto la responsabilidad de su conservación queda sujeta a diversas iniciativas que de forma voluntariosa se están tomando para asegurar la colecciones. Por ejemplo, Canadá, Australia, Francia, Suiza, Reino Unido y Alemania son ejemplo de este tipo de iniciativas. Varios informes sugieren (Task Force in Archiving of Digital Information) que los editores sean los primeros responsables en la conservación y almacenaje de sus colecciones. Posteriormente, las bibliotecas nacionales una vez implantado el depósito legal para las publicaciones on-line, serían las encargadas de su conservación.

Es preciso definir roles y responsabilidades puesto que la preservación digital involucra a todos: diseñadores de sistemas de información, distribuidores, creadores, editores, gestores de información, administración, proveedores de acceso, bibliotecas, autores y sus instituciones. Todos tienen un papel que jugar en la preservación del acceso a la información digital. Es necesaria su coordinación y cooperación, porque todos se ven afectados mutuamente por las decisiones que se tomen.

Papel de los creadores y editores

Es necesario que los autores y los editores asuman el compromiso de implementar metadatos y adherirse a estandares. En este sentido es fundamental la cooperación entre los autores y el comité editorial. El papel de los editores está siendo muy debatido. Si  ellos no se responsabilizan de la preservación, deben de facilitar el trabajo y el material a las bibliotecas y desarrollar en consecuencia productos y mecanismos que faciliten la dicha conservación. El primer paso es que adopten los mejores estándares y las mejores prácticas.

Integridad y autenticidad de los contenidos

Tanto por parte de los autores como de los lectores, garantizar la autenticidad e integridad del contenido de las revistas son premisas fundamentales. Básicamente, existen dos procedimientos para garantizar que el contenido no ha sido ni cambiado ni manipulado:

Encriptado: Consiste en convertir un texto legible en otro ilegible si no se utiliza una clave que permita reestablecer al documento en su forma inicial. Es decir, los documentos se codifican y solo pueden ser leídos si se dispone de la clave. Este procedimiento presenta el problema de la perdurabilidad de la editorial y consecuentemente de la posibilidad de que se pierda la clave de codificación.

Digital Signature Initiative: Esta iniciativa se está desarrollando a través de un grupo de trabajo del World Wide Web Consortium. Consiste en desarrollar una sintaxis XML que represente la firma de los recursos de Internet. Estas firmas permitirán garantizar los datos y la autentificación de los documentos. El objetivo último es el establecer el “Web de la Verdad”

Bibliografía

 

 
       
     

FECYT  CSIC
© 2001 - 2004
Optimizada para Internet Explorer 5 y Netscape 6
Resolución mínima 800 x 600