Especiales e-revistas  
Tecnociencia
Octubre 2004
 Revistas científicas electrónicas
 
7 Evaluación de calidad
7 Evaluación de la calidad : Parámetros: Metadatos

Se definen como “Datos estructurados sobre datos” o “Datos que describen atributos de un recurso”. Los metadatos describen el contenido, descripción física, localización, tipo de información, fecha de caducidad, seguridad, autentificación, formatos, relación con otras versiones, información sobre su preservación..etc.. Algunas de las informaciones que se pueden aportar sobre cada recurso, mediante la utilización de metaetiquetas son: título, creador, materia, palabras clave, descripción, editor, fecha, tipo de recurso, identificador (DOI, ISBN, etc.), idioma, cobertura, etc. En definitiva, los metadatos constituyen el análisis documental de las páginas web similar a un registro bibliográfico tradicional

Las revistas científicas electrónicas, al igual que otros recursos de información en Internet, deben adoptar los instrumentos desarrollados para localizar, identificar y describir su contenido, y para facilitar a los usuarios la recuperación de la información que ofrecen a través de Internet. En este sentido, resulta cada vez más interesante que las publicaciones incorporen metadatos, es decir, informaciones descriptivas sobre ellas mismas, estructuradas mediante etiquetas propias de los lenguajes que operan en la Red como HTML y XML.
Los metadatos pueden ser:

  • Datos descriptivos como autor, título, editor

  • Datos temáticos como terminología procedente de un vocabulario controlado o un tesauro

  • Datos sobre el modo de acceso, requerimientos de software o hardware

  • Datos administrativos o datos acerca del origen de esos metadatos (quién lo ha creado, cuándo, por qué)

Cualquier otra información considerada relevante para comprender mejor y caracterizar los datos.
El aporte de metadatos en el caso de las revistas electrónicas facilitará:

  • La introducción de información

  • La búsqueda de los artículos

  • La localización de información

  • La recuperación a través de Internet

Los Metadatos ayudan a:

  • Mejorar la pertinencia en los resultados de las búsquedas.

  • Facilitar el flujo de trabajo en equipo, sobre todo si se trabaja con Sistemas de Gestión de Contenido, de manera que se puede hacer constar el estado de un recurso (publicado, en corrección, editado, retirado, archivado...), su fecha, caducidad, asociación con otros documentos.

  • Personalizar la información de acuerdo a los perfiles de los usuarios.

El uso natural de los metadatos es que sean aportados por los propios autores o administradores de servidores para la promoción del web, ya que aumentan la visibilidad de una página por criterios de búsqueda semántica y estructurada (desarrollo de la "websemántica").
Las herramientas para la introducción de metadatos permiten la automatización de ciertas tareas de catalogación. Las herramientas se caracterizan por su sencillez; son simples formularios HTML, con un diseño gráfico sencillo y que requieren por parte del usuario únicamente un cliente web.

Existen distintos proyectos y/o formatos relativos a la inclusión de metaetiquetas en los recursos electrónicos, entre los que destacan por su aplicación y su aceptación el Dublin Core y el Resource Description Framework (RDF). Aunque son referentes obligados a la hora de hablar de metadatos, no tienen rango de normas internacionales.

Actualmente, la tendencia es abandonar la representación de los metadatos en HTML y optar por una solución en la que se combine Dublín Core, XML y RDF. Esto permite que los recursos se puedan procesar por aplicaciones que no sólo presenten la información, sino que también sean capaces de “entenderla” en cierta medida. XML aporta, frente a HTML, validación del código, mayor estructuración en los documentos, extensibilidad, internacionalización, orientación a objetos, facilidad de intercambio de datos entre aplicaciones y mejoras en el tratamiento de los metacontenidos.

Dublin Core (DC): es el formato de metainformación más divulgado y más citado a nivel general. Es una iniciativa impulsada por Online Computer Library Center (OCLC)/ que se ha convertido en 2001 en norma (ANSI/NISO Z39-85-2001). Desde sus comienzos (1995), el DC fue diseñado para promover un estándar general, sencillo y descriptivo de los recursos web para cualquier disciplina. En la propuesta original, el DC facilitaría una indización consistente sin la necesidad de una gran experiencia catalogadora. El DC es un conjunto de quince elementos opcionales , para describir el contenido web según tres tipos de información: siete elementos, que podríamos denominar estrictamente de contenido (title, subject, description, source, language, relation, coverage); elementos con información relativa a la propiedad intelectual del recurso (creator, publisher, contributor, rights); y elementos relativos a la temporalidad y formato del documento así como su identificación (data, type, format, identifier). La especial adaptabilidad de este modelo es un factor atractivo para la descripción/"catalogación" de recursos web, más aún, cuando se está promoviendo el trabajo conjunto con el W3C para una descripción formal para la codificación de los metadatos-DC en el Resource Description Framework.

Resource Description Framework (RDF): es sin duda alguna el estándar en desarrollo más importante para la descripción de contenidos web. Su importancia reside, por un lado en la entidad que tiene el Consorcio Web (W3C) quien fomenta el proyecto, y por otro, el hecho de ser una aplicación de metadatos que utiliza XML a fin de proporcionar un marco estándar para la interoperabilidad entre distintos modelos de metadatos para la descripción de contenido, como p. ej. el DC. Está basado en los trabajos de varios colectivos como otras iniciativas del propio W3C (Platform for Internet Content Selection (PICS) para el control de contenidos o Platform for Privacy Preferences (P3P) Project destinado a salvaguardar la privacidad en la web) y de otros trabajos previos en el ámbito de los modelos de descripción de contenido, como el Warwick Framework del DC. Debemos señalar los tres aspectos de la semántica funcional de RDF: un modelo de datos, una sintaxis y un esquema. La especificación del modelo y la sintaxis —Recomendación del Consorcio Web desde febrero de 1999—, es un estándar estructural de metainformación diseñado para servir como fundamento para la interoperabilidad en el procesamiento de metadatos. La especificación del esquema —desde el 27 de marzo del 2000, Candidato para la Recomendación— formaliza las restricciones para definir vocabularios para las aplicaciones RDF.

Más información en : http://www.w3.org/RDF/ y http://www.w3.org/XML/

Uno de los objetivos por los que surge el estándar de metadatos Dublin Core es la obtención de un formato simple que permita el intercambio de metadatos entre aplicaciones. Para ello, además de conocer cuál es el conjunto de términos que se utiliza para definir los documentos (los metadatos), es necesario definir la sintaxis de representación que permita ese intercambio de metadatos entre aplicaciones. La mejor solución en un futuro a corto plazo consiste en utilizar los metadatos Dublin Core como semántica y RDF (W3C, 1999) como expresión de esa semántica.

Ejemplo de código en HTML con Metadatos basados en Dublín Core

<HEAD>
<TITLE>Resource: http://cvc.cervantes.es/aula/didactiteca/</TITLE>
<META NAME="DC.Creator" CONTENT="Centro Virtual Cervantes, varios autores">
<META NAME="DC.Title" CONTENT="Didactiteca">
<META NAME="DC.Date.Created" CONTENT="2000--">
<META NAME="DC.Date.X-MetadataCreated" CONTENT="2001-03-28">
<META NAME="DC.Publisher" CONTENT="Centro Virtual Cervantes">
<META NAME="DC.Publisher.X-Email" CONTENT="cvc@cervantes.es">
</HEAD>

Ejemplo de Dublín Core expresado en RDF/XML

<?xml version="1.0"?>
<!DOCTYPE rdf:RDF PUBLIC "-//DUBLIN CORE//DCMES DTD 2002/07/31//EN" "http://dublincore.org/documents/2002/07/31/dcmes-xml/dcmes-xml-dtd.dtd">
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:dc="http://purl.org/dc/elements/1.1/">
<rdf:Description rdf:about="http://www.ilrt.bristol.ac.uk/people/cmdjb/">
<dc:title>Dave Beckett's Home Page</dc:title>
<dc:creator>Dave Beckett</dc:creator>
<dc:publisher>ILRT, University of Bristol</dc:publisher>
<dc:date>2002-07-31</dc:date>
</rdf:Description>

El término web semántica ha sido acuñado recientemente para designar una web de nueva generación en la que los contenidos sean algo más que una gran suma de información y servicios escasamente estructurados. Este nuevo enfoque propone reestructurar y enriquecer los documentos y componentes web con información semántica explícita, independiente de la presentación al usuario, y susceptible de ser procesada de forma automática por un programa. Los nuevos estándares y herramientas creados para dar soporte a la web semántica son el XML, RDF, OIL, entre otros.

El desarrollo de la web semántica pasa también por la adopción de diferentes tecnologías, el eXtensible Markup Language (XML) y el Resource Description Framework (RDF). El lenguaje XML permite a los usuarios añadir una estructura arbitraria a sus documentos, pero no dice nada acerca del significado de dicha estructura. Esta es la tarea que se intenta resolver con el lenguaje RDF, un marco en el que es posible describir la información para que la procesen las máquinas. Otro elemento clave de la web semántica son las "ontologías", descritas como documentos o ficheros que formalmente definen las relaciones entre términos.

Más información complementaria: Semantic Web Community Portal.

 
       
     

FECYT  CSIC
© 2001 - 2004
Optimizada para Internet Explorer 5 y Netscape 6
Resolución mínima 800 x 600