| 7 Evaluación
de calidad
7 Evaluación
de la calidad : Parámetros:
Metadatos
Se definen como “Datos estructurados
sobre datos” o “Datos que describen atributos de un
recurso”. Los metadatos describen el contenido, descripción
física, localización, tipo de información,
fecha de caducidad, seguridad, autentificación, formatos,
relación con otras versiones, información sobre su
preservación..etc.. Algunas de las informaciones que se pueden
aportar sobre cada recurso, mediante la utilización de metaetiquetas
son: título, creador, materia, palabras clave, descripción,
editor, fecha, tipo de recurso, identificador (DOI, ISBN, etc.),
idioma, cobertura, etc. En definitiva, los metadatos constituyen
el análisis documental de las páginas web similar
a un registro bibliográfico tradicional
Las revistas científicas electrónicas, al igual que
otros recursos de información en Internet, deben adoptar
los instrumentos desarrollados para localizar, identificar y describir
su contenido, y para facilitar a los usuarios la recuperación
de la información que ofrecen a través de Internet.
En este sentido, resulta cada vez más interesante que las
publicaciones incorporen metadatos, es decir, informaciones descriptivas
sobre ellas mismas, estructuradas mediante etiquetas propias de
los lenguajes que operan en la Red como HTML y XML.
Los metadatos pueden ser:
- Datos descriptivos como autor, título, editor
- Datos temáticos como terminología procedente de
un vocabulario controlado o un tesauro
- Datos sobre el modo de acceso, requerimientos de software o
hardware
- Datos administrativos o datos acerca del origen de esos metadatos
(quién lo ha creado, cuándo, por qué)
Cualquier otra información considerada relevante para comprender
mejor y caracterizar los datos.
El aporte de metadatos en el caso de las revistas electrónicas
facilitará:
- La introducción de información
- La búsqueda de los artículos
- La localización de información
- La recuperación a través de Internet
Los Metadatos ayudan a:
- Mejorar la pertinencia en los resultados de las búsquedas.
- Facilitar el flujo de trabajo en equipo, sobre todo si se trabaja
con Sistemas de Gestión de Contenido, de manera que se
puede hacer constar el estado de un recurso (publicado, en corrección,
editado, retirado, archivado...), su fecha, caducidad, asociación
con otros documentos.
- Personalizar la información de acuerdo a los perfiles
de los usuarios.
El uso natural de los metadatos es que sean aportados por los
propios autores o administradores de servidores para la promoción
del web, ya que aumentan la visibilidad de una página por
criterios de búsqueda semántica y estructurada (desarrollo
de la "websemántica").
Las herramientas para la introducción de metadatos permiten
la automatización de ciertas tareas de catalogación.
Las herramientas se caracterizan por su sencillez; son simples formularios
HTML, con un diseño gráfico sencillo y que requieren
por parte del usuario únicamente un cliente web.
Existen distintos proyectos y/o formatos relativos a la inclusión
de metaetiquetas en los recursos electrónicos, entre los
que destacan por su aplicación y su aceptación el
Dublin
Core y el Resource
Description Framework (RDF).
Aunque son referentes obligados a la hora de hablar de metadatos,
no tienen rango de normas internacionales.
Actualmente, la tendencia es abandonar la representación
de los metadatos en HTML y optar por una solución en la que
se combine Dublín Core, XML y RDF. Esto permite que los recursos
se puedan procesar por aplicaciones que no sólo presenten
la información, sino que también sean capaces de “entenderla”
en cierta medida. XML aporta, frente a HTML, validación del
código, mayor estructuración en los documentos, extensibilidad,
internacionalización, orientación a objetos, facilidad
de intercambio de datos entre aplicaciones y mejoras en el tratamiento
de los metacontenidos.
Dublin
Core (DC): es el formato de metainformación
más divulgado y más citado a nivel general. Es una
iniciativa impulsada por Online
Computer Library Center (OCLC)/ que se ha convertido en 2001
en norma (ANSI/NISO Z39-85-2001). Desde sus comienzos (1995), el
DC fue diseñado para promover un estándar general,
sencillo y descriptivo de los recursos web para cualquier disciplina.
En la propuesta original, el DC facilitaría una indización
consistente sin la necesidad de una gran experiencia catalogadora.
El DC es un conjunto de quince elementos opcionales , para describir
el contenido web según tres tipos de información:
siete elementos, que podríamos denominar estrictamente de
contenido (title, subject, description, source, language, relation,
coverage); elementos con información relativa a la propiedad
intelectual del recurso (creator, publisher, contributor, rights);
y elementos relativos a la temporalidad y formato del documento
así como su identificación (data, type, format, identifier).
La especial adaptabilidad de este modelo es un factor atractivo
para la descripción/"catalogación" de recursos
web, más aún, cuando se está promoviendo el
trabajo conjunto con el W3C
para una descripción formal para la codificación de
los metadatos-DC en el Resource Description Framework.
Resource
Description Framework (RDF): es sin
duda alguna el estándar en desarrollo más importante
para la descripción de contenidos web. Su importancia reside,
por un lado en la entidad que tiene el Consorcio
Web (W3C) quien fomenta el proyecto, y por otro, el hecho de
ser una aplicación de metadatos que utiliza XML a fin de
proporcionar un marco estándar para la interoperabilidad
entre distintos modelos de metadatos para la descripción
de contenido, como p. ej. el DC. Está basado en los trabajos
de varios colectivos como otras iniciativas del propio W3C (Platform
for Internet Content Selection (PICS) para el control de contenidos
o Platform
for Privacy Preferences (P3P) Project destinado a salvaguardar
la privacidad en la web) y de otros trabajos previos en el ámbito
de los modelos de descripción de contenido, como el Warwick
Framework del DC. Debemos señalar los tres aspectos de
la semántica funcional de RDF: un modelo de datos, una sintaxis
y un esquema. La especificación del modelo y la sintaxis
—Recomendación del Consorcio Web desde febrero de 1999—,
es un estándar estructural de metainformación diseñado
para servir como fundamento para la interoperabilidad en el procesamiento
de metadatos. La especificación del esquema —desde
el 27 de marzo del 2000, Candidato para la Recomendación—
formaliza las restricciones para definir vocabularios para las aplicaciones
RDF.
Más información en : http://www.w3.org/RDF/
y http://www.w3.org/XML/
Uno de los objetivos por los que surge el estándar de metadatos
Dublin Core es la obtención de un formato simple que permita
el intercambio de metadatos entre aplicaciones. Para ello, además
de conocer cuál es el conjunto de términos que se
utiliza para definir los documentos (los metadatos), es necesario
definir la sintaxis de representación que permita ese intercambio
de metadatos entre aplicaciones. La mejor solución en un
futuro a corto plazo consiste en utilizar los metadatos Dublin Core
como semántica y RDF (W3C, 1999) como expresión de
esa semántica.
Ejemplo de código en HTML con Metadatos basados en Dublín
Core
<HEAD> <TITLE>Resource:
http://cvc.cervantes.es/aula/didactiteca/</TITLE>
<META NAME="DC.Creator" CONTENT="Centro Virtual
Cervantes, varios autores"> <META NAME="DC.Title"
CONTENT="Didactiteca"> <META NAME="DC.Date.Created"
CONTENT="2000--"> <META NAME="DC.Date.X-MetadataCreated"
CONTENT="2001-03-28"> <META NAME="DC.Publisher"
CONTENT="Centro Virtual Cervantes"> <META
NAME="DC.Publisher.X-Email" CONTENT="cvc@cervantes.es">
</HEAD> |
Ejemplo de Dublín Core expresado en RDF/XML
<?xml version="1.0"?>
<!DOCTYPE rdf:RDF PUBLIC "-//DUBLIN CORE//DCMES DTD
2002/07/31//EN" "http://dublincore.org/documents/2002/07/31/dcmes-xml/dcmes-xml-dtd.dtd">
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:dc="http://purl.org/dc/elements/1.1/">
<rdf:Description rdf:about="http://www.ilrt.bristol.ac.uk/people/cmdjb/">
<dc:title>Dave Beckett's Home Page</dc:title>
<dc:creator>Dave Beckett</dc:creator> <dc:publisher>ILRT,
University of Bristol</dc:publisher> <dc:date>2002-07-31</dc:date>
</rdf:Description> |
El término web semántica ha sido acuñado
recientemente para designar una web de nueva generación en
la que los contenidos sean algo más que una gran suma de
información y servicios escasamente estructurados. Este nuevo
enfoque propone reestructurar y enriquecer los documentos y componentes
web con información semántica explícita, independiente
de la presentación al usuario, y susceptible de ser procesada
de forma automática por un programa. Los nuevos estándares
y herramientas creados para dar soporte a la web semántica
son el XML,
RDF, OIL,
entre otros.
El desarrollo de la web semántica pasa también por
la adopción de diferentes tecnologías, el eXtensible
Markup Language (XML) y el Resource Description Framework (RDF).
El lenguaje XML permite a los usuarios añadir una estructura
arbitraria a sus documentos, pero no dice nada acerca del significado
de dicha estructura. Esta es la tarea que se intenta resolver con
el lenguaje RDF, un marco en el que es posible describir la información
para que la procesen las máquinas. Otro elemento clave de
la web semántica son las "ontologías", descritas
como documentos o ficheros que formalmente definen las relaciones
entre términos.
Más información complementaria: Semantic
Web Community Portal. |