Lunes 9 de Octubre de 2017

Tema 4: Metadatos

Introducción

El problema de la estructuración de la información, descripción, y localización de la información viene de lejos. Las bibliotecas han sido uno de los centros clave donde esta preocupación ha sido más productiva. De hecho, si pensamos en el sistema de catalogación, parece que la evolución hacia un sistema electrónico de información ha sido el proceso natural.

ficha

Los metadatos son las informaciones sobre los datos (en inglés, “Data about data”). Su misión principal es describir la información (o datos) de un documento, un proyecto o un fichero.

En general, con “metadatos” nos referimos siempre a los datos informáticos que recogen información sobre el contenido, la estructura o el contexto de una fuente.

Los metadatos pueden describir una colección, un solo recurso, o un componente de un recurso más grande.

Existen múltiple formatos de metadatos, y por ello se han creado diversos estándares de metadatos para que puedan ser compartidos y aplicados de manera homogénea. Entre sus misiones principales está siempre el de identificar y localizar las fuentes en la web.

Existen diferentes tipos de metadatos:

  • Metadatos descriptivos
  • Metadatos estructurales
  • Metadatos administrativos
  • Gestión de autor
  • Preservación

Las funciones principales de los metadatos son las siguientes:

  • Identificación digital
  • Organizar recursos electrónicos
  • Añade más información a los objetos
  • Para descubrir recursos
  • Recuperación, uso, re-uso y gestión de los recursos
  • Interoperabilidad
  • Archivo y preservación (ej. declaración de propiedades legales, como el copyright)

En general todas las instituciones culturales y de gestión del patrimonio histórico tienen como tarea principal la catalogación y estructuración de sus fondos. Bibliotecas, galerías de arte, museos, archivos, etc. están familiarizadas con uno u otro sistema de metadatos.

¿Qué es lo que determina que una institución o proyecto decida utilizar un sistema u otro de metadatos? La respuesta es simple: el esquema.

Esquemas de metadatos

Los esquemas son una serie de elementos de metadatos designados para propósitos específicos, como describir un tipo particular de recurso de información.

Los esquemas especifican los nombres de los elementos y su semántica. Mientras que sus valores suelen ser los contenidos propiamente dichos. También especifican ciertas reglas de sintaxis, como pueden anidarse sus elementos.

Algunos tipos de metadatos son usados sólo en ciertas comunidades, por ejemplo, MARC ha sido desarrollado por y para la catalogación en las bibliotecas; EAD por y para los archivos. Pero hay una serie de tipos que son utilizados en multitud de contextos y no pertenecen sólo a una institución, por ello, será más útil pasar revista a algunos de los tipos más representativos y utilizados en el mundo de las instituciones culturales.

1. DCMI - Dublin Core Metadata Initiative

Web standard para describir recursos web, con 15 campos optativos. Es frecuentemente utilizado en los museos. Algunas plataformas de publicación como Omeka utilizan DC.

Links de interés:

Vid. DC_simple.xml

2. MARC - MAchine Readable Cataloging

Las bibliotecas utilizan un serie de formatos digitales para describir los ítems bibliográficos y así poderlos catalogar de una manera homogénea y coherente. Estos formatos se basan en los estándares MARC (MAchine Readable Cataloging), creados en los años 1960 por la Library of Congress, y utilizado internacionalmente en la catalogación de las bibliotecas.

La versión más utilizada del estándar MARC es MARC 21, aunque en Europa se ha utilizado durante muchos años y todavía se utiliza el UNIMARC.

¿Cuales crees que son las ventajas de pasar de una ficha manual en papel o un formato digital?

  • Estructuración homogénea -> intercambio entre bibliotecas -> catálogos colectivos, plataformas comunes (ej. Europeana)
  • Conservación digital / preservación
  • Procesamiento de las informaciones (búsqueda por campos, uso de las fichas con otros softwares)
  • Difusión del patrimonio de las bibliotecas.

Cuando consultamos un ítem bibliográfico es útil tener en mente cómo está construido el catálogo. Por ejemplo, cuando consultamos un libro en una biblioteca obtenemos un resultado claro:

Ejemplo 1, Ejemplo 2

Pero en realidad lo que hay detrás es una ficha MARC. La universidad de Columbia, además, nos da la posibilidad de descargarnos el ítem tanto en MARC XML como en MARC 21:

https://clio.columbia.edu/catalog/9514482/librarian_view

Vid. EjemploMARC.pdf

La información se divide en 10 bloques:

Links de interés:

3. MODS - Metadata Object Description Schema

MODS es un lenguaje estándar de metadatos desarrollado por la Library of Congress y derivado de MARC. En origen, se utilizó sólo en bibliotecas pero cada vez más se utiliza en otros ambientes.

Algunos de los portales más importantes, utilizan múltiples formatos simultáneamente, por ejemplo, la Library of Congress ofrece los metadatos de un mismo ítem en formatos diferentes:

Links útiles:

Vid. Four_Women_DublinCore.xml Vid. Four_Women_marcxml.xml Vid. Four_Women_mods.xml

4. EAD Encoded Archival Description International Standard

EAD es un estándar expresado en XML utilizado para describir colecciones digitales y fue creado también por la Library of Congress. Tal y como su nombre indica, el sistema EAD es utilizado principalmente en los archivos y equivale al catálogo en las bibliotecas.

Links útiles:

Ejemplos: http://www.loc.gov/ead/tglib/appendix_c.html

5. Text Encoding Initiative

TEI es un consorcio internacional que desarrolla y mantiene un estándar para la representación de los textos en formato digital. Su esquema se publica a través de las TEI Guidelines y es adoptado en proyectos de humanidades, ciencias sociales y lingüística. También es utilizado por bibliotecas, museos, editores, e investigadores para presenter su investigación online, enseñanza y preservación.

Links útiles:

6. RDF Resource Description Framework

RDF o Marco de Descripción de Recursos fue creado por el W3C, para representar un modelo de datos para diferentes metadatos. Actualmente, sirve para describir cualquier tipo de descripción de fuente y es la base de la web semántica.

Links útiles:

7. METS Metadata Encoding and Transcription Standard

METS es otro estándar de metadatos creado por la Library of Congress y destinado a integrar diferentes sistemas de metadatos, centrados especialmente en su aspecto administrativo.

Aquí encontraréis un ejemplo de un record digital:

Links útiles:

8. OAIS Open Archival Information System

Modelo abstracto desarrollado para un sistema de recuperación: ISO norm.

Links útiles:

Bibliografía: