SPA 322
Lunes 9 de Octubre de 2017
Tema 4: Metadatos
Introducción
El problema de la estructuración de la información, descripción, y localización de la información viene de lejos. Las bibliotecas han sido uno de los centros clave donde esta preocupación ha sido más productiva. De hecho, si pensamos en el sistema de catalogación, parece que la evolución hacia un sistema electrónico de información ha sido el proceso natural.
Los metadatos son las informaciones sobre los datos (en inglés, “Data about data”). Su misión principal es describir la información (o datos) de un documento, un proyecto o un fichero.
En general, con “metadatos” nos referimos siempre a los datos informáticos que recogen información sobre el contenido, la estructura o el contexto de una fuente.
Los metadatos pueden describir una colección, un solo recurso, o un componente de un recurso más grande.
Existen múltiple formatos de metadatos, y por ello se han creado diversos estándares de metadatos para que puedan ser compartidos y aplicados de manera homogénea. Entre sus misiones principales está siempre el de identificar y localizar las fuentes en la web.
Existen diferentes tipos de metadatos:
- Metadatos descriptivos
- Metadatos estructurales
- Metadatos administrativos
- Gestión de autor
- Preservación
Las funciones principales de los metadatos son las siguientes:
- Identificación digital
- Organizar recursos electrónicos
- Añade más información a los objetos
- Para descubrir recursos
- Recuperación, uso, re-uso y gestión de los recursos
- Interoperabilidad
- Archivo y preservación (ej. declaración de propiedades legales, como el copyright)
En general todas las instituciones culturales y de gestión del patrimonio histórico tienen como tarea principal la catalogación y estructuración de sus fondos. Bibliotecas, galerías de arte, museos, archivos, etc. están familiarizadas con uno u otro sistema de metadatos.
¿Qué es lo que determina que una institución o proyecto decida utilizar un sistema u otro de metadatos? La respuesta es simple: el esquema.
Esquemas de metadatos
Los esquemas son una serie de elementos de metadatos designados para propósitos específicos, como describir un tipo particular de recurso de información.
Los esquemas especifican los nombres de los elementos y su semántica. Mientras que sus valores suelen ser los contenidos propiamente dichos. También especifican ciertas reglas de sintaxis, como pueden anidarse sus elementos.
Algunos tipos de metadatos son usados sólo en ciertas comunidades, por ejemplo, MARC ha sido desarrollado por y para la catalogación en las bibliotecas; EAD por y para los archivos. Pero hay una serie de tipos que son utilizados en multitud de contextos y no pertenecen sólo a una institución, por ello, será más útil pasar revista a algunos de los tipos más representativos y utilizados en el mundo de las instituciones culturales.
1. DCMI - Dublin Core Metadata Initiative
Web standard para describir recursos web, con 15 campos optativos. Es frecuentemente utilizado en los museos. Algunas plataformas de publicación como Omeka utilizan DC.
Links de interés:
Vid. DC_simple.xml
2. MARC - MAchine Readable Cataloging
Las bibliotecas utilizan un serie de formatos digitales para describir los ítems bibliográficos y así poderlos catalogar de una manera homogénea y coherente. Estos formatos se basan en los estándares MARC (MAchine Readable Cataloging), creados en los años 1960 por la Library of Congress, y utilizado internacionalmente en la catalogación de las bibliotecas.
La versión más utilizada del estándar MARC es MARC 21, aunque en Europa se ha utilizado durante muchos años y todavía se utiliza el UNIMARC.
¿Cuales crees que son las ventajas de pasar de una ficha manual en papel o un formato digital?
- Estructuración homogénea -> intercambio entre bibliotecas -> catálogos colectivos, plataformas comunes (ej. Europeana)
- Conservación digital / preservación
- Procesamiento de las informaciones (búsqueda por campos, uso de las fichas con otros softwares)
- Difusión del patrimonio de las bibliotecas.
Cuando consultamos un ítem bibliográfico es útil tener en mente cómo está construido el catálogo. Por ejemplo, cuando consultamos un libro en una biblioteca obtenemos un resultado claro:
Pero en realidad lo que hay detrás es una ficha MARC. La universidad de Columbia, además, nos da la posibilidad de descargarnos el ítem tanto en MARC XML como en MARC 21:
https://clio.columbia.edu/catalog/9514482/librarian_view
Vid. EjemploMARC.pdf
La información se divide en 10 bloques:
- 00X Bloque de identificación del ítem / Data Field
- 01X-09X Bloque de las informaciones codificadas / Numbers and Code Fields
- 20X-24X Bloque de las informaciones descriptivas / Title and Title-Related Fields
- 25X-28X Bloque de Edición, editorial, etc / Edition, Imprint, Etc. Fields
- 3XX Bloque de descripción física / Physical Description Fields
- 4XX Bloque de enlaces entre notícias bibliográficas / Series Statement
- 5XX Bloque de notas / Note Fields
- 6XX Bloque de el acceso a las materias / Subject Access Fields
- 70X-75X Bloque de entradas alternativas / Added Entry Fields
- 76X-78X Bloque de entradas relacionadas / Linking Entry Fields
- 80X-83X Bloque de series / Series Added Entry Fields
- 841-88X Bloque de uso nacional o local / Holdings, Location, etc. Fields
Links de interés:
- Library of Congress, Marc Standards
- Estándares MARC, Wikipedia
3. MODS - Metadata Object Description Schema
MODS es un lenguaje estándar de metadatos desarrollado por la Library of Congress y derivado de MARC. En origen, se utilizó sólo en bibliotecas pero cada vez más se utiliza en otros ambientes.
Algunos de los portales más importantes, utilizan múltiples formatos simultáneamente, por ejemplo, la Library of Congress ofrece los metadatos de un mismo ítem en formatos diferentes:
- Vista HTML: https://www.loc.gov/item/95507126/
- Documento DC: https://lccn.loc.gov/95507126/dc
- Documento MARC: https://lccn.loc.gov/95507126/marcxml
- Documento MODS: https://lccn.loc.gov/95507126/mods
Links útiles:
- Página oficial
- Metadata Object Description Schema, Wikipedia
- University Libraries, An Introduction to MODS: The Metadata Object Description schema
Vid. Four_Women_DublinCore.xml Vid. Four_Women_marcxml.xml Vid. Four_Women_mods.xml
4. EAD Encoded Archival Description International Standard
EAD es un estándar expresado en XML utilizado para describir colecciones digitales y fue creado también por la Library of Congress. Tal y como su nombre indica, el sistema EAD es utilizado principalmente en los archivos y equivale al catálogo en las bibliotecas.
Links útiles:
- Página oficial
- Encoded Archival Description, Wikipedia
Ejemplos: http://www.loc.gov/ead/tglib/appendix_c.html
5. Text Encoding Initiative
TEI es un consorcio internacional que desarrolla y mantiene un estándar para la representación de los textos en formato digital. Su esquema se publica a través de las TEI Guidelines y es adoptado en proyectos de humanidades, ciencias sociales y lingüística. También es utilizado por bibliotecas, museos, editores, e investigadores para presenter su investigación online, enseñanza y preservación.
Links útiles:
6. RDF Resource Description Framework
RDF o Marco de Descripción de Recursos fue creado por el W3C, para representar un modelo de datos para diferentes metadatos. Actualmente, sirve para describir cualquier tipo de descripción de fuente y es la base de la web semántica.
Links útiles:
- RDF, W3C Semantic Web
- Resource Description Framework, Wikipedia
7. METS Metadata Encoding and Transcription Standard
METS es otro estándar de metadatos creado por la Library of Congress y destinado a integrar diferentes sistemas de metadatos, centrados especialmente en su aspecto administrativo.
Aquí encontraréis un ejemplo de un record digital:
- Vista HTML: http://memory.loc.gov/diglib/ihas/loc.afc.afc9999005.1153/default.html
- Documento METS: http://memory.loc.gov/diglib/ihas/loc.afc.afc9999005.1153/mets.xml
Links útiles:
8. OAIS Open Archival Information System
Modelo abstracto desarrollado para un sistema de recuperación: ISO norm.
Links útiles:
- Página oficial
- Open Archival Inforrmation System, Wikipedia
Bibliografía:
-
National Information Standards Organization. Understanding Metadata. Bethesda: NISO, 2004
-
Lei Zeng, Marcia, y Jian Qin, Metadata, New York - London: ALA Neal-Schuman, 2nd Edition, 2016
-
Eva Méndez y José A. Senso, Introducción a los metadatos. Estándares y Aplicación, SEDIC, 2004