Referencia

  1. Blázquez Ochando, M. (2014). Propuesta para el desarrollo de un sistema de metadatos web para la administración pública. Ponencia presentada en el Simposio Latinoamericano de Acceso a la Información Gubernamental, México D.F., México. http://eprints.rclis.org/22968/

Comentario

En el contexto actual de la administración electrónica y la creciente demanda de transparencia gubernamental, los sistemas de metadatos se han consolidado como herramientas fundamentales para la gestión documental, la interoperabilidad institucional y el acceso a la información pública. La investigación plantea un análisis crítico de los principales esquemas de metadatos existentes —AGLS (Australian Government Locator Service), e-EMGDE (Esquema de Metadatos para la Gestión del Documento Electrónico) y Dublin Core Qualified— para, a partir de sus fortalezas y debilidades, proponer un nuevo modelo denominado GPAM (Government Public Administration Metadata).

Análisis crítico de los esquemas de metadatos preexistentes

1. AGLS (Australian Government Locator Service)

El esquema AGLS fue diseñado con el propósito de establecer un método normalizado para la descripción de la documentación de la administración pública australiana. Entre sus principales características destacan:

  1. Fundamentación semántica: Implementa aspectos de la Web Semántica mediante el uso de triples RDF, permitiendo teóricamente la realización de inferencias semánticas.
  2. Estructura prefijada: Emplea prefijos denotativos que facilitan la identificación del ámbito de aplicación (AGLSTERMS, AVAILTERMS, ADMINTERMS, AGENTTERMS).
  3. Relación con Dublin Core: Incorpora 46 de los 55 metadatos Dublin Core Qualified, lo que supone aproximadamente el 50% de su total.

Desde la óptica archivística, AGLS presenta ventajas significativas en cuanto a la capacidad de interrelación entre recursos, con 34 metadatos especializados en documentación asociada. No obstante, su aplicación práctica revela limitaciones en la diferenciación entre tipos de entidades (documentos, agentes, actividades) y en la codificación manual, a pesar de la claridad de sus prefijos.

2. e-EMGDE (Esquema de Metadatos para la Gestión del Documento Electrónico)

Desarrollado como instrumento normalizado para la administración pública española, e-EMGDE se caracteriza por:

  1. Perspectiva archivística: Proporciona una visión del ciclo vital del documento electrónico, estableciendo similitudes con las áreas de descripción de la norma ISAD(G).
  2. Estructura jerárquica: Organiza sus elementos y subelementos en una estructura que permite describir con detalle las propiedades y características de los objetos documentales.
  3. Cobertura especializada: Destaca en la descripción de condiciones de acceso y uso, con 29 metadatos dedicados a este ámbito, así como en el apartado de trazabilidad, con 14 metadatos que abordan la normativa incoativa, jurisdicción y transferencias documentales.

El análisis comparativo revela que e-EMGDE supera en número total de metadatos a AGLS (117 frente a 100), pero presenta importantes desventajas prácticas. La extensión de sus denominaciones —que en algunos casos superan los 50 caracteres— dificulta la codificación manual, y su redacción exclusivamente en español limita su interoperabilidad internacional.

3. Limitaciones comunes

Ambos esquemas presentan carencias significativas desde una perspectiva archivística y documental:


Dimensión

Limitación identificada

Análisis multinivel

Ninguno de los esquemas especifica niveles de exhaustividad en su normativa de uso

Editores

Ausencia de editores públicos y oficiales que faciliten la implementación

Sistemas de recuperación

Falta de sistemas normalizados para crear buscadores y directorios automatizados

Diferenciación semántica

Ambigüedad en la distinción entre el documento descrito y los agentes que intervienen en su gestión

Normalización

Inexistencia de fichas predeterminadas que orienten la selección y combinación de metadatos según tipologías documentales

Fundamentos teóricos de la propuesta GPAM

La propuesta GPAM surge como respuesta a las limitaciones identificadas, planteando un modelo de metadatos que aborda cuatro cuestiones fundamentales:

  1. Qué elementos, objetos y agentes deben ser descritos
  2. Qué nivel de exhaustividad debe tener la descripción
  3. Cómo diseñar editores y sistemas de codificación asistida
  4. Cómo implementar sistemas de recuperación de información

1. Identificación de entidades mediante prefijos

Una de las contribuciones más significativas de GPAM es la introducción de un sistema de prefijos que permite identificar inequívocamente la naturaleza del elemento descrito:


Prefijo

Denominación

Tipología de valores

DOCGROUP

Agrupación documental

Fondo, subfondo, serie, subserie, sección, expediente simple, expediente compuesto, caja, legajo

AGENT

Agente

Institución pública/privada, persona física/jurídica, órgano, departamento, sistema de información

ACTIVITY

Actividad

Meta, función, actividad, acción, proceso

FRAMEWORK

Marco regulatorio

Constitución, leyes (orgánica, ordinaria, autonómica), estatutos, convenios, tratados internacionales

TRACE

Trazabilidad

Incoación, edición, transferencia, expurgo, copia, firma, verificación, supervisión, sellado

Esta estructuración mediante prefijos resuelve uno de los problemas fundamentales detectados en los esquemas preexistentes: la ambigüedad entre el documento descrito y los agentes o actividades relacionadas. Al incorporar el prefijo en la codificación, el sistema permite discriminar con claridad qué tipo de entidad está siendo descrita.

2. Modelo sintáctico de combinación

El esquema GPAM propone un método sintáctico que combina los prefijos identificadores con los metadatos específicos. La estructura base es la siguiente:

<meta name="PREFIJO.metadato" atributo1="valor" atributo2="valor" />

Por ejemplo, para describir un expediente administrativo:

<meta name="DOCGROUP.identifier" type="Expediente simple" code="EXP-2024-001" title="Expediente de contratación de servicios" value="http://www.administracion.es/expedientes/001" />

Este modelo sintáctico genera 240 combinaciones posibles (5 prefijos × 48 metadatos), duplicando la capacidad descriptiva de los esquemas AGLS y e-EMGDE, y permitiendo al catalogador seleccionar los elementos más adecuados para cada supuesto documental.

3. Estructura de metadatos

La propuesta GPAM organiza sus 48 metadatos en áreas de descripción que, aunque inspiradas en las normas ISAD(G), incorporan categorías específicas para la administración pública:


Área

Metadatos

Aplicación archivística

Identificación

identifier, type, localcontrol, intercontrol

Normalización de códigos nacionales e internacionales

Título y responsabilidad

title, othertitle, fullname, relcreator, relcontributor, relauthority

Distinción entre autor, colaborador y autoridad citada

Fechas

datecreated, datefinished, dateupdated, dateapply, daterights

Control cronológico del ciclo vital documental

Contenido y estructura

summary, keywords, description

Descripción del alcance y contenido

Contexto

conhistoric, constatus, consocial, conspatial, contemporal

Contextualización histórica, jurídica, social y espacial

Descripción física

phisholder, phisextent, phisdetails, phisdimensions, phisenclosed

Caracterización del soporte y formato

Jurisdicción y valoración

jurisdiction, valuables

Ámbito de aplicación y valores documentales

Condiciones de acceso

accessconditions, rights, language, signature, security, classaccess

Control de accesibilidad y derechos

Relaciones

relversionprev, relversionnext, relhierasc, relhierdesc, reldocument, relcopy, relsource

Vinculación entre versiones, jerarquías y documentos relacionados

Control y notas

notes

Información complementaria

4. Flexibilidad y niveles de exhaustividad

La propuesta GPAM introduce un sistema de niveles de exhaustividad que permite adaptar la descripción a las necesidades específicas de cada institución. Los metadatos de identificación básica —aquellos que utilizan el prefijo y el metadato "identifier"— se consideran obligatorios para garantizar la identificación unívoca del recurso. El resto de metadatos se aplican según las políticas institucionales y las características del fondo documental.

Esta flexibilidad resulta particularmente relevante en el ámbito archivístico, donde coexisten centros con diferentes capacidades técnicas y recursos, desde archivos de oficina hasta archivos históricos, pasando por archivos centrales y bibliotecas administrativas.

Contribuciones desde la perspectiva archivística

1. Gestión del ciclo vital documental

GPAM incorpora elementos específicos para el control de la trazabilidad documental mediante el prefijo TRACE y metadatos que permiten registrar cada intervención sobre el documento a lo largo de su ciclo vital. La posibilidad de repetir el metadato trace.identifier tantas veces como trámites se produzcan en un expediente —registrando la actividad, el agente responsable y la fecha— constituye una herramienta fundamental para la gestión archivística de documentos digitales.

2. Control de jerarquías y relaciones orgánico-funcionales

Los metadatos relhierasc y relhierdesc permiten establecer relaciones jerárquicas desde tres perspectivas:

  1. Funcional: vinculación entre procesos, actividades y funciones
  2. Orgánica: dependencias entre unidades administrativas
  3. Documental: relaciones entre agrupaciones documentales (fondo, serie, expediente)

Esta capacidad resulta esencial para la construcción de cuadros de clasificación orgánica y funcional, elementos fundamentales en la teoría archivística para la organización de los fondos documentales.

3. Valoración documental

El metadato valuables incluye atributos para especificar los valores del documento —administrativo, jurídico-legal, probatorio, científico-tecnológico, histórico-testimonial, informativo—, proporcionando una base normalizada para los procesos de valoración, selección y expurgo.

4. Interoperabilidad semántica

La propuesta GPAM incorpora elementos para el trabajo con datos enlazados (linked data) a través de atributos como code y value que contienen URIs y códigos normalizados. Esto permite la interconexión entre registros de autoridades, marcos normativos y actividades, superando las limitaciones de interoperabilidad observadas en e-EMGDE.

Implementación técnica

1. Editor de metadatos

La propuesta GPAM incluye el desarrollo de un editor que permite la codificación asistida de los metadatos. El editor contempla diferentes esquemas de descripción según:

  1. Centro catalogador: archivo de oficina, archivo central, archivo histórico, biblioteca, centro de documentación
  2. Entidad descrita: unidad administrativa, fondo, serie, expediente, persona física/jurídica, familia, marco legal, actividad

Esta adaptabilidad es crucial para la implementación efectiva del sistema, ya que reconoce que las necesidades descriptivas varían según el contexto institucional y la tipología de los materiales.

2. Recolector y sistema de recuperación

GPAM incorpora un sistema de recuperación basado en webcrawler que opera en tres fases:

  1. Registro de fuentes: lista de direcciones URL donde se publican contenidos con metadatos GPAM
  2. Extracción mediante XPath: filtrado de metadatos mediante consultas XPath que identifican las etiquetas y sus atributos
  3. Almacenamiento en base de datos: indexación y recuperación mediante sistemas como MySQL, PostgreSQL u Oracle

El código de extracción propuesto utiliza consultas como:

$metadata01 = $xpath1->query("meta[@name='DOCGROUP.identifier']");

Este método permite recuperar los 240 tipos posibles de combinación de metadatos, garantizando una indexación completa.

Consideraciones finales

La propuesta GPAM representa una contribución significativa al desarrollo de sistemas de metadatos para la administración pública desde una perspectiva integradora que combina:

  1. Rigor teórico: fundamentado en el análisis crítico de esquemas existentes y en los principios de la ciencia archivística y documental
  2. Aplicabilidad práctica: mediante el desarrollo de editores, sistemas de recuperación y niveles de exhaustividad adaptables
  3. Interoperabilidad: a través del uso de prefijos normalizados, atributos para linked-data y estructuras que facilitan la traducción y adaptación internacional
  4. Sostenibilidad: mediante la simplificación de la codificación y la automatización de procesos de descripción y recuperación

Desde la perspectiva de las Ciencias de la Documentación, GPAM aporta una solución integral que aborda no solo la descripción documental, sino también la gestión de autoridades, la trazabilidad administrativa, el control de jerarquías funcionales y orgánicas, y la valoración documental.

Para los profesionales de archivos y centros de documentación, el sistema ofrece herramientas concretas para mejorar la transparencia informativa de las administraciones públicas, facilitando el acceso a la información gubernamental y garantizando la preservación de los documentos electrónicos a lo largo de su ciclo vital.