SEMTEST v2: demostrador pedagógico Web Semántica

Referencia

Blázquez-Ochando, M., & Ovalle-Perandones, M. A. (2026). SEMTEST: Un demostrador pedagógico de enriquecimiento semántico multicapa basado en Linked Open Data para la docencia en Información y Documentación. Infonomy, 4(4). https://doi.org/10.3145/infonomy.26.022

Comentario

Enseñar tecnologías semánticas en Biblioteconomía y Documentación siempre ha tenido un escollo: la distancia entre los conceptos teóricos (URI, RDF, SPARQL, OWL) y su funcionamiento real. Los estudiantes manejan tesauros, encabezamientos de materia y registros de autoridad, pero cuando se enfrentan a DBpedia o Wikidata, se topan con interfaces que devuelven resultados sin mostrar cómo se han obtenido. Esa opacidad rompe el puente natural que debería existir entre la organización del conocimiento tradicional y la Web de Datos.

SEMTEST (Semantic Enrichment Test) nació para tender ese puente. La versión 2, que acabamos de publicar, da un salto cualitativo: pasa de ser una herramienta de recuperación de información a un demostrador pedagógico que hace visible cada paso del enriquecimiento semántico de una consulta. Y lo hace con una filosofía clara: transparencia radical. No se limita a mostrar resultados; muestra cómo se obtienen: las peticiones HTTP, las cabeceras, las respuestas JSON, el código que las procesa. El estudiante ve la maquinaria por dentro, y eso convierte la abstracción en experiencia.

¿Qué hay de nuevo en esta versión?

El cambio más profundo es técnico, pero tiene implicaciones didácticas enormes. La versión original se apoyaba en scraping HTML de Wikipedia, un método frágil y opaco. Ahora todo se apoya en APIs JSON oficiales: Wikipedia, Wikidata, DBpedia, Open Library. Además, se ha añadido una capa de consulta SPARQL directa contra el endpoint de DBpedia, con la cabecera HTTP específica que el protocolo exige. Pequeños detalles como este —que un estudiante vea que no vale con application/json, sino que se necesita application/sparql-results+json— convierten la teoría en práctica tangible.

El demostrador organiza el proceso en nueve fases que recorren las capas de la arquitectura de la Web Semántica: desde la identificación mediante URIs, pasando por la extracción de contenido de Wikipedia, los backlinks, la recuperación de imágenes de Commons, la resolución del URI canónico en DBpedia, la clasificación de propiedades RDF, la consulta a Wikidata con agrupación semántica de declaraciones, la ejecución de SPARQL, la búsqueda bibliográfica en Open Library, y finalmente la construcción de un grafo multicapa interactivo.

Precisamente, la clasificación de propiedades RDF es una de las novedades más interesantes. SEMTEST distingue visualmente entre propiedades de tipo datatype (literales con tipo, como fechas), propiedades de objeto (que apuntan a otros URIs) y relaciones jerárquicas (rdf:type, rdfs:subClassOf). El estudiante puede ver, por ejemplo, que dbo:birthDate es un literal con tipo xsd:date, mientras que dbo:birthPlace es un enlace a otro recurso. Esa distinción, que en los manuales resulta abstracta, se vuelve intuitiva cuando se observa en un grafo coloreado.

Un grafo que habla por sí mismo

La representación visual final es un grafo de conocimiento con cinco capas semánticas diferenciadas por color y posición: la entidad central, la jerarquía de clases RDFS, las categorías SKOS, las instancias relacionadas y los recursos bibliográficos de Open Library. Las relaciones inferidas —por ejemplo, a través de rdfs:subClassOf— se dibujan con líneas discontinuas, mostrando al estudiante la diferencia entre lo que está afirmado explícitamente y lo que se puede deducir. Esa distinción es la base del razonamiento ontológico, y verla en acción sobre su propia consulta es mucho más efectivo que leer sobre ella.

Además, el grafo se puede exportar en Turtle, el formato RDF estándar, y cargar en herramientas como Protégé o Apache Jena. El ciclo se cierra: el estudiante pasa de una consulta en lenguaje natural a un dataset RDF que puede explorar, consultar con SPARQL y visualizar en un editor ontológico. Eso es aprendizaje experiencial puro.

¿Qué aporta al aula?

SEMTEST resuelve tres problemas pedagógicos de raíz. Primero, la abstracción: términos como "URI" o "propiedad de objeto" se vuelven concretos al verlos en funcionamiento sobre entidades conocidas (Picasso, Madrid, Inteligencia Artificial). Segundo, la caja negra: al mostrar cada petición y cada respuesta, el estudiante aprende a evaluar críticamente los servicios LOD, entendiendo sus limitaciones y su dinámica. Tercero, la desconexión disciplinar: la herramienta hace explícito que los TG/TE de un tesauro son rdfs:subClassOf en un grafo, que el control de autoridades se materializa en URIs persistentes como VIAF o ISNI, que el análisis de materias se corresponde con la capa SKOS. Esa continuidad conceptual es el mayor valor didáctico.

Limitaciones y futuro

La herramienta depende de la disponibilidad de APIs externas (DBpedia, Wikidata, Open Library), lo que en ocasiones puede provocar timeouts o cambios en las respuestas. Pero los autores convierten esa limitación en recurso: el estudiante aprende que la Web Semántica es un ecosistema vivo, no un laboratorio controlado. Como líneas futuras, se plantea añadir un módulo de razonamiento RDFS en el lado del cliente (con rdflib.js) y una alineación con el tesauro de la UNESCO, para contrastar categorías automáticas con vocabularios institucionales. SEMTEST v2 no es solo una herramienta; es una filosofía de enseñanza. Hace visible lo invisible, conecta lo tradicional con lo innovador, y sitúa al estudiante en el centro del proceso. Si trabajas con Web Semántica, organización del conocimiento o tecnologías LOD en el aula, te invito a probarlo. La mejor forma de entenderlo es escribir un término y observar cómo se despliega el viaje desde la Web de documentos hasta la Web de Datos.