[Artículo actualizado y revisado 2015-11-15]

La base de datos Teseo, editada por el Ministerio de Educación, permite recuperar información sobre las tesis doctorales defendidas en las universidades españolas desde 1976. La información proporcionada por este recurso en línea ha fomentado el desarrollo de numerosos estudios bibliométricos y cienciométricos sobre el estado de la cuestión en la investigación española sobre diversas áreas de conocimiento y especialidades.

Para hacernos una idea del impacto que ha tenido Teseo en la investigación, se ha probado la consulta (intitle:teseo OR intext:teseo) AND («base de datos») en Google Scholar obteniendo 1.690 resultados que trazan un línea de progresión ascendente, que demuestra un incremento en su referenciación directa e indirecta.

Fig.1. Evolución de las referencias directas e indirectas a la base de datos Teseo en las publicaciones académico-científicas recuperadas en Google Scholar [Fuente: propia] [Consultado en 2015-11-04]

Figura 1. Evolución de las referencias directas e indirectas a la base de datos Teseo en las publicaciones académico-científicas recuperadas en Google Scholar [Consultado en 2015-11-04]

Dada la importancia del recurso para la elaboración de próximas investigaciones, que ayuden a determinar la producción científica de tesis doctorales sobre una determinada especialidad o área de conocimiento, se ha desarrollado un método de recuperación de fichas de tesis doctorales, procedentes de la base de datos Teseo. El método consiste en el uso de técnicas de web scraping combinadas con el motor de crawling Mbot.

Fig.2. Muestra de los registros de Tesis Doctorales recopilados en la base de datos TESEO

Figura 2. Muestra de los registros de Tesis Doctorales recopilados en la base de datos Teseo

Cada permalink de la base de datos se ha analizado minuciosamente, para extraer mediante técnica de patrones XPath y REGEXP, los datos principales de cada Tesis Doctoral registrada. Datos tales como el título completo, autor, universidad de procedencia, fecha de lectura, directores de la tesis, miembros del tribunal, descriptores y resumen, son recopilados automáticamente y preparados para su exportación en formato SQL, CSV (Comma Separated Values) y CSV para MS Excel, disponible desde el repositorio SourceForge.

Descargas de Teseo v1.1 [2015-11-14]

  1. Descargar Teseo v1.1 CSV (Datos completos)
  2. Descargar Teseo v1.1 CSV MS Excel (Datos completos)
  3. Descargar Teseo v1.1 SQL (Estructura y Datos – completo)
  4. Descargar Teseo v1.1 SQL (Solo Estructura)
  5. Descargar Teseo v1.1 SQL (Solo Datos – completo)
  6. Descargar Teseo v1.1 SQL (Solo Datos) parte 01
  7. Descargar Teseo v1.1 SQL (Solo Datos) parte 02
  8. Descargar Teseo v1.1 SQL (Solo Datos) parte 03
  9. Descargar Teseo v1.1 SQL (Solo Datos) parte 04
  10. Descargar Teseo v1.1 SQL (Solo Datos) parte 05
  11. Descargar Teseo v1.1 SQL (Solo Datos) parte 06
  12. Descargar Teseo v1.1 SQL (Solo Datos) parte 07
  13. Descargar Teseo v1.1 SQL (Solo Datos) parte 08
  14. Descargar Teseo v1.1 SQL (Solo Datos) parte 09
  15. Descargar Teseo v1.1 SQL (Solo Datos) parte 10
  16. Descargar Teseo v1.1 SQL (Solo Datos) parte 11
  17. Descargar Teseo v1.1 SQL (Solo Datos) parte 12
  18. Descargar Teseo v1.1 SQL (Solo Datos) parte 13
  19. Descargar Teseo v1.1 SQL (Solo Datos) parte 14
  20. Descargar Teseo v1.1 SQL (Solo Datos) parte 15
  21. Descargar Teseo v1.1 SQL (Solo Datos) parte 16
  22. Descargar Teseo v1.1 SQL (Solo Datos) parte 17
  23. Descargar Teseo v1.1 SQL (Solo Datos) parte 18
  24. Descargar Teseo v1.1 SQL (Solo Datos) parte 19
  25. Descargar Teseo v1.1 SQL (Solo Datos) parte 20

Importar Teseo en AMP (Apache, MySQL, PHP)

La base de datos Teseo puede ser importada en cualquier distribución basada en Apache, MySQL y PHP, tales como XAMPP, WAMP, EasyPHP, AMPdoc, que incluyan un gestor de bases de datos de tipo phpMyAdmin para facilitar las tareas de migración de datos. Por otra parte se requiere una configuración especial de PHP a través del archivo «php.ini», que permita la ejecución ilimitada de los scripts, aumento del límite de memoria y del tamaño máximo de archivos que serán importados. A continuación se muestra la configuración recomendada y los pasos de importación a través del gestor de bases de datos phpMyAdmin.

Configuración de PHP (archivo php.ini)

  1. max_input_time= -1
  2. memory_limit=4028M
  3. post_max_size=500M
  4. upload_max_filesize=500M
  5. max_file_uploads=20

Pasos para la importación de Teseo con phpMyAdmin

  1. Crear base de datos en blanco con la denominación «teseo». Se creará la base de datos sin tablas, preparada para la importación de la estructura y datos de Teseo.
  2. Métodos de importación:
  3. Estructura y Datos – completo. Desde la opción «Importar» seleccionar el archivo «catalogoteseo-estructuraydatos.sql», descargado previamente. A continuación, hacer clic en el botón «Continuar» para iniciar el proceso de importación. El proceso puede tardar varios minutos. Finalmente el sistema termina de volcar toda la información de Teseo, quedando listo para su uso.
  4. Teseo SQL por partes. Desde la opción «Importar» seleccionar el archivo «catalogoteseo-part01.sql», descargado previamente. Después, hacer clic en el botón «Continuar» para iniciar el proceso de importación. Este paso genera automáticamente la tabla con la estructura de campos necesaria para importar los datos y a continuación vuelca la primera de las 14 tandas de registros disponibles. Repetir el proceso de importación con las siguientes partes hasta finalizar el proceso de migración.
  5. Verificación de la importación. Se recomienda comprobar que se importaron un total de 132.378 registros correspondientes a Tesis Doctorales.

Fig.3. Pantalla de importación de PHPMyAdmin. Obsérvese que el límite del tamaño de archivos es de 500MB, lo que permitirá una correcta importación

Figura 3. Pantalla de importación de phpMyAdmin. Obsérvese que el límite del tamaño de archivos es de 500MB, lo que permitirá una correcta importación de Teseo

Relación de artículos de TESEO

  1. Catálogo de Tesis Doctorales Españolas TESEO disponible para su descarga
  2. Base de datos TESEO. Primeros datos
  3. Cómo se obtuvieron los datos de TESEO, aspectos a considerar y nuevas acciones
  4. Actualización de datos de Teseo
  5. Tesis Doctorales en las Universidades Españolas durante el periodo 1977-2014