Esta sección recoge una relación de programas, utilidades y conjuntos de datos que han sido abiertos para ser compartidos con la comunidad académica, científica y universitaria. Han sido desarrollados en el ejercicio de las investigaciones del Prof. Dr. Blázquez-Ochando en el ámbito de las Ciencias de la Documentación y presentan aplicaciones prácticas para la docencia, la investigación y la innovación. Se incluyen asimismo las referencias de los experimentos en línea, que pueden ser consultados y probados por cualquier investigador o usuario. No se distribuye software considerado estratégico o en fase de desarrollo que pueda comprometer investigaciones en curso o procesos de explotación.

Software académico y científico

  1. AMPdoc — Distribución portable Apache + PHP + MySQL para docencia en automatización de unidades de información. Versiones 1.0, 1.1 y 2.0. https://sourceforge.net/projects/ampdoc/
  2. AXYZ — Agregador experimental Big-data de canales de sindicación RSS con clasificación automática y análisis de correlación entre noticias. https://sourceforge.net/projects/axyznews/

Repositorios GitHub

  1. LaIAbot — Agente conversacional RAG para recomendación bibliográfica y asistencia lectora. Python. Licencia MIT. https://github.com/manublaz/laiabot
  2. ScholarDownPython — Extracción masiva de papers desde Google Scholar con técnicas anti-detección. Python. https://github.com/manublaz/ScholarDownPython
  3. ScholarDownPHP — Web Scraper para Google Scholar. PHP. https://github.com/manublaz/ScholarDownPHP
  4. phpScrapingPARES — Analítica y Big-data sobre el Portal de Archivos Españoles. PHP. https://github.com/manublaz/phpSrapingPARES
  5. sentiManPHP — Análisis de sentimientos para español. PHP. https://github.com/manublaz/sentiManPHP
  6. promptAI — Prompts de IA documentados en el marco de publicaciones científicas. https://github.com/manublaz/promptAI
  7. Cumulus — Software para la gestión integral de fuentes de información y recursos documentales. PHP. https://github.com/manublaz/cumulus
  8. Datasets — Conjuntos de datos abiertos generados en investigaciones científicas. Licencia MIT. https://github.com/manublaz/datasets

Datasets

  1. Teseo Database 2015-11-14 — Base de datos de tesis doctorales españolas extraída de TESEO. Empleada en investigaciones bibliométricas sobre la producción doctoral en España. https://sourceforge.net/projects/teseo-database/files/TESEO_2015-11-14/

Experimentos en línea

  1. Google2down — Prueba de web scraping de Google y Google Scholar para extracción estructurada de resultados de búsqueda. https://mblazquez.es/lab/google2down/
  2. Google Spoofing — Experimento sobre técnicas de suplantación de interfaz aplicadas a buscadores. https://mblazquez.es/lab/googleSpoofing/
  3. NewsMedia — Prueba de web scraping en medios de comunicación para extracción y análisis de contenidos informativos. https://mblazquez.es/lab/newsMedia/
  4. Google Finance scraping — Prueba de extracción de datos financieros estructurados para experimentación con técnicas de recuperación de información. https://mblazquez.es/lab/googleFinance/