Esta sección recoge una relación de programas, utilidades y conjuntos de datos que han sido abiertos para ser compartidos con la comunidad académica, científica y universitaria. Han sido desarrollados en el ejercicio de las investigaciones del Prof. Dr. Blázquez-Ochando en el ámbito de las Ciencias de la Documentación y presentan aplicaciones prácticas para la docencia, la investigación y la innovación. Se incluyen asimismo las referencias de los experimentos en línea, que pueden ser consultados y probados por cualquier investigador o usuario. No se distribuye software considerado estratégico o en fase de desarrollo que pueda comprometer investigaciones en curso o procesos de explotación.
Software académico y científico
- AMPdoc — Distribución portable Apache + PHP + MySQL para docencia en automatización de unidades de información. Versiones 1.0, 1.1 y 2.0. https://sourceforge.net/projects/ampdoc/
- AXYZ — Agregador experimental Big-data de canales de sindicación RSS con clasificación automática y análisis de correlación entre noticias. https://sourceforge.net/projects/axyznews/
Repositorios GitHub
- LaIAbot — Agente conversacional RAG para recomendación bibliográfica y asistencia lectora. Python. Licencia MIT. https://github.com/manublaz/laiabot
- ScholarDownPython — Extracción masiva de papers desde Google Scholar con técnicas anti-detección. Python. https://github.com/manublaz/ScholarDownPython
- ScholarDownPHP — Web Scraper para Google Scholar. PHP. https://github.com/manublaz/ScholarDownPHP
- phpScrapingPARES — Analítica y Big-data sobre el Portal de Archivos Españoles. PHP. https://github.com/manublaz/phpSrapingPARES
- sentiManPHP — Análisis de sentimientos para español. PHP. https://github.com/manublaz/sentiManPHP
- promptAI — Prompts de IA documentados en el marco de publicaciones científicas. https://github.com/manublaz/promptAI
- Cumulus — Software para la gestión integral de fuentes de información y recursos documentales. PHP. https://github.com/manublaz/cumulus
- Datasets — Conjuntos de datos abiertos generados en investigaciones científicas. Licencia MIT. https://github.com/manublaz/datasets
Datasets
- Teseo Database 2015-11-14 — Base de datos de tesis doctorales españolas extraída de TESEO. Empleada en investigaciones bibliométricas sobre la producción doctoral en España. https://sourceforge.net/projects/teseo-database/files/TESEO_2015-11-14/
Experimentos en línea
- Google2down — Prueba de web scraping de Google y Google Scholar para extracción estructurada de resultados de búsqueda. https://mblazquez.es/lab/google2down/
- Google Spoofing — Experimento sobre técnicas de suplantación de interfaz aplicadas a buscadores. https://mblazquez.es/lab/googleSpoofing/
- NewsMedia — Prueba de web scraping en medios de comunicación para extracción y análisis de contenidos informativos. https://mblazquez.es/lab/newsMedia/
- Google Finance scraping — Prueba de extracción de datos financieros estructurados para experimentación con técnicas de recuperación de información. https://mblazquez.es/lab/googleFinance/