De la fatiga al clic: Python e IA para vencer la carrera contra el reloj de los sexenios
El Problema: El "Cuello de Botella" de la Verificación Manual
Históricamente, el apoyo a la investigación para sexenios ha dependido de un esfuerzo humano intensivo. Los retos de esta última convocatoria eran de tres tipos:
- Estacionalidad: Ventanas de respuesta reducidas, agravadas por los periodos no lectivos (Navidad).
- Escalabilidad: Con la apertura de sexenios al personal laboral, la demanda de informes se ha multiplicado exponencialmente.
- Fatiga Cognitiva: Navegar repetitivamente por Dialnet, MIAR o Google Scholar para transcribir datos es una tarea mecánica que provoca saturación y aumenta el riesgo de error humano.
El coste de oportunidad: Cada hora dedicada a "copiar y pegar" es una hora que se resta al asesoramiento personalizado o a la formación especializada de nuestros investigadores.
La Solución: Un Ecosistema de Automatización a Medida
Para transformar esta realidad, hemos desarrollado un sistema híbrido que combina Python, IA y VBA, actuando como un "asistente virtual" de alto rendimiento para el bibliotecario.
1. Recolección Inteligente (Python + IA)
Utilizamos scripts desarrollados con asistencia de IA para extraer datos mediante tres estrategias complementarias:
- APIs Directas: Conexión inmediata con Google Scholar y Semantic Scholar, logrando una extracción aproximada de 2 segundos por referencia.
- Scraping Ético: Robots programados para navegar de forma respetuosa (con retardos de cortesía) por Dialnet, ERIH+, Sello de Calidad FECYT (SiLice) y MIAR.
- Navegación Asistida: Una extensión de Chrome para SJR (Scimago) que mantiene al humano "en el bucle" (human-in-the-loop) para validaciones de seguridad.
2. Generación de Informes (VBA)
Una vez estructurados los datos, automatizamos la salida documental. Mediante macros en VBA (Word), el sistema limpia formatos, elimina campos vacíos y genera borradores masivos listos para la revisión final.
Impacto Real: Más que solo Velocidad
Tras procesar un volumen de 225 referencias bibliográficas, los resultados demuestran un cambio de paradigma en nuestra operativa:
| Fuente / Tarea | Tiempo Manual Estimado | Tiempo Automatizado | Impacto |
|---|---|---|---|
| Google Scholar / Semantic | Varios minutos | ~2 segundos | Reducción drástica |
| Bases de Datos (Dialnet/MIAR...) | Alto (múltiples clics) | 5-25 segundos | Liberación de carga mental |
| Limpieza de Informes (40p) | 30-60 minutos | 2 minutos | Ahorro de tiempo crítico |
Auditoría de Calidad y Control
Para garantizar la fiabilidad de los resultados, implementamos un protocolo de "catas" aleatorias sobre el 20% de la muestra:
- Tasa de acierto: 100% en los datos recuperados con éxito de Dialnet, MIAR, ERIH+, SiLice y Semantic Scholar.
- Resiliencia del sistema: Detectamos "falsos negativos" en procesos de scraping debido a microcortes de red. Para solucionarlo, implementamos un sistema de segunda vuelta que reintenta automáticamente la extracción de datos incompletos.
- Supervisión necesaria: Se halló un 10% de discrepancias en citas de Google Scholar por limitaciones propias de su API. Esto refuerza nuestra visión: la IA es un soporte potente, pero no sustituye el criterio del profesional de la información.
El Futuro: Sostenibilidad y Colaboración
Este proyecto demuestra que las bibliotecas pueden liderar la transformación digital con herramientas de bajo coste. Sin embargo, el camino continúa:
- Mantenimiento Estacional: Es necesaria una revisión técnica anual de los scripts para adaptarlos a cambios en las webs de origen.
- Optimización de Algoritmos: Seguimos trabajando para refinar la extracción de citas en tiempo real y mitigar las limitaciones de las APIs gratuitas.
¡Pruébalo y Colabora!
Queremos que estas herramientas sean útiles para toda la comunidad:
- 🚀 Prueba la demo: Sube tus propios datos (siguiendo el formato de columnas indicado) en nuestro Extractor de información para sexenios en Hugging Face.
- 💬 Participa: Deja un comentario aquí debajo con tus ideas o sugerencias de mejora.
- ✉️ Conectemos: Si trabajas en una biblioteca y te enfrentas a retos similares, estaré encantado de charlar. Escríbeme a: dferalv@gmail.com.

