De la fatiga al clic: Python e IA para vencer la carrera contra el reloj de los sexenios

Community Article Published April 10, 2026

En la Biblioteca de Ciencias Económicas y Empresariales de la UAM, sabemos que la temporada de sexenios es el "momento crítico" del año. Las convocatorias de la ANECA suelen llegar con plazos ajustados y en periodos vacacionales, generando un cuello de botella que tradicionalmente obligaba a detener servicios esenciales para validar datos de forma manual.

El Problema: El "Cuello de Botella" de la Verificación Manual

Históricamente, el apoyo a la investigación para sexenios ha dependido de un esfuerzo humano intensivo. Los retos de esta última convocatoria eran de tres tipos:

Estacionalidad: Ventanas de respuesta reducidas, agravadas por los periodos no lectivos (Navidad).
Escalabilidad: Con la apertura de sexenios al personal laboral, la demanda de informes se ha multiplicado exponencialmente.
Fatiga Cognitiva: Navegar repetitivamente por Dialnet, MIAR o Google Scholar para transcribir datos es una tarea mecánica que provoca saturación y aumenta el riesgo de error humano.

El coste de oportunidad: Cada hora dedicada a "copiar y pegar" es una hora que se resta al asesoramiento personalizado o a la formación especializada de nuestros investigadores.

La Solución: Un Ecosistema de Automatización a Medida

Para transformar esta realidad, hemos desarrollado un sistema híbrido que combina Python, IA y VBA, actuando como un "asistente virtual" de alto rendimiento para el bibliotecario.

1. Recolección Inteligente (Python + IA)

Utilizamos scripts desarrollados con asistencia de IA para extraer datos mediante tres estrategias complementarias:

APIs Directas: Conexión inmediata con Google Scholar y Semantic Scholar, logrando una extracción aproximada de 2 segundos por referencia.
Scraping Ético: Robots programados para navegar de forma respetuosa (con retardos de cortesía) por Dialnet, ERIH+, Sello de Calidad FECYT (SiLice) y MIAR.
Navegación Asistida: Una extensión de Chrome para SJR (Scimago) que mantiene al humano "en el bucle" (human-in-the-loop) para validaciones de seguridad.

2. Generación de Informes (VBA)

Una vez estructurados los datos, automatizamos la salida documental. Mediante macros en VBA (Word), el sistema limpia formatos, elimina campos vacíos y genera borradores masivos listos para la revisión final.

Impacto Real: Más que solo Velocidad

Tras procesar un volumen de 225 referencias bibliográficas, los resultados demuestran un cambio de paradigma en nuestra operativa:

Fuente / Tarea	Tiempo Manual Estimado	Tiempo Automatizado	Impacto
Google Scholar / Semantic	Varios minutos	~2 segundos	Reducción drástica
Bases de Datos (Dialnet/MIAR...)	Alto (múltiples clics)	5-25 segundos	Liberación de carga mental
Limpieza de Informes (40p)	30-60 minutos	2 minutos	Ahorro de tiempo crítico

Auditoría de Calidad y Control

Para garantizar la fiabilidad de los resultados, implementamos un protocolo de "catas" aleatorias sobre el 20% de la muestra:

Tasa de acierto: 100% en los datos recuperados con éxito de Dialnet, MIAR, ERIH+, SiLice y Semantic Scholar.
Resiliencia del sistema: Detectamos "falsos negativos" en procesos de scraping debido a microcortes de red. Para solucionarlo, implementamos un sistema de segunda vuelta que reintenta automáticamente la extracción de datos incompletos.
Supervisión necesaria: Se halló un 10% de discrepancias en citas de Google Scholar por limitaciones propias de su API. Esto refuerza nuestra visión: la IA es un soporte potente, pero no sustituye el criterio del profesional de la información.

El Futuro: Sostenibilidad y Colaboración

Este proyecto demuestra que las bibliotecas pueden liderar la transformación digital con herramientas de bajo coste. Sin embargo, el camino continúa:

Mantenimiento Estacional: Es necesaria una revisión técnica anual de los scripts para adaptarlos a cambios en las webs de origen.
Optimización de Algoritmos: Seguimos trabajando para refinar la extracción de citas en tiempo real y mitigar las limitaciones de las APIs gratuitas.

¡Pruébalo y Colabora!

Queremos que estas herramientas sean útiles para toda la comunidad:

🚀 Prueba la demo: Sube tus propios datos (siguiendo el formato de columnas indicado) en nuestro Extractor de información para sexenios en Hugging Face.
💬 Participa: Deja un comentario aquí debajo con tus ideas o sugerencias de mejora.
✉️ Conectemos: Si trabajas en una biblioteca y te enfrentas a retos similares, estaré encantado de charlar. Escríbeme a: dferalv@gmail.com.

Rompiendo la barrera física de la biblioteca: Una app para democratizar el acceso a libros de expurgo

November 21, 2025

Tomando decisiones basadas en datos: Una App para validar los horarios de las Bibliotecas UAM

November 14, 2025

Community

Upload images, audio, and videos by dragging in the text input, pasting, or clicking here.

Tap or paste here to upload images

· Sign up or log in to comment

Upvote