De la fatiga al clic: Python e IA para vencer la carrera contra el reloj de los sexenios

Community Article Published April 10, 2026

En la Biblioteca de Ciencias Económicas y Empresariales de la UAM, sabemos que la temporada de sexenios es el "momento crítico" del año. Las convocatorias de la ANECA suelen llegar con plazos ajustados y en periodos vacacionales, generando un cuello de botella que tradicionalmente obligaba a detener servicios esenciales para validar datos de forma manual.

El Problema: El "Cuello de Botella" de la Verificación Manual

Históricamente, el apoyo a la investigación para sexenios ha dependido de un esfuerzo humano intensivo. Los retos de esta última convocatoria eran de tres tipos:

  • Estacionalidad: Ventanas de respuesta reducidas, agravadas por los periodos no lectivos (Navidad).
  • Escalabilidad: Con la apertura de sexenios al personal laboral, la demanda de informes se ha multiplicado exponencialmente.
  • Fatiga Cognitiva: Navegar repetitivamente por Dialnet, MIAR o Google Scholar para transcribir datos es una tarea mecánica que provoca saturación y aumenta el riesgo de error humano.

El coste de oportunidad: Cada hora dedicada a "copiar y pegar" es una hora que se resta al asesoramiento personalizado o a la formación especializada de nuestros investigadores.


La Solución: Un Ecosistema de Automatización a Medida

Para transformar esta realidad, hemos desarrollado un sistema híbrido que combina Python, IA y VBA, actuando como un "asistente virtual" de alto rendimiento para el bibliotecario.

1. Recolección Inteligente (Python + IA)

Utilizamos scripts desarrollados con asistencia de IA para extraer datos mediante tres estrategias complementarias:

  • APIs Directas: Conexión inmediata con Google Scholar y Semantic Scholar, logrando una extracción aproximada de 2 segundos por referencia.
  • Scraping Ético: Robots programados para navegar de forma respetuosa (con retardos de cortesía) por Dialnet, ERIH+, Sello de Calidad FECYT (SiLice) y MIAR.
  • Navegación Asistida: Una extensión de Chrome para SJR (Scimago) que mantiene al humano "en el bucle" (human-in-the-loop) para validaciones de seguridad.

2. Generación de Informes (VBA)

Una vez estructurados los datos, automatizamos la salida documental. Mediante macros en VBA (Word), el sistema limpia formatos, elimina campos vacíos y genera borradores masivos listos para la revisión final.


Impacto Real: Más que solo Velocidad

Tras procesar un volumen de 225 referencias bibliográficas, los resultados demuestran un cambio de paradigma en nuestra operativa:

Fuente / Tarea Tiempo Manual Estimado Tiempo Automatizado Impacto
Google Scholar / Semantic Varios minutos ~2 segundos Reducción drástica
Bases de Datos (Dialnet/MIAR...) Alto (múltiples clics) 5-25 segundos Liberación de carga mental
Limpieza de Informes (40p) 30-60 minutos 2 minutos Ahorro de tiempo crítico

Auditoría de Calidad y Control

Para garantizar la fiabilidad de los resultados, implementamos un protocolo de "catas" aleatorias sobre el 20% de la muestra:

  • Tasa de acierto: 100% en los datos recuperados con éxito de Dialnet, MIAR, ERIH+, SiLice y Semantic Scholar.
  • Resiliencia del sistema: Detectamos "falsos negativos" en procesos de scraping debido a microcortes de red. Para solucionarlo, implementamos un sistema de segunda vuelta que reintenta automáticamente la extracción de datos incompletos.
  • Supervisión necesaria: Se halló un 10% de discrepancias en citas de Google Scholar por limitaciones propias de su API. Esto refuerza nuestra visión: la IA es un soporte potente, pero no sustituye el criterio del profesional de la información.

El Futuro: Sostenibilidad y Colaboración

Este proyecto demuestra que las bibliotecas pueden liderar la transformación digital con herramientas de bajo coste. Sin embargo, el camino continúa:

  1. Mantenimiento Estacional: Es necesaria una revisión técnica anual de los scripts para adaptarlos a cambios en las webs de origen.
  2. Optimización de Algoritmos: Seguimos trabajando para refinar la extracción de citas en tiempo real y mitigar las limitaciones de las APIs gratuitas.

¡Pruébalo y Colabora!

Queremos que estas herramientas sean útiles para toda la comunidad:

  • 🚀 Prueba la demo: Sube tus propios datos (siguiendo el formato de columnas indicado) en nuestro Extractor de información para sexenios en Hugging Face.
  • 💬 Participa: Deja un comentario aquí debajo con tus ideas o sugerencias de mejora.
  • ✉️ Conectemos: Si trabajas en una biblioteca y te enfrentas a retos similares, estaré encantado de charlar. Escríbeme a: dferalv@gmail.com.

Community

Sign up or log in to comment