Spaces:

sajith-0701
/

interviewbot

Sleeping

App Files Files Community

interviewbot / backend /services /interview_service.py

sajith-0701

v4.1

e39cad1 about 1 month ago

raw

history blame contribute delete

90.5 kB

	import json
	import asyncio
	import random
	import re
	from time import perf_counter
	from bson import ObjectId
	from database import get_db, get_redis
	from models.collections import SESSIONS, USERS, JOB_ROLES, SKILLS, QUESTIONS, TOPICS, TOPIC_QUESTIONS, RESUMES, JD_VERIFICATIONS, ANSWERS
	from utils.helpers import generate_id, utc_now, str_objectid
	from utils.skills import normalize_skill_list, build_interview_focus_skills
	from services.interview_graph import run_interview_graph
	from utils.gemini import generate_interview_question_batch, analyze_resume_vs_job_description
	from services.job_description_service import get_job_description_for_user
	from services.gemini_service import (
	evaluate_and_generate_followup,
	generate_resume_seed_questions,
	generate_topic_followup_batch,
	)
	from services.queue_service import (
	enqueue_question,
	flush_backlog_to_queue,
	get_recent_context_items,
	mark_question_asked,
	normalize_question_text,
	peek_next_question,
	pop_next_question,
	push_context_item,
	queue_size,
	)
	from services.tts_service import prefetch_wav
	from services.latency_service import record_latency

	MAX_QUESTIONS = 20
	RESUME_MAX_QUESTIONS = 10
	RESUME_INITIAL_BATCH_SIZE = 2
	SESSION_TTL = 7200 # 2 hours
	BATCH_SIZE = 5
	PREGEN_MIN_PENDING = 2
	FOLLOWUP_AI_COUNT = 2
	FOLLOWUP_BANK_COUNT = 3
	MAX_QUEUE_SIZE = 3
	CONTEXT_CACHE_ITEMS = 3

	TOPIC_INITIAL_DB_QUESTIONS = 5
	TOPIC_INITIAL_ASK_COUNT = 4
	TOPIC_AI_FOLLOWUPS = 3
	TOPIC_DB_FOLLOWUPS = 2
	TOPIC_TOTAL_QUESTIONS = 10
	MAX_SAME_TOPIC_FOLLOWUPS = 2
	THIRD_FOLLOWUP_NEED_SCORE = 95

	# Local process memory summary requested in workflow.
	_LOCAL_SUMMARIES: dict[str, str] = {}
	_PREGEN_IN_FLIGHT: set[str] = set()
	_POST_SUBMIT_LOCKS: dict[str, asyncio.Lock] = {}
	_QUESTION_STOPWORDS = {
	"a", "an", "and", "are", "as", "at", "be", "by", "for", "from", "how", "if", "in", "into",
	"is", "it", "of", "on", "or", "that", "the", "this", "to", "using", "what", "when", "with", "would",
	}
	_GENERIC_SOFT_SKILL_KEYS = {
	"problem solving",
	"analytical skills",
	"communication",
	"communication skills",
	"teamwork",
	"leadership",
	"adaptability",
	"time management",
	"critical thinking",
	}


	def _safe_json_list(value: str) -> list:
	try:
	data = json.loads(value or "[]")
	return data if isinstance(data, list) else []
	except Exception:
	return []


	def _question_fingerprint(text: str) -> str:
	base = (text or "").strip().lower()
	base = re.sub(r"[^a-z0-9\s]", " ", base)
	base = re.sub(r"\s+", " ", base).strip()
	return base


	def _question_token_set(text: str) -> set[str]:
	key = _question_fingerprint(text)
	tokens = [token for token in key.split() if token and token not in _QUESTION_STOPWORDS]
	return set(tokens)


	def _is_question_too_similar(candidate: str, recent_questions: list[str]) -> bool:
	candidate_key = _question_fingerprint(candidate)
	if not candidate_key:
	return True

	candidate_tokens = _question_token_set(candidate)
	candidate_opening = " ".join(candidate_key.split()[:6])

	for text in (recent_questions or [])[-5:]:
	other_key = _question_fingerprint(text)
	if not other_key:
	continue
	if candidate_key == other_key:
	return True

	other_opening = " ".join(other_key.split()[:6])
	if candidate_opening and candidate_opening == other_opening:
	return True

	other_tokens = _question_token_set(text)
	if not candidate_tokens or not other_tokens:
	continue

	intersection = len(candidate_tokens & other_tokens)
	union = len(candidate_tokens \| other_tokens)
	if union <= 0:
	continue

	jaccard = intersection / union
	if jaccard >= 0.72:
	return True

	return False


	def _unique_question_items(items: list[dict], *, excluded_questions: list[str], limit: int) -> list[dict]:
	excluded = {_question_fingerprint(q) for q in excluded_questions if q}
	unique: list[dict] = []
	for item in items or []:
	text = (item.get("question") or "").strip()
	if not text:
	continue
	key = _question_fingerprint(text)
	if not key or key in excluded:
	continue
	excluded.add(key)
	unique.append(
	{
	"question": text,
	"difficulty": item.get("difficulty", "medium"),
	"category": item.get("category", "general"),
	}
	)
	if len(unique) >= limit:
	break
	return unique


	def _update_local_summary(session_id: str, question: str, answer: str) -> None:
	existing = _LOCAL_SUMMARIES.get(session_id, "")
	combined = f"{existing}\nQ: {question}\nA: {answer}".strip()
	# Keep summary bounded in memory.
	_LOCAL_SUMMARIES[session_id] = combined[-1500:]


	def _safe_int(value, default: int = 0) -> int:
	try:
	return int(value)
	except Exception:
	return default


	def _safe_score_0_100(value, default: int = 0) -> int:
	score = _safe_int(value, default)
	if score < 0:
	return 0
	if score > 100:
	return 100
	return score


	def _normalize_voice_gender(value: str \| None) -> str:
	return "male" if (value or "").strip().lower() == "male" else "female"


	def _consume_prefetch_task_result(task: asyncio.Task) -> None:
	try:
	task.result()
	except Exception:
	# Prefetch is optional; ignore failures to avoid noisy task warnings.
	pass


	def _schedule_question_audio_prefetch(questions: list[str], voice_gender: str) -> None:
	for q in questions:
	text = (q or "").strip()
	if not text:
	continue
	try:
	task = asyncio.create_task(prefetch_wav(text, voice_gender))
	task.add_done_callback(_consume_prefetch_task_result)
	except Exception:
	# Best-effort optimization only.
	pass


	def _get_post_submit_lock(session_id: str) -> asyncio.Lock:
	lock = _POST_SUBMIT_LOCKS.get(session_id)
	if lock is None:
	lock = asyncio.Lock()
	_POST_SUBMIT_LOCKS[session_id] = lock
	return lock


	def _consume_post_submit_task_result(task: asyncio.Task) -> None:
	try:
	task.result()
	except Exception:
	# Background processing is best-effort; ignore task-level failures.
	pass


	def _current_generation_stats(session: dict) -> dict:
	return {
	"gemini_calls": _safe_int(session.get("metrics_gemini_calls", 0)),
	"gemini_questions": _safe_int(session.get("metrics_gemini_questions", 0)),
	"bank_questions": _safe_int(session.get("metrics_bank_questions", 0)),
	"bank_shortfall": _safe_int(session.get("metrics_bank_shortfall", 0)),
	"generation_batches": _safe_int(session.get("metrics_generation_batches", 0)),
	}


	def _normalize_bank_difficulty(value: str) -> str:
	difficulty = (value or "medium").strip().lower()
	if difficulty not in {"easy", "medium", "hard"}:
	return "medium"
	if difficulty == "easy":
	return "medium"
	return difficulty


	def _resume_skill_pool(session: dict) -> list[str]:
	jd_skills = normalize_skill_list(_safe_json_list(session.get("jd_required_skills", "[]")))
	focus_skills = normalize_skill_list(_safe_json_list(session.get("skills", "[]")))

	ordered: list[str] = []
	seen: set[str] = set()
	for skill in jd_skills + focus_skills:
	key = _question_fingerprint(skill)
	if not key or key in seen:
	continue
	seen.add(key)
	ordered.append(skill)

	concrete = [skill for skill in ordered if _question_fingerprint(skill) not in _GENERIC_SOFT_SKILL_KEYS]
	if len(concrete) >= 2:
	return concrete

	return ordered or ["core technical concepts"]


	def _infer_focus_skill_from_question(question_text: str, skill_pool: list[str]) -> str \| None:
	normalized_question = _question_fingerprint(question_text)
	if not normalized_question:
	return None

	best_skill = None
	best_score = 0

	for skill in skill_pool:
	normalized_skill = _question_fingerprint(skill)
	if not normalized_skill:
	continue

	tokens = [token for token in normalized_skill.split() if len(token) >= 3]
	if not tokens:
	tokens = normalized_skill.split()

	score = sum(1 for token in tokens if token and token in normalized_question)
	if normalized_skill in normalized_question:
	score = max(score, len(tokens) + 1)

	if score > best_score:
	best_score = score
	best_skill = skill

	return best_skill if best_score > 0 else None


	def _recent_focus_streak(question_texts: list[str], skill_pool: list[str]) -> tuple[str \| None, int]:
	active_skill = None
	streak = 0

	for text in reversed(question_texts):
	skill = _infer_focus_skill_from_question(text, skill_pool)
	if not skill:
	break

	if active_skill is None:
	active_skill = skill
	streak = 1
	continue

	if _question_fingerprint(skill) == _question_fingerprint(active_skill):
	streak += 1
	continue

	break

	return active_skill, streak


	def _pick_alternate_focus_skill(skill_pool: list[str], current_skill: str \| None, seed: int) -> str \| None:
	if not skill_pool:
	return None

	if current_skill:
	current_key = _question_fingerprint(current_skill)
	alternatives = [skill for skill in skill_pool if _question_fingerprint(skill) != current_key]
	if alternatives:
	return alternatives[max(0, seed) % len(alternatives)]

	return skill_pool[max(0, seed) % len(skill_pool)]


	def _apply_resume_followup_policy(
	*,
	skill_pool: list[str],
	recent_focus_topic: str \| None,
	same_topic_streak: int,
	suggested_question: str,
	suggested_topic: str \| None,
	followup_need_score: int,
	answered_count: int,
	) -> tuple[str, str \| None]:
	follow_text = (suggested_question or "").strip()
	topic = (suggested_topic or "").strip()

	if not topic and follow_text:
	inferred = _infer_focus_skill_from_question(follow_text, skill_pool)
	if inferred:
	topic = inferred

	topic_key = _question_fingerprint(topic)
	recent_key = _question_fingerprint(recent_focus_topic or "")

	if (
	same_topic_streak >= MAX_SAME_TOPIC_FOLLOWUPS
	and topic_key
	and recent_key
	and topic_key == recent_key
	and _safe_score_0_100(followup_need_score) < THIRD_FOLLOWUP_NEED_SCORE
	):
	return "", _pick_alternate_focus_skill(skill_pool, recent_focus_topic, answered_count)

	return follow_text, None


	def _avg_recent_answer_words(qa_pairs: list, window: int = 3) -> int:
	if not qa_pairs:
	return 0
	recent = qa_pairs[-window:]
	lengths = [len((item.get("answer") or "").split()) for item in recent]
	if not lengths:
	return 0
	return sum(lengths) // len(lengths)


	def _plan_followup_mix(target: int, qa_pairs: list, has_bank_source: bool) -> tuple[int, int]:
	"""Decide AI-vs-bank split for the next batch.

	Baseline: 3 AI + 2 bank. Adaptation:
	- Short answers -> increase bank ratio for stability.
	- Rich answers -> increase AI follow-up ratio for personalization.
	"""
	if target <= 0:
	return 0, 0
	if not has_bank_source:
	return target, 0

	avg_words = _avg_recent_answer_words(qa_pairs)

	ai_target = min(FOLLOWUP_AI_COUNT, target)
	if avg_words < 18:
	ai_target = min(2, target)
	elif avg_words > 70:
	ai_target = min(4, target)

	# Keep at least one bank question when a bank source exists and batch size allows.
	if target > 1:
	ai_target = min(ai_target, target - 1)

	bank_target = target - ai_target
	return ai_target, bank_target


	async def _resolve_role_title(db, role_id: str \| None, custom_role: str \| None) -> str:
	if custom_role and custom_role.strip():
	return custom_role.strip()

	if role_id:
	try:
	role = await db[JOB_ROLES].find_one({"_id": ObjectId(role_id)})
	if role:
	return role["title"]
	except Exception:
	# If it's not a valid ObjectId, treat it as a direct generic title.
	return role_id

	return "Software Developer"


	async def _get_recent_user_questions(db, user_id: str, limit: int = 40) -> list[str]:
	recent: list[str] = []
	seen: set[str] = set()

	cursor = db[ANSWERS].find({"user_id": user_id}, {"question": 1}).sort("stored_at", -1).limit(limit)
	async for doc in cursor:
	text = (doc.get("question") or "").strip()
	key = _question_fingerprint(text)
	if not text or not key or key in seen:
	continue
	seen.add(key)
	recent.append(text)

	return recent


	def _build_resume_intro_question(role_title: str, jd_title: str) -> str:
	role = (role_title or "this role").strip()
	title = (jd_title or "").strip()

	def _normalized_key(value: str) -> str:
	key = re.sub(r"[^a-z0-9\s]", " ", (value or "").lower())
	key = re.sub(r"\s+", " ", key).strip()
	for prefix in ("the ", "an ", "a "):
	if key.startswith(prefix):
	key = key[len(prefix):].strip()
	break
	return key

	role_clean = re.sub(r"\s+", " ", role).strip()
	if role_clean.lower().startswith("the "):
	role_clean = role_clean[4:].strip()
	role_phrase = f"the {role_clean}" if role_clean.lower().endswith(" role") else f"the {role_clean} role"

	role_key = _normalized_key(role_clean)
	title_key = _normalized_key(title)
	is_generic_title = title_key in {
	"",
	"selected job description",
	role_key,
	f"{role_key} role",
	}

	if is_generic_title:
	return f"Introduce yourself and explain how your background aligns with {role_phrase}."

	title_phrase = title if title.lower().startswith(("the ", "an ", "a ")) else f"the {title}"
	return (
	f"Introduce yourself and explain how your background aligns with {role_phrase} "
	f"in {title_phrase} job description."
	)


	def _build_resume_resilient_followup_question(
	session: dict,
	question_number: int,
	variant: int = 0,
	focus_skill: str \| None = None,
	) -> str:
	role_title = (session.get("role_title") or "this role").strip()
	skill_pool = _resume_skill_pool(session)

	index = max(0, question_number - 1) + max(0, variant)
	skill = (focus_skill or "").strip() or skill_pool[index % len(skill_pool)]

	templates = [
	"Describe a real project where you applied {skill} for {role}. What constraints and trade-offs shaped your design?",
	"If {skill} failed in production for a {role} workflow, how would you debug it step by step?",
	"Explain how you would test and validate a solution using {skill} before shipping it for {role}.",
	"Compare two approaches for {skill} in a {role} context and justify the final choice.",
	"Design an improvement plan to make your {skill} implementation more scalable and reliable for {role}.",
	"Your {role} service using {skill} has intermittent latency spikes. How would you investigate and stabilize it?",
	"During code review, what risks would you look for in a {skill} implementation for {role}, and why?",
	"How would you design rollback and observability for a feature centered on {skill} in {role}?",
	"Assume two engineers propose different {skill} strategies for {role}. How would you evaluate and choose between them?",
	"What failure modes around {skill} are easiest to miss in {role}, and how would you proactively test them?",
	]
	template = templates[index % len(templates)]
	return template.format(skill=skill, role=role_title)


	def _build_topic_resilient_followup_question(session: dict, question_number: int, variant: int = 0) -> str:
	topic_name = (session.get("role_title") or "this topic").strip()
	index = max(0, question_number - 1) + max(0, variant)

	templates = [
	"Explain {topic} with a practical example from a production-like scenario.",
	"What are the most common failure patterns in {topic}, and how would you detect them early?",
	"Design a step-by-step implementation plan for {topic} with measurable checkpoints.",
	"Compare two approaches in {topic}, including trade-offs in scalability, latency, and maintainability.",
	"If a {topic} solution regressed after deployment, how would you triage and recover safely?",
	]
	template = templates[index % len(templates)]
	return template.format(topic=topic_name)


	async def _enqueue_resume_followup_with_fallback(
	*,
	redis,
	session_id: str,
	session: dict,
	answered_count: int,
	suggested_text: str,
	suggested_difficulty: str,
	suggested_category: str,
	focus_skill_override: str \| None = None,
	) -> tuple[str \| None, bool]:
	candidates: list[tuple[str, str, str, bool]] = []
	existing_questions = await _get_session_question_texts(redis, session_id)

	primary = (suggested_text or "").strip()
	if primary:
	candidates.append((primary, suggested_difficulty or "medium", suggested_category or "follow-up", True))

	# Deterministic local fallback prevents early completion when model output is empty/duplicate.
	base_question_number = max(2, answered_count + 1)
	for variant in range(6):
	question_number = base_question_number + variant
	fallback_text = _build_resume_resilient_followup_question(
	session=session,
	question_number=question_number,
	variant=variant,
	focus_skill=focus_skill_override,
	)
	candidates.append((fallback_text, "medium", "resume-fallback", False))

	seen: set[str] = set()
	for text, difficulty, category, is_primary in candidates:
	normalized_text = normalize_question_text(text)
	if _is_question_too_similar(normalized_text, existing_questions):
	continue

	key = _question_fingerprint(normalized_text)
	if not key or key in seen:
	continue
	seen.add(key)

	qid = await enqueue_question(
	redis=redis,
	session_id=session_id,
	question=normalized_text,
	difficulty=difficulty,
	category=category,
	ttl_seconds=SESSION_TTL,
	max_queue_size=MAX_QUEUE_SIZE,
	)
	if qid:
	existing_questions.append(normalized_text)
	return qid, is_primary

	return None, False


	async def _get_session_question_texts(redis, session_id: str) -> list[str]:
	question_ids = await redis.lrange(f"session:{session_id}:questions", 0, -1)
	output: list[str] = []
	for qid in question_ids:
	q = await redis.hgetall(f"session:{session_id}:q:{qid}")
	text = (q.get("question") or "").strip()
	if text:
	output.append(text)
	return output


	async def _get_answered_question_texts(redis, session_id: str, limit: int = 4) -> list[str]:
	answer_ids = await redis.lrange(f"session:{session_id}:answers", -max(1, limit), -1)
	output: list[str] = []

	for qid in answer_ids:
	answer_data = await redis.hgetall(f"session:{session_id}:a:{qid}")
	text = (answer_data.get("question") or "").strip()
	if not text:
	q = await redis.hgetall(f"session:{session_id}:q:{qid}")
	text = (q.get("question") or "").strip()
	if text:
	output.append(text)

	return output


	async def _sample_topic_questions(
	db,
	topic_id: str,
	excluded_questions: list[str],
	limit: int,
	) -> list[dict]:
	if limit <= 0:
	return []

	docs = await db[TOPIC_QUESTIONS].find({"topic_id": topic_id}).to_list(length=500)
	random.shuffle(docs)
	excluded = {_question_fingerprint(q) for q in excluded_questions if q}

	selected: list[dict] = []
	for doc in docs:
	text = (doc.get("question") or "").strip()
	if not text:
	continue
	fp = _question_fingerprint(text)
	if not fp or fp in excluded:
	continue

	excluded.add(fp)
	selected.append(
	{
	"question": text,
	"difficulty": _normalize_bank_difficulty(doc.get("difficulty") or "medium"),
	"category": doc.get("category") or "topic",
	}
	)
	if len(selected) >= limit:
	break

	return selected


	async def _seed_resume_questions_task(session_id: str) -> None:
	db = get_db()
	redis = get_redis()

	session = await redis.hgetall(f"session:{session_id}")
	if not session or session.get("status") != "in_progress" or session.get("interview_type") != "resume":
	return

	try:
	await flush_backlog_to_queue(
	redis=redis,
	session_id=session_id,
	ttl_seconds=SESSION_TTL,
	max_queue_size=MAX_QUEUE_SIZE,
	)

	current_q_size = await queue_size(redis, session_id)
	needed = max(0, RESUME_INITIAL_BATCH_SIZE - current_q_size)

	if needed > 0:
	excluded_questions = await _get_session_question_texts(redis, session_id)
	seed_items = await generate_resume_seed_questions(
	role_title=session.get("role_title", "Software Developer"),
	resume_summary=session.get("resume_summary", "No summary available"),
	resume_skills=_safe_json_list(session.get("skills", "[]")),
	jd_title=session.get("job_description_title", ""),
	jd_description=session.get("job_description_text", ""),
	jd_required_skills=_safe_json_list(session.get("jd_required_skills", "[]")),
	excluded_questions=excluded_questions,
	count=needed,
	)

	appended = 0
	for item in seed_items:
	qid = await enqueue_question(
	redis=redis,
	session_id=session_id,
	question=item.get("question", ""),
	difficulty=item.get("difficulty", "medium"),
	category=item.get("category", "resume-seed"),
	ttl_seconds=SESSION_TTL,
	max_queue_size=MAX_QUEUE_SIZE,
	)
	if qid:
	appended += 1

	await redis.hset(
	f"session:{session_id}",
	mapping={
	"generated_count": str(_safe_int(session.get("generated_count", 0)) + appended),
	"metrics_gemini_calls": str(_safe_int(session.get("metrics_gemini_calls", 0)) + 1),
	"metrics_gemini_questions": str(_safe_int(session.get("metrics_gemini_questions", 0)) + appended),
	"metrics_generation_batches": str(_safe_int(session.get("metrics_generation_batches", 0)) + 1),
	},
	)

	await db[SESSIONS].update_one(
	{"session_id": session_id},
	{
	"$set": {
	"metrics_gemini_calls": _safe_int(session.get("metrics_gemini_calls", 0)) + 1,
	"metrics_gemini_questions": _safe_int(session.get("metrics_gemini_questions", 0)) + appended,
	"metrics_generation_batches": _safe_int(session.get("metrics_generation_batches", 0)) + 1,
	}
	},
	)

	await flush_backlog_to_queue(
	redis=redis,
	session_id=session_id,
	ttl_seconds=SESSION_TTL,
	max_queue_size=MAX_QUEUE_SIZE,
	)

	next_qid, next_q = await peek_next_question(redis, session_id)
	if next_qid and next_q:
	_schedule_question_audio_prefetch(
	[next_q.get("question", "")],
	_normalize_voice_gender(session.get("speech_voice_gender")),
	)
	except Exception:
	# Non-blocking pre-seed path should never fail interview startup.
	return


	def _normalize_role_key(role_title: str) -> str:
	normalized = re.sub(r"\s+", " ", (role_title or "").strip().lower())
	return normalized or "software developer"


	def _build_verification_cache_key(
	role_key: str,
	jd_id: str,
	jd_updated_at: str,
	resume_uploaded_at: str,
	) -> str:
	return "\|\|".join([
	role_key or "software developer",
	jd_id or "-",
	jd_updated_at or "-",
	resume_uploaded_at or "-",
	])


	def _verification_doc_to_response(doc: dict, *, message: str, cached: bool) -> dict:
	return {
	"verification_id": doc.get("verification_id"),
	"saved_at": doc.get("saved_at") or doc.get("created_at") or utc_now(),
	"role_title": doc.get("role_title"),
	"job_description": doc.get("job_description") or {},
	"resume_snapshot": doc.get("resume_snapshot") or {},
	"jd_alignment": doc.get("jd_alignment") or {},
	"message": message,
	"cached": cached,
	}


	async def verify_resume_job_description(
	user_id: str,
	role_id: str = None,
	custom_role: str = None,
	job_description_id: str = None,
	) -> dict:
	"""Run resume-vs-job-description verification without starting an interview.

	Reuses a saved verification while the selected role, JD version, and resume
	upload timestamp are unchanged.
	"""
	if not job_description_id:
	raise ValueError("job_description_id is required for verification")

	db = get_db()

	resume_doc = await db[RESUMES].find_one({"user_id": user_id})
	if not resume_doc:
	raise ValueError("Please upload your resume before running verification")

	skills_doc = await db[SKILLS].find_one({"user_id": user_id})
	resume_skills = normalize_skill_list(skills_doc.get("skills", [])) if skills_doc else []

	parsed_data = (resume_doc or {}).get("parsed_data", {}) or {}
	summary_parts = [
	parsed_data.get("experience_summary") or "",
	" ".join(parsed_data.get("recommended_roles", []) or []),
	]
	resume_summary = "\n".join([part for part in summary_parts if part]).strip() or "No summary available"

	role_title = await _resolve_role_title(db, role_id=role_id, custom_role=custom_role)
	role_key = _normalize_role_key(role_title)
	selected_jd = await get_job_description_for_user(user_id, job_description_id)

	resume_uploaded_at = resume_doc.get("uploaded_at") or ""
	jd_updated_at = selected_jd.get("updated_at") or ""
	cache_key = _build_verification_cache_key(
	role_key=role_key,
	jd_id=selected_jd.get("id") or job_description_id,
	jd_updated_at=jd_updated_at,
	resume_uploaded_at=resume_uploaded_at,
	)

	existing_verification = await db[JD_VERIFICATIONS].find_one(
	{"user_id": user_id, "cache_key": cache_key},
	sort=[("created_at", -1)],
	)

	if not existing_verification:
	compatibility_query = {
	"user_id": user_id,
	"role_title": role_title,
	"job_description.id": selected_jd.get("id"),
	"resume_snapshot.uploaded_at": resume_uploaded_at,
	}
	if jd_updated_at:
	compatibility_query["job_description.updated_at"] = jd_updated_at

	existing_verification = await db[JD_VERIFICATIONS].find_one(
	compatibility_query,
	sort=[("created_at", -1)],
	)

	if existing_verification:
	await db[JD_VERIFICATIONS].update_one(
	{"_id": existing_verification["_id"]},
	{
	"$set": {
	"cache_key": cache_key,
	"role_key": role_key,
	"saved_at": existing_verification.get("saved_at")
	or existing_verification.get("created_at")
	or utc_now(),
	}
	},
	)

	if existing_verification:
	return _verification_doc_to_response(
	existing_verification,
	message="Loaded saved verification",
	cached=True,
	)

	jd_alignment = await analyze_resume_vs_job_description(
	role_title=role_title,
	resume_skills=resume_skills if resume_skills else ["general"],
	resume_summary=resume_summary,
	jd_title=selected_jd.get("title", ""),
	jd_description=selected_jd.get("description", ""),
	jd_required_skills=selected_jd.get("required_skills", []),
	)

	resume_snapshot = {
	"filename": resume_doc.get("original_filename") or resume_doc.get("filename") or "",
	"uploaded_at": resume_uploaded_at,
	"skills": resume_skills,
	"parsed_data": {
	"name": parsed_data.get("name"),
	"email": parsed_data.get("email"),
	"phone": parsed_data.get("phone"),
	"location": parsed_data.get("location"),
	"recommended_roles": parsed_data.get("recommended_roles", []) or [],
	"experience_summary": parsed_data.get("experience_summary", "") or "",
	},
	}

	verification_id = generate_id()
	saved_at = utc_now()
	verification_doc = {
	"verification_id": verification_id,
	"user_id": user_id,
	"role_id": role_id,
	"custom_role": custom_role,
	"role_title": role_title,
	"role_key": role_key,
	"cache_key": cache_key,
	"job_description": {
	"id": selected_jd.get("id"),
	"title": selected_jd.get("title"),
	"company": selected_jd.get("company"),
	"description": selected_jd.get("description"),
	"required_skills": selected_jd.get("required_skills", []) or [],
	"updated_at": jd_updated_at,
	},
	"resume_snapshot": resume_snapshot,
	"jd_alignment": jd_alignment,
	"saved_at": saved_at,
	"created_at": saved_at,
	}

	await db[JD_VERIFICATIONS].insert_one(verification_doc)

	return _verification_doc_to_response(
	verification_doc,
	message="Verification complete",
	cached=False,
	)


	async def _get_generated_question_texts(redis, session_id: str) -> list[str]:
	qids = await redis.lrange(f"session:{session_id}:questions", 0, -1)
	questions = []
	for qid in qids:
	q = await redis.hgetall(f"session:{session_id}:q:{qid}")
	if q and q.get("question"):
	questions.append(q["question"])
	return questions


	async def _generate_question_batch(
	role_title: str,
	skills: list[str],
	previous_questions: list[str],
	generated_count: int,
	max_questions: int,
	current_difficulty: str,
	local_summary: str \| None,
	batch_size: int,
	) -> tuple[list[dict], str]:
	remaining = max(0, max_questions - generated_count)
	target = min(batch_size, remaining)
	if target <= 0:
	return [], current_difficulty

	# Initial resume seed: generate the full first batch in one Gemini call.
	if generated_count == 0 and target > 1 and not local_summary:
	seeded = await generate_interview_question_batch(
	skills=skills,
	role_title=role_title,
	count=target,
	start_question_number=1,
	previous_questions=previous_questions,
	foundation_limit=0,
	)
	if seeded:
	last = seeded[-1].get("difficulty", current_difficulty)
	return seeded, last

	generated: list[dict] = []
	rolling_questions = list(previous_questions)
	rolling_difficulty = current_difficulty
	rolling_count = generated_count

	for i in range(target):
	state = {
	"role_title": role_title,
	"skills": skills,
	"previous_questions": rolling_questions,
	# Feed the local summary once per batch as extra context.
	"previous_answer": local_summary if i == 0 else None,
	"question_count": rolling_count,
	"max_questions": max_questions,
	"current_difficulty": rolling_difficulty,
	}
	graph_result = await run_interview_graph(state)
	q_data = graph_result.get("question_data", {})
	difficulty = q_data.get("difficulty", graph_result.get("current_difficulty", "medium"))
	generated.append(
	{
	"question": q_data.get("question", "Can you explain your approach?"),
	"difficulty": difficulty,
	"category": q_data.get("category", "general"),
	}
	)
	rolling_questions.append(generated[-1]["question"])
	rolling_count += 1
	rolling_difficulty = difficulty

	return generated, rolling_difficulty


	async def _append_batch_to_redis(redis, session_id: str, batch: list[dict]) -> list[str]:
	created_ids: list[str] = []
	for item in batch:
	normalized_question = normalize_question_text(item.get("question", "Can you explain your approach?"))
	if not normalized_question:
	continue
	qid = generate_id()
	created_ids.append(qid)
	await redis.hset(
	f"session:{session_id}:q:{qid}",
	mapping={
	"question_id": qid,
	"question": normalized_question,
	"difficulty": item.get("difficulty", "medium"),
	"category": item.get("category", "general"),
	},
	)
	await redis.rpush(f"session:{session_id}:questions", qid)
	await redis.expire(f"session:{session_id}:q:{qid}", SESSION_TTL)
	if created_ids:
	await redis.expire(f"session:{session_id}:questions", SESSION_TTL)
	return created_ids


	async def _fetch_question_bank_batch(
	db,
	role_id: str \| None,
	excluded_questions: list[str],
	limit: int,
	skill_hints: list[str] \| None = None,
	) -> list[dict]:
	if limit <= 0:
	return []

	query = {"question": {"$exists": True, "$ne": ""}}
	if role_id:
	role_candidates = [role_id]
	try:
	oid = ObjectId(role_id)
	role_candidates.append(str(oid))
	role_candidates.append(oid)
	except Exception:
	pass
	query["role_id"] = {"$in": role_candidates}

	normalized_hints = normalize_skill_list(skill_hints or [])
	if normalized_hints:
	scope_match = []
	for skill in normalized_hints:
	token = re.escape(skill)
	scope_match.append({"category": {"$regex": token, "$options": "i"}})
	scope_match.append({"question": {"$regex": token, "$options": "i"}})
	if scope_match:
	query["$or"] = scope_match

	excluded = {q.strip().lower() for q in excluded_questions if q}
	selected: list[dict] = []

	for sample_size in (max(limit * 12, 80), max(limit * 24, 160)):
	pipeline = [
	{"$match": query},
	{"$sample": {"size": sample_size}},
	]

	async for q in db[QUESTIONS].aggregate(pipeline):
	text = (q.get("question") or "").strip()
	if not text:
	continue
	if text.lower() in excluded:
	continue
	selected.append(
	{
	"question": text,
	"difficulty": _normalize_bank_difficulty(q.get("difficulty") or "medium"),
	"category": q.get("category") or "question-bank",
	}
	)
	excluded.add(text.lower())
	if len(selected) >= limit:
	break

	if len(selected) >= limit:
	break

	# If role-scoped pool is too small, widen to global random pool.
	if len(selected) < limit and role_id:
	fallback = await _fetch_question_bank_batch(
	db=db,
	role_id=None,
	excluded_questions=list(excluded),
	limit=limit - len(selected),
	skill_hints=normalized_hints,
	)
	selected.extend(fallback)

	return selected


	def _strict_followup_difficulty(answered_count: int) -> str:
	# After first DB set (Q1-5), follow-ups should feel like real interview pressure.
	return "hard" if answered_count >= 10 else "medium"


	def _has_followup_opportunity(qa_pairs: list, window: int = BATCH_SIZE) -> bool:
	"""Decide whether Gemini follow-up questions are needed for the latest batch."""
	if not qa_pairs:
	return False

	weak_markers = {
	"i think",
	"maybe",
	"not sure",
	"dont know",
	"don't know",
	"etc",
	"kind of",
	"sort of",
	}

	for qa in qa_pairs[-window:]:
	answer = (qa.get("answer") or "").strip()
	if not answer:
	continue

	if len(answer.split()) < 30:
	return True

	lowered = answer.lower()
	if any(marker in lowered for marker in weak_markers):
	return True

	return False


	async def _generate_mixed_followup_batch(
	db,
	redis,
	session_id: str,
	session: dict,
	generated_count: int,
	max_questions: int,
	) -> tuple[list[dict], str, dict]:
	remaining = max(0, max_questions - generated_count)
	target = min(BATCH_SIZE, remaining)
	if target <= 0:
	return [], session.get("current_difficulty", "medium"), {
	"gemini_calls": 0,
	"gemini_questions": 0,
	"bank_questions": 0,
	"bank_shortfall": 0,
	}

	previous_questions = await _get_generated_question_texts(redis, session_id)
	qa_pairs = await get_session_qa(session_id)
	answered_count = len(qa_pairs)
	role_title = session.get("role_title", "Software Developer")
	skills = _safe_json_list(session.get("skills", "[]"))
	jd_required_skills = _safe_json_list(session.get("jd_required_skills", "[]"))
	resume_source_mode = (session.get("resume_source_mode") or "db").strip().lower()
	current_difficulty = _strict_followup_difficulty(answered_count)

	from utils.gemini import generate_followup_question_batch_from_qa

	gemini_calls = 0
	gemini_questions = 0

	if resume_source_mode == "ai":
	ai_items = await generate_followup_question_batch_from_qa(
	role_title=role_title,
	skills=skills,
	qa_pairs=qa_pairs,
	previous_questions=previous_questions,
	count=target,
	difficulty=current_difficulty,
	)
	gemini_calls = 1 if target > 0 else 0

	deduped_ai = []
	excluded_lower = {q.strip().lower() for q in previous_questions if q}
	for item in ai_items:
	text = (item.get("question") or "").strip()
	if not text:
	continue
	lowered = text.lower()
	if lowered in excluded_lower:
	continue
	deduped_ai.append(item)
	excluded_lower.add(lowered)
	if len(deduped_ai) >= target:
	break

	if len(deduped_ai) < target:
	refill, refill_last = await _generate_question_batch(
	role_title=role_title,
	skills=skills,
	previous_questions=previous_questions + [i.get("question", "") for i in deduped_ai],
	generated_count=generated_count + len(deduped_ai),
	max_questions=max_questions,
	current_difficulty=current_difficulty,
	local_summary=_LOCAL_SUMMARIES.get(session_id),
	batch_size=target - len(deduped_ai),
	)
	for item in refill:
	text = (item.get("question") or "").strip()
	if not text:
	continue
	lowered = text.lower()
	if lowered in excluded_lower:
	continue
	deduped_ai.append(item)
	excluded_lower.add(lowered)
	if len(deduped_ai) >= target:
	break
	if refill:
	current_difficulty = refill_last

	final_ai = deduped_ai[:target]
	last_difficulty = final_ai[-1].get("difficulty", current_difficulty) if final_ai else current_difficulty
	return final_ai, last_difficulty, {
	"gemini_calls": gemini_calls,
	"gemini_questions": len(final_ai),
	"bank_questions": 0,
	"bank_shortfall": 0,
	}

	# Batch policy:
	# - If follow-up opportunity exists: 2 AI + 3 DB
	# - Otherwise: 5 DB
	ai_target = min(FOLLOWUP_AI_COUNT, target) if _has_followup_opportunity(qa_pairs) else 0

	excluded_lower = {q.strip().lower() for q in previous_questions if q}
	ai_items: list[dict] = []

	if ai_target > 0:
	generated_ai = await generate_followup_question_batch_from_qa(
	role_title=role_title,
	skills=skills,
	qa_pairs=qa_pairs,
	previous_questions=previous_questions,
	count=ai_target,
	difficulty=current_difficulty,
	)
	gemini_calls += 1
	for item in generated_ai:
	text = (item.get("question") or "").strip()
	if not text:
	continue
	lowered = text.lower()
	if lowered in excluded_lower:
	continue
	ai_items.append(item)
	excluded_lower.add(lowered)
	if len(ai_items) >= ai_target:
	break
	gemini_questions += len(ai_items)

	bank_target = max(0, target - len(ai_items))
	exclude_pool = list(excluded_lower)
	bank_items = await _fetch_question_bank_batch(
	db=db,
	role_id=session.get("role_id"),
	excluded_questions=exclude_pool,
	limit=bank_target,
	skill_hints=jd_required_skills,
	)

	for item in bank_items:
	text = (item.get("question") or "").strip()
	if text:
	excluded_lower.add(text.lower())

	if len(bank_items) < bank_target:
	# Keep total batch size stable if the bank pool is exhausted.
	refill = bank_target - len(bank_items)
	refill_ai = []
	added_refill_ai = 0
	if refill > 0:
	refill_ai = await generate_followup_question_batch_from_qa(
	role_title=role_title,
	skills=skills,
	qa_pairs=qa_pairs,
	previous_questions=list(excluded_lower),
	count=refill,
	difficulty=current_difficulty,
	)
	gemini_calls += 1
	for item in refill_ai:
	text = (item.get("question") or "").strip()
	if not text:
	continue
	lowered = text.lower()
	if lowered in excluded_lower:
	continue
	ai_items.append(item)
	added_refill_ai += 1
	excluded_lower.add(lowered)
	if len(ai_items) + len(bank_items) >= target:
	break
	gemini_questions += added_refill_ai

	mixed = (ai_items + bank_items)[:target]
	if len(mixed) > 1:
	random.shuffle(mixed)

	last_difficulty = mixed[-1].get("difficulty", current_difficulty) if mixed else current_difficulty
	return mixed, last_difficulty, {
	"gemini_calls": gemini_calls,
	"gemini_questions": gemini_questions,
	"bank_questions": len(bank_items),
	"bank_shortfall": max(0, bank_target - len(bank_items)),
	}


	async def _start_topic_interview(user_id: str, topic_id: str) -> dict:
	"""Start topic interview with low-cost DB-first flow and staged AI follow-ups."""
	db = get_db()
	redis = get_redis()

	topic = await db[TOPICS].find_one({"_id": __import__("bson").ObjectId(topic_id)})
	if not topic:
	raise ValueError("Topic not found")
	if not topic.get("is_published", False):
	raise ValueError("This topic interview is not published yet")

	initial_items = await _sample_topic_questions(
	db=db,
	topic_id=topic_id,
	excluded_questions=[],
	limit=TOPIC_INITIAL_DB_QUESTIONS,
	)
	if len(initial_items) < TOPIC_INITIAL_ASK_COUNT:
	raise ValueError("Not enough topic questions to start interview")

	first_question = initial_items[0]
	queued_initial = initial_items[1:TOPIC_INITIAL_ASK_COUNT]

	timer_enabled = bool(topic.get("timer_enabled", False))
	timer_seconds = topic.get("timer_seconds") if timer_enabled else None

	session_id = generate_id()
	_LOCAL_SUMMARIES[session_id] = ""

	user_doc = None
	try:
	user_doc = await db[USERS].find_one({"_id": ObjectId(user_id)}, {"speech_settings": 1})
	except Exception:
	user_doc = await db[USERS].find_one({"user_id": user_id}, {"speech_settings": 1})
	speech_voice_gender = _normalize_voice_gender(((user_doc or {}).get("speech_settings") or {}).get("voice_gender"))

	first_id = generate_id()
	await redis.hset(
	f"session:{session_id}:q:{first_id}",
	mapping={
	"question_id": first_id,
	"question": normalize_question_text(first_question.get("question", "Can you explain this topic?")),
	"difficulty": first_question.get("difficulty", "medium"),
	"category": first_question.get("category", topic.get("name", "topic")),
	},
	)
	await redis.expire(f"session:{session_id}:q:{first_id}", SESSION_TTL)
	await redis.rpush(f"session:{session_id}:questions", first_id)
	await redis.expire(f"session:{session_id}:questions", SESSION_TTL)

	await mark_question_asked(
	redis=redis,
	session_id=session_id,
	question_text=first_question.get("question", ""),
	ttl_seconds=SESSION_TTL,
	)

	queued_count = 0
	for item in queued_initial:
	qid = await enqueue_question(
	redis=redis,
	session_id=session_id,
	question=item.get("question", ""),
	difficulty=item.get("difficulty", "medium"),
	category=item.get("category", topic.get("name", "topic")),
	ttl_seconds=SESSION_TTL,
	max_queue_size=MAX_QUEUE_SIZE,
	)
	if qid:
	queued_count += 1

	await flush_backlog_to_queue(
	redis=redis,
	session_id=session_id,
	ttl_seconds=SESSION_TTL,
	max_queue_size=MAX_QUEUE_SIZE,
	)

	session_doc = {
	"session_id": session_id,
	"user_id": user_id,
	"role_id": None,
	"role_title": topic.get("name", "Topic Interview"),
	"topic_id": topic_id,
	"interview_type": "topic",
	"status": "in_progress",
	"question_count": 1,
	"max_questions": TOPIC_TOTAL_QUESTIONS,
	"current_difficulty": first_question.get("difficulty", "medium"),
	"metrics_gemini_calls": 0,
	"metrics_gemini_questions": 0,
	"metrics_bank_questions": queued_count + 1,
	"metrics_bank_shortfall": max(0, TOPIC_INITIAL_ASK_COUNT - (queued_count + 1)),
	"metrics_generation_batches": 1,
	"speech_voice_gender": speech_voice_gender,
	"timer_enabled": timer_enabled,
	"timer_seconds": timer_seconds,
	"topic_followups_generated": False,
	"started_at": utc_now(),
	}
	await db[SESSIONS].insert_one(session_doc)

	session_state = {
	"user_id": user_id,
	"role_title": topic.get("name", "Topic Interview"),
	"topic_id": topic_id,
	"interview_type": "topic",
	"skills": json.dumps([topic.get("name", "general")]),
	"user_skills": json.dumps([]),
	"required_skills": json.dumps([]),
	"matched_skills": json.dumps([]),
	"missing_skills": json.dumps([]),
	"question_count": 1,
	"answered_count": 0,
	"served_count": 1,
	"generated_count": queued_count + 1,
	"max_questions": TOPIC_TOTAL_QUESTIONS,
	"current_difficulty": first_question.get("difficulty", "medium"),
	"timer_enabled": str(timer_enabled),
	"timer_seconds": str(timer_seconds or ""),
	"status": "in_progress",
	"speech_voice_gender": speech_voice_gender,
	"metrics_gemini_calls": 0,
	"metrics_gemini_questions": 0,
	"metrics_bank_questions": queued_count + 1,
	"metrics_bank_shortfall": max(0, TOPIC_INITIAL_ASK_COUNT - (queued_count + 1)),
	"metrics_generation_batches": 1,
	"topic_followups_generated": "0",
	}
	await redis.hset(f"session:{session_id}", mapping=session_state)
	await redis.expire(f"session:{session_id}", SESSION_TTL)

	next_qid, next_q = await peek_next_question(redis, session_id)
	prefetch_targets = [next_q.get("question", "")] if next_qid and next_q else []
	_schedule_question_audio_prefetch(prefetch_targets, speech_voice_gender)

	return {
	"session_id": session_id,
	"interview_type": "topic",
	"topic": {
	"topic_id": topic_id,
	"name": topic.get("name", "Topic Interview"),
	"description": topic.get("description", ""),
	},
	"skill_alignment": {
	"user_skills": [],
	"required_skills": [topic.get("name", "")],
	"matched_skills": [],
	"missing_skills": [],
	"interview_focus": [topic.get("name", "")],
	},
	"question": {
	"question_id": first_id,
	"question": normalize_question_text(first_question.get("question", "Can you explain this topic?")),
	"difficulty": first_question.get("difficulty", "medium"),
	"question_number": 1,
	"total_questions": TOPIC_TOTAL_QUESTIONS,
	},
	"timer": {
	"enabled": timer_enabled,
	"seconds": timer_seconds,
	},
	"message": "Topic interview started. Good luck!",
	}


	async def _async_pregenerate_next_batch(session_id: str) -> None:
	db = get_db()
	redis = get_redis()
	try:
	session = await redis.hgetall(f"session:{session_id}")
	if not session or session.get("status") != "in_progress":
	return

	if session.get("interview_type", "resume") != "resume":
	return

	pending_len = await redis.llen(f"session:{session_id}:pending_questions")
	generated_count = int(session.get("generated_count", 0))
	max_questions = int(session.get("max_questions", MAX_QUESTIONS))

	if pending_len >= PREGEN_MIN_PENDING or generated_count >= max_questions:
	return

	batch, last_difficulty, batch_metrics = await _generate_mixed_followup_batch(
	db=db,
	redis=redis,
	session_id=session_id,
	session=session,
	generated_count=generated_count,
	max_questions=max_questions,
	)
	if not batch:
	return

	new_ids = await _append_batch_to_redis(redis, session_id, batch)
	if new_ids:
	await redis.rpush(f"session:{session_id}:pending_questions", *new_ids)
	await redis.expire(f"session:{session_id}:pending_questions", SESSION_TTL)

	prefetch_targets = []
	for qid in new_ids[:2]:
	q = await redis.hgetall(f"session:{session_id}:q:{qid}")
	prefetch_targets.append(q.get("question", ""))
	_schedule_question_audio_prefetch(
	prefetch_targets,
	_normalize_voice_gender(session.get("speech_voice_gender")),
	)

	await redis.hset(
	f"session:{session_id}",
	mapping={
	"generated_count": str(generated_count + len(new_ids)),
	"current_difficulty": last_difficulty,
	"metrics_gemini_calls": str(_safe_int(session.get("metrics_gemini_calls", 0)) + batch_metrics.get("gemini_calls", 0)),
	"metrics_gemini_questions": str(_safe_int(session.get("metrics_gemini_questions", 0)) + batch_metrics.get("gemini_questions", 0)),
	"metrics_bank_questions": str(_safe_int(session.get("metrics_bank_questions", 0)) + batch_metrics.get("bank_questions", 0)),
	"metrics_bank_shortfall": str(_safe_int(session.get("metrics_bank_shortfall", 0)) + batch_metrics.get("bank_shortfall", 0)),
	"metrics_generation_batches": str(_safe_int(session.get("metrics_generation_batches", 0)) + 1),
	},
	)
	await db[SESSIONS].update_one(
	{"session_id": session_id},
	{
	"$set": {
	"metrics_gemini_calls": _safe_int(session.get("metrics_gemini_calls", 0)) + batch_metrics.get("gemini_calls", 0),
	"metrics_gemini_questions": _safe_int(session.get("metrics_gemini_questions", 0)) + batch_metrics.get("gemini_questions", 0),
	"metrics_bank_questions": _safe_int(session.get("metrics_bank_questions", 0)) + batch_metrics.get("bank_questions", 0),
	"metrics_bank_shortfall": _safe_int(session.get("metrics_bank_shortfall", 0)) + batch_metrics.get("bank_shortfall", 0),
	"metrics_generation_batches": _safe_int(session.get("metrics_generation_batches", 0)) + 1,
	}
	},
	)
	finally:
	_PREGEN_IN_FLIGHT.discard(session_id)


	def _schedule_pregen(session_id: str, answered_count: int) -> None:
	# Start pre-generation as soon as Q1 is answered, while user is on Q2.
	if answered_count < 1:
	return
	if session_id in _PREGEN_IN_FLIGHT:
	return
	_PREGEN_IN_FLIGHT.add(session_id)
	asyncio.create_task(_async_pregenerate_next_batch(session_id))


	async def start_interview(
	user_id: str,
	role_id: str = None,
	custom_role: str = None,
	interview_type: str = "resume",
	topic_id: str = None,
	job_description_id: str = None,
	) -> dict:
	"""Start a new interview session with low-cost queue-first orchestration."""
	interview_type = (interview_type or "resume").strip().lower()
	if interview_type == "topic":
	if not topic_id:
	raise ValueError("topic_id is required for topic interviews")
	return await _start_topic_interview(user_id=user_id, topic_id=topic_id)

	db = get_db()
	redis = get_redis()

	user_doc = None
	try:
	user_doc = await db[USERS].find_one({"_id": ObjectId(user_id)}, {"speech_settings": 1})
	except Exception:
	user_doc = await db[USERS].find_one({"user_id": user_id}, {"speech_settings": 1})
	speech_voice_gender = _normalize_voice_gender(((user_doc or {}).get("speech_settings") or {}).get("voice_gender"))

	skills_doc = await db[SKILLS].find_one({"user_id": user_id})
	user_skills = normalize_skill_list(skills_doc.get("skills", [])) if skills_doc else []

	resume_doc = await db[RESUMES].find_one({"user_id": user_id})
	if not resume_doc:
	raise ValueError("Please upload your resume before starting a resume interview")

	parsed_resume = (resume_doc or {}).get("parsed_data", {}) or {}
	resume_summary_parts = [
	parsed_resume.get("experience_summary") or "",
	" ".join(parsed_resume.get("recommended_roles", []) or []),
	]
	resume_summary = "\n".join([part for part in resume_summary_parts if part]).strip() or "No summary available"

	if not job_description_id:
	raise ValueError("Please select a Job Description before starting Resume Interview")

	role_title = await _resolve_role_title(db, role_id=role_id, custom_role=custom_role)
	selected_jd = await get_job_description_for_user(user_id, job_description_id)

	jd_required_skills = normalize_skill_list((selected_jd or {}).get("required_skills", []))
	if not jd_required_skills:
	raise ValueError("Selected Job Description has no required skills. Add required skills first.")

	user_skill_set = {s.lower() for s in user_skills}
	matched_role_skills = [s for s in jd_required_skills if s.lower() in user_skill_set]
	missing_role_skills = [s for s in jd_required_skills if s.lower() not in user_skill_set]
	base_skills_for_interview = matched_role_skills + [s for s in missing_role_skills if s not in matched_role_skills]
	skills_for_interview = build_interview_focus_skills(base_skills_for_interview) or list(jd_required_skills)

	intro_question = _build_resume_intro_question(role_title=role_title, jd_title=selected_jd.get("title", ""))
	intro_question = normalize_question_text(intro_question)

	session_id = generate_id()
	_LOCAL_SUMMARIES[session_id] = ""

	first_id = generate_id()
	await redis.hset(
	f"session:{session_id}:q:{first_id}",
	mapping={
	"question_id": first_id,
	"question": intro_question,
	"difficulty": "easy",
	"category": "intro",
	},
	)
	await redis.expire(f"session:{session_id}:q:{first_id}", SESSION_TTL)
	await redis.rpush(f"session:{session_id}:questions", first_id)
	await redis.expire(f"session:{session_id}:questions", SESSION_TTL)

	await mark_question_asked(
	redis=redis,
	session_id=session_id,
	question_text=intro_question,
	ttl_seconds=SESSION_TTL,
	)

	session_doc = {
	"session_id": session_id,
	"user_id": user_id,
	"role_id": role_id,
	"role_title": role_title,
	"job_description_id": selected_jd.get("id"),
	"job_description_title": selected_jd.get("title"),
	"status": "in_progress",
	"interview_type": "resume",
	"question_count": 1,
	"max_questions": RESUME_MAX_QUESTIONS,
	"current_difficulty": "easy",
	"metrics_gemini_calls": 0,
	"metrics_gemini_questions": 0,
	"metrics_bank_questions": 1,
	"metrics_bank_shortfall": 0,
	"metrics_generation_batches": 0,
	"speech_voice_gender": speech_voice_gender,
	"started_at": utc_now(),
	"interview_generation_mode": "queue_followup",
	}
	await db[SESSIONS].insert_one(session_doc)

	session_state = {
	"user_id": user_id,
	"role_id": role_id or "",
	"role_title": role_title,
	"skills": json.dumps(skills_for_interview),
	"user_skills": json.dumps(user_skills),
	"required_skills": json.dumps(jd_required_skills),
	"matched_skills": json.dumps(matched_role_skills),
	"missing_skills": json.dumps(missing_role_skills),
	"question_count": 1,
	"answered_count": 0,
	"served_count": 1,
	"generated_count": 1,
	"max_questions": RESUME_MAX_QUESTIONS,
	"current_difficulty": "easy",
	"interview_type": "resume",
	"status": "in_progress",
	"speech_voice_gender": speech_voice_gender,
	"jd_required_skills": json.dumps(jd_required_skills),
	"job_description_title": selected_jd.get("title", ""),
	"job_description_text": selected_jd.get("description", ""),
	"resume_summary": resume_summary,
	"metrics_gemini_calls": 0,
	"metrics_gemini_questions": 0,
	"metrics_bank_questions": 1,
	"metrics_bank_shortfall": 0,
	"metrics_generation_batches": 0,
	"interview_generation_mode": "queue_followup",
	}
	await redis.hset(f"session:{session_id}", mapping=session_state)
	await redis.expire(f"session:{session_id}", SESSION_TTL)

	# Preload initial queue in background (2 questions) without blocking first question delivery.
	asyncio.create_task(_seed_resume_questions_task(session_id))

	return {
	"session_id": session_id,
	"skill_alignment": {
	"user_skills": user_skills,
	"required_skills": jd_required_skills,
	"matched_skills": matched_role_skills,
	"missing_skills": missing_role_skills,
	"interview_focus": skills_for_interview,
	},
	"question": {
	"question_id": first_id,
	"question": intro_question,
	"difficulty": "easy",
	"question_number": 1,
	"total_questions": RESUME_MAX_QUESTIONS,
	},
	"timer": {
	"enabled": False,
	"seconds": None,
	},
	"message": "Interview started. Good luck!",
	"job_description": selected_jd,
	"jd_alignment": None,
	}


	async def _record_submit_latency(started_at: float) -> float:
	elapsed_ms = (perf_counter() - started_at) * 1000.0
	await record_latency("submit_ms", elapsed_ms)
	return round(elapsed_ms, 2)


	async def _apply_generation_metric_delta(
	*,
	db,
	redis,
	session_id: str,
	session: dict,
	metrics_delta: dict,
	generated_count: int \| None = None,
	extra_redis_fields: dict \| None = None,
	extra_db_fields: dict \| None = None,
	) -> dict:
	base_stats = _current_generation_stats(session)
	effective_stats = {
	"gemini_calls": base_stats["gemini_calls"] + _safe_int(metrics_delta.get("gemini_calls", 0)),
	"gemini_questions": base_stats["gemini_questions"] + _safe_int(metrics_delta.get("gemini_questions", 0)),
	"bank_questions": base_stats["bank_questions"] + _safe_int(metrics_delta.get("bank_questions", 0)),
	"bank_shortfall": base_stats["bank_shortfall"] + _safe_int(metrics_delta.get("bank_shortfall", 0)),
	"generation_batches": base_stats["generation_batches"] + _safe_int(metrics_delta.get("generation_batches", 0)),
	}

	redis_mapping = {
	"metrics_gemini_calls": str(effective_stats["gemini_calls"]),
	"metrics_gemini_questions": str(effective_stats["gemini_questions"]),
	"metrics_bank_questions": str(effective_stats["bank_questions"]),
	"metrics_bank_shortfall": str(effective_stats["bank_shortfall"]),
	"metrics_generation_batches": str(effective_stats["generation_batches"]),
	}
	if generated_count is not None:
	redis_mapping["generated_count"] = str(generated_count)
	if extra_redis_fields:
	redis_mapping.update(extra_redis_fields)

	await redis.hset(f"session:{session_id}", mapping=redis_mapping)

	db_set = {
	"metrics_gemini_calls": effective_stats["gemini_calls"],
	"metrics_gemini_questions": effective_stats["gemini_questions"],
	"metrics_bank_questions": effective_stats["bank_questions"],
	"metrics_bank_shortfall": effective_stats["bank_shortfall"],
	"metrics_generation_batches": effective_stats["generation_batches"],
	}
	if generated_count is not None:
	db_set["generated_count"] = generated_count
	if extra_db_fields:
	db_set.update(extra_db_fields)

	await db[SESSIONS].update_one({"session_id": session_id}, {"$set": db_set})
	return effective_stats


	async def _post_submit_resume_processing(
	session_id: str,
	question_id: str,
	question_text: str,
	answer: str,
	answered_count: int,
	max_questions: int,
	) -> None:
	db = get_db()
	redis = get_redis()

	async with _get_post_submit_lock(session_id):
	session = await redis.hgetall(f"session:{session_id}")
	if not session:
	return

	skill_pool = _resume_skill_pool(session)
	recent_answered_questions = await _get_answered_question_texts(
	redis=redis,
	session_id=session_id,
	limit=4,
	)
	recent_focus_topic, same_topic_streak = _recent_focus_streak(
	recent_answered_questions,
	skill_pool,
	)

	recent_context = await get_recent_context_items(
	redis=redis,
	session_id=session_id,
	max_items=CONTEXT_CACHE_ITEMS,
	)
	excluded_questions = await _get_session_question_texts(redis, session_id)
	evaluation = await evaluate_and_generate_followup(
	role_title=session.get("role_title", "Software Developer"),
	required_skills=_safe_json_list(session.get("jd_required_skills", "[]")),
	recent_context=recent_context,
	current_question=question_text,
	current_answer=answer,
	excluded_questions=excluded_questions,
	focus_topic=recent_focus_topic or "",
	same_topic_streak=same_topic_streak,
	)

	await redis.hset(
	f"session:{session_id}:a:{question_id}",
	mapping={
	"score": str(_safe_int(evaluation.get("score", 0))),
	"feedback": evaluation.get("feedback", ""),
	},
	)

	metrics_delta = {
	"gemini_calls": 1,
	"gemini_questions": 0,
	"bank_questions": 0,
	"bank_shortfall": 0,
	"generation_batches": 1,
	}
	generated_count = _safe_int(session.get("generated_count", 0))

	follow_text, focus_skill_override = _apply_resume_followup_policy(
	skill_pool=skill_pool,
	recent_focus_topic=recent_focus_topic,
	same_topic_streak=same_topic_streak,
	suggested_question=(evaluation.get("followup_question") or "").strip(),
	suggested_topic=(evaluation.get("followup_topic") or "").strip(),
	followup_need_score=_safe_score_0_100(evaluation.get("followup_need_score", 0)),
	answered_count=answered_count,
	)

	if answered_count < max_questions and session.get("status") == "in_progress":
	qid, used_model_followup = await _enqueue_resume_followup_with_fallback(
	redis=redis,
	session_id=session_id,
	session=session,
	answered_count=answered_count,
	suggested_text=follow_text,
	suggested_difficulty=evaluation.get("difficulty", "medium"),
	suggested_category=evaluation.get("category", "follow-up"),
	focus_skill_override=focus_skill_override,
	)
	if qid:
	generated_count += 1
	if used_model_followup:
	metrics_delta["gemini_questions"] += 1

	await _apply_generation_metric_delta(
	db=db,
	redis=redis,
	session_id=session_id,
	session=session,
	metrics_delta=metrics_delta,
	generated_count=generated_count,
	)

	await flush_backlog_to_queue(
	redis=redis,
	session_id=session_id,
	ttl_seconds=SESSION_TTL,
	max_queue_size=MAX_QUEUE_SIZE,
	)

	if session.get("status") == "in_progress":
	qid, q = await peek_next_question(redis, session_id)
	if qid and q:
	_schedule_question_audio_prefetch(
	[q.get("question", "")],
	_normalize_voice_gender(session.get("speech_voice_gender")),
	)


	async def _post_submit_topic_processing(
	session_id: str,
	answered_count: int,
	) -> None:
	db = get_db()
	redis = get_redis()

	if answered_count < TOPIC_INITIAL_ASK_COUNT:
	return

	async with _get_post_submit_lock(session_id):
	session = await redis.hgetall(f"session:{session_id}")
	if not session:
	return

	max_questions = max(
	TOPIC_TOTAL_QUESTIONS,
	_safe_int(session.get("max_questions", TOPIC_TOTAL_QUESTIONS)),
	)
	generated_count = _safe_int(session.get("generated_count", 0))
	remaining_needed = max(0, max_questions - generated_count)

	if remaining_needed <= 0:
	await redis.hset(f"session:{session_id}", mapping={"topic_followups_generated": "1"})
	await db[SESSIONS].update_one(
	{"session_id": session_id},
	{"$set": {"topic_followups_generated": True, "max_questions": max_questions}},
	)
	return

	if session.get("topic_followups_generated", "0") == "1":
	return

	qa_pairs = await get_session_qa(session_id)
	excluded_questions = await _get_session_question_texts(redis, session_id)

	ai_target = min(TOPIC_AI_FOLLOWUPS, remaining_needed)
	ai_items = await generate_topic_followup_batch(
	topic_name=session.get("role_title", "Topic Interview"),
	qa_pairs=qa_pairs,
	excluded_questions=excluded_questions,
	count=ai_target,
	)
	db_target = max(0, remaining_needed - len(ai_items))
	db_items = await _sample_topic_questions(
	db=db,
	topic_id=session.get("topic_id", ""),
	excluded_questions=excluded_questions + [i.get("question", "") for i in ai_items],
	limit=db_target,
	)

	topic_added = 0
	ai_added = 0
	db_added = 0
	for item in ai_items:
	qid = await enqueue_question(
	redis=redis,
	session_id=session_id,
	question=item.get("question", ""),
	difficulty=item.get("difficulty", "medium"),
	category=item.get("category", session.get("role_title", "topic")),
	ttl_seconds=SESSION_TTL,
	max_queue_size=MAX_QUEUE_SIZE,
	)
	if qid:
	topic_added += 1
	ai_added += 1

	for item in db_items:
	qid = await enqueue_question(
	redis=redis,
	session_id=session_id,
	question=item.get("question", ""),
	difficulty=item.get("difficulty", "medium"),
	category=item.get("category", session.get("role_title", "topic")),
	ttl_seconds=SESSION_TTL,
	max_queue_size=MAX_QUEUE_SIZE,
	)
	if qid:
	topic_added += 1
	db_added += 1

	fallback_added = 0
	fallback_variants = max(10, remaining_needed * 4)
	for variant in range(fallback_variants):
	if topic_added >= remaining_needed:
	break

	next_question_number = generated_count + topic_added + 1
	fallback_text = _build_topic_resilient_followup_question(
	session=session,
	question_number=next_question_number,
	variant=variant,
	)
	qid = await enqueue_question(
	redis=redis,
	session_id=session_id,
	question=fallback_text,
	difficulty="medium",
	category="topic-fallback",
	ttl_seconds=SESSION_TTL,
	max_queue_size=MAX_QUEUE_SIZE,
	)
	if qid:
	topic_added += 1
	fallback_added += 1

	generated_count += topic_added
	await _apply_generation_metric_delta(
	db=db,
	redis=redis,
	session_id=session_id,
	session=session,
	metrics_delta={
	"gemini_calls": 1 if ai_target > 0 else 0,
	"gemini_questions": ai_added,
	"bank_questions": db_added + fallback_added,
	"bank_shortfall": max(0, remaining_needed - topic_added),
	"generation_batches": 1,
	},
	generated_count=generated_count,
	extra_redis_fields={
	"topic_followups_generated": "1",
	"max_questions": str(max_questions),
	},
	extra_db_fields={
	"topic_followups_generated": True,
	"max_questions": max_questions,
	},
	)

	await flush_backlog_to_queue(
	redis=redis,
	session_id=session_id,
	ttl_seconds=SESSION_TTL,
	max_queue_size=MAX_QUEUE_SIZE,
	)

	if session.get("status") == "in_progress":
	qid, q = await peek_next_question(redis, session_id)
	if qid and q:
	_schedule_question_audio_prefetch(
	[q.get("question", "")],
	_normalize_voice_gender(session.get("speech_voice_gender")),
	)


	def _schedule_post_submit_processing(
	*,
	session_id: str,
	question_id: str,
	question_text: str,
	answer: str,
	answered_count: int,
	max_questions: int,
	interview_type: str,
	) -> None:
	try:
	if interview_type == "resume":
	task = asyncio.create_task(
	_post_submit_resume_processing(
	session_id=session_id,
	question_id=question_id,
	question_text=question_text,
	answer=answer,
	answered_count=answered_count,
	max_questions=max_questions,
	)
	)
	task.add_done_callback(_consume_post_submit_task_result)
	return

	if interview_type == "topic":
	task = asyncio.create_task(
	_post_submit_topic_processing(
	session_id=session_id,
	answered_count=answered_count,
	)
	)
	task.add_done_callback(_consume_post_submit_task_result)
	except Exception:
	# Never block request response on scheduler errors.
	return


	async def submit_answer(session_id: str, question_id: str, answer: str) -> dict:
	"""Submit answer and return next queued question immediately."""
	started_at = perf_counter()
	db = get_db()
	redis = get_redis()

	session = await redis.hgetall(f"session:{session_id}")
	if not session:
	raise ValueError("Interview session not found or expired")
	if session.get("status") != "in_progress":
	raise ValueError("Interview is not in progress")

	current_q = await redis.hgetall(f"session:{session_id}:q:{question_id}")
	current_question_text = current_q.get("question", "")

	await redis.hset(
	f"session:{session_id}:a:{question_id}",
	mapping={
	"question_id": question_id,
	"answer": answer,
	"question": current_question_text,
	"difficulty": current_q.get("difficulty", "medium"),
	"category": current_q.get("category", "general"),
	"submitted_at": utc_now(),
	},
	)
	await redis.rpush(f"session:{session_id}:answers", question_id)
	await redis.expire(f"session:{session_id}:a:{question_id}", SESSION_TTL)
	await redis.expire(f"session:{session_id}:answers", SESSION_TTL)

	await db[ANSWERS].update_one(
	{
	"session_id": session_id,
	"question_id": question_id,
	"user_id": session.get("user_id"),
	},
	{
	"$set": {
	"question": current_question_text,
	"answer": answer,
	"difficulty": current_q.get("difficulty", "medium"),
	"category": current_q.get("category", "general"),
	"stored_at": utc_now(),
	}
	},
	upsert=True,
	)

	question_count = _safe_int(session.get("question_count", 1))
	answered_count = _safe_int(session.get("answered_count", 0)) + 1
	served_count = _safe_int(session.get("served_count", 1))
	generated_count = _safe_int(session.get("generated_count", 0))
	max_questions = _safe_int(session.get("max_questions", MAX_QUESTIONS))
	interview_type = session.get("interview_type", "resume")
	speech_voice_gender = _normalize_voice_gender(session.get("speech_voice_gender"))

	if interview_type == "resume" and max_questions < RESUME_MAX_QUESTIONS:
	max_questions = RESUME_MAX_QUESTIONS
	await redis.hset(f"session:{session_id}", mapping={"max_questions": str(max_questions)})
	await db[SESSIONS].update_one(
	{"session_id": session_id},
	{"$set": {"max_questions": max_questions}},
	)

	if interview_type == "topic" and max_questions < TOPIC_TOTAL_QUESTIONS:
	max_questions = TOPIC_TOTAL_QUESTIONS
	await redis.hset(f"session:{session_id}", mapping={"max_questions": str(max_questions)})
	await db[SESSIONS].update_one(
	{"session_id": session_id},
	{"$set": {"max_questions": max_questions}},
	)

	_update_local_summary(session_id, current_question_text, answer)
	await push_context_item(
	redis=redis,
	session_id=session_id,
	item={
	"question": current_question_text,
	"answer": answer,
	},
	ttl_seconds=SESSION_TTL,
	max_items=CONTEXT_CACHE_ITEMS,
	)

	if answered_count >= max_questions:
	await redis.hset(
	f"session:{session_id}",
	mapping={
	"status": "completed",
	"answered_count": str(answered_count),
	},
	)
	await db[SESSIONS].update_one(
	{"session_id": session_id},
	{"$set": {"status": "completed", "completed_at": utc_now()}},
	)

	submit_ms = await _record_submit_latency(started_at)
	return {
	"session_id": session_id,
	"next_question": None,
	"is_complete": True,
	"message": "Interview complete! Generating your report...",
	"submit_ms": submit_ms,
	}

	await flush_backlog_to_queue(
	redis=redis,
	session_id=session_id,
	ttl_seconds=SESSION_TTL,
	max_queue_size=MAX_QUEUE_SIZE,
	)
	next_question_id, q_data = await pop_next_question(redis, session_id)

	effective_stats = _current_generation_stats(session)
	fallback_evaluation = None

	# Emergency fallback for rare queue-empty cases.
	if not next_question_id and interview_type == "resume":
	skill_pool = _resume_skill_pool(session)
	recent_answered_questions = await _get_answered_question_texts(
	redis=redis,
	session_id=session_id,
	limit=4,
	)
	recent_focus_topic, same_topic_streak = _recent_focus_streak(
	recent_answered_questions,
	skill_pool,
	)

	recent_context = await get_recent_context_items(
	redis=redis,
	session_id=session_id,
	max_items=CONTEXT_CACHE_ITEMS,
	)
	excluded_questions = await _get_session_question_texts(redis, session_id)
	fallback_evaluation = await evaluate_and_generate_followup(
	role_title=session.get("role_title", "Software Developer"),
	required_skills=_safe_json_list(session.get("jd_required_skills", "[]")),
	recent_context=recent_context,
	current_question=current_question_text,
	current_answer=answer,
	excluded_questions=excluded_questions,
	focus_topic=recent_focus_topic or "",
	same_topic_streak=same_topic_streak,
	)

	await redis.hset(
	f"session:{session_id}:a:{question_id}",
	mapping={
	"score": str(_safe_int(fallback_evaluation.get("score", 0))),
	"feedback": fallback_evaluation.get("feedback", ""),
	},
	)

	fallback_delta = {
	"gemini_calls": 1,
	"gemini_questions": 0,
	"bank_questions": 0,
	"bank_shortfall": 0,
	"generation_batches": 1,
	}
	follow_text, focus_skill_override = _apply_resume_followup_policy(
	skill_pool=skill_pool,
	recent_focus_topic=recent_focus_topic,
	same_topic_streak=same_topic_streak,
	suggested_question=(fallback_evaluation.get("followup_question") or "").strip(),
	suggested_topic=(fallback_evaluation.get("followup_topic") or "").strip(),
	followup_need_score=_safe_score_0_100(fallback_evaluation.get("followup_need_score", 0)),
	answered_count=answered_count,
	)

	if answered_count < max_questions:
	qid, used_model_followup = await _enqueue_resume_followup_with_fallback(
	redis=redis,
	session_id=session_id,
	session=session,
	answered_count=answered_count,
	suggested_text=follow_text,
	suggested_difficulty=fallback_evaluation.get("difficulty", "medium"),
	suggested_category=fallback_evaluation.get("category", "follow-up"),
	focus_skill_override=focus_skill_override,
	)
	if qid:
	generated_count += 1
	if used_model_followup:
	fallback_delta["gemini_questions"] = 1

	effective_stats = await _apply_generation_metric_delta(
	db=db,
	redis=redis,
	session_id=session_id,
	session=session,
	metrics_delta=fallback_delta,
	generated_count=generated_count,
	)

	await flush_backlog_to_queue(
	redis=redis,
	session_id=session_id,
	ttl_seconds=SESSION_TTL,
	max_queue_size=MAX_QUEUE_SIZE,
	)
	next_question_id, q_data = await pop_next_question(redis, session_id)

	if (
	not next_question_id
	and interview_type == "topic"
	and answered_count < max_questions
	):
	# Topic follow-up generation runs in background, so synchronously top-up once
	# before concluding interview to avoid premature completion around Q4.
	await _post_submit_topic_processing(
	session_id=session_id,
	answered_count=answered_count,
	)
	await flush_backlog_to_queue(
	redis=redis,
	session_id=session_id,
	ttl_seconds=SESSION_TTL,
	max_queue_size=MAX_QUEUE_SIZE,
	)
	next_question_id, q_data = await pop_next_question(redis, session_id)

	if not next_question_id or not q_data:
	await redis.hset(
	f"session:{session_id}",
	mapping={"status": "completed", "answered_count": str(answered_count)},
	)
	await db[SESSIONS].update_one(
	{"session_id": session_id},
	{"$set": {"status": "completed", "completed_at": utc_now()}},
	)

	submit_ms = await _record_submit_latency(started_at)
	payload = {
	"session_id": session_id,
	"next_question": None,
	"is_complete": True,
	"message": "Interview complete! Generating your report...",
	"submit_ms": submit_ms,
	}
	if fallback_evaluation:
	payload["answer_evaluation"] = {
	"score": _safe_int(fallback_evaluation.get("score", 0)),
	"feedback": fallback_evaluation.get("feedback", ""),
	}
	return payload

	await mark_question_asked(
	redis=redis,
	session_id=session_id,
	question_text=q_data.get("question", ""),
	ttl_seconds=SESSION_TTL,
	)

	await flush_backlog_to_queue(
	redis=redis,
	session_id=session_id,
	ttl_seconds=SESSION_TTL,
	max_queue_size=MAX_QUEUE_SIZE,
	)
	peek_next_id, peek_q = await peek_next_question(redis, session_id)
	if peek_next_id and peek_q:
	_schedule_question_audio_prefetch([peek_q.get("question", "")], speech_voice_gender)

	next_difficulty = q_data.get("difficulty", session.get("current_difficulty", "medium"))
	new_question_count = question_count + 1
	new_served_count = served_count + 1

	await redis.hset(
	f"session:{session_id}",
	mapping={
	"question_count": str(new_question_count),
	"answered_count": str(answered_count),
	"served_count": str(new_served_count),
	"generated_count": str(generated_count),
	"current_difficulty": next_difficulty,
	},
	)

	response = {
	"session_id": session_id,
	"next_question": {
	"question_id": next_question_id,
	"question": q_data.get("question", "Can you elaborate further?"),
	"difficulty": q_data.get("difficulty", "medium"),
	"question_number": new_served_count,
	"total_questions": max_questions,
	},
	"is_complete": False,
	"message": f"Question {new_served_count} of {max_questions}",
	"generation_stats": effective_stats,
	}

	if fallback_evaluation:
	response["answer_evaluation"] = {
	"score": _safe_int(fallback_evaluation.get("score", 0)),
	"feedback": fallback_evaluation.get("feedback", ""),
	}
	elif interview_type == "resume":
	response["answer_evaluation"] = {
	"status": "processing",
	}

	_schedule_post_submit_processing(
	session_id=session_id,
	question_id=question_id,
	question_text=current_question_text,
	answer=answer,
	answered_count=answered_count,
	max_questions=max_questions,
	interview_type=interview_type,
	)

	submit_ms = await _record_submit_latency(started_at)
	response["submit_ms"] = submit_ms
	return response


	async def get_next_question(session_id: str, user_id: str) -> dict:
	"""Preview next queued question without submitting a new answer."""
	db = get_db()
	redis = get_redis()

	session_doc = await db[SESSIONS].find_one({"session_id": session_id})
	if not session_doc:
	raise ValueError("Session not found")
	if session_doc.get("user_id") != user_id:
	raise ValueError("Unauthorized access to session")

	session = await redis.hgetall(f"session:{session_id}")
	if not session:
	raise ValueError("Interview session not found or expired")
	if session.get("status") != "in_progress":
	return {
	"session_id": session_id,
	"next_question": None,
	"is_complete": True,
	"message": "Interview is not in progress",
	}

	await flush_backlog_to_queue(
	redis=redis,
	session_id=session_id,
	ttl_seconds=SESSION_TTL,
	max_queue_size=MAX_QUEUE_SIZE,
	)

	qid, q = await peek_next_question(redis, session_id)
	if not qid or not q:
	return {
	"session_id": session_id,
	"next_question": None,
	"is_complete": False,
	"message": "No queued question yet",
	"queue_size": await queue_size(redis, session_id),
	}

	return {
	"session_id": session_id,
	"next_question": {
	"question_id": qid,
	"question": q.get("question", ""),
	"difficulty": q.get("difficulty", "medium"),
	"category": q.get("category", "general"),
	},
	"is_complete": False,
	"queue_size": await queue_size(redis, session_id),
	"message": "Next question ready",
	}


	async def quit_interview(session_id: str, user_id: str) -> dict:
	"""Mark an interview as quit and indicate whether a partial report can be generated."""
	db = get_db()
	redis = get_redis()

	session = await db[SESSIONS].find_one({"session_id": session_id})
	if not session:
	raise ValueError("Session not found")
	if session.get("user_id") != user_id:
	raise ValueError("Unauthorized access to session")

	if session.get("status") in {"completed", "quit", "quit_with_report"}:
	return {
	"session_id": session_id,
	"report_generated": session.get("status") == "quit_with_report",
	"message": "Interview already finalized",
	}

	quit_at = utc_now()

	# Update Redis state if still present.
	redis_session_key = f"session:{session_id}"
	redis_session = await redis.hgetall(redis_session_key)
	answered_count = int(redis_session.get("answered_count", 0)) if redis_session else 0
	if redis_session:
	await redis.hset(
	redis_session_key,
	mapping={
	"status": "quit",
	"quit_at": quit_at,
	},
	)
	await redis.expire(redis_session_key, SESSION_TTL)

	# Persist quit metadata for admin visibility.
	await db[SESSIONS].update_one(
	{"session_id": session_id},
	{
	"$set": {
	"status": "quit",
	"quit_at": quit_at,
	"quit_reason": "user_requested",
	"answered_count": answered_count,
	}
	},
	)

	has_answers = answered_count > 0
	return {
	"session_id": session_id,
	"report_generated": has_answers,
	"message": "Interview quit successfully" if has_answers else "Interview quit. No answers to evaluate yet.",
	}


	async def get_session_qa(session_id: str) -> list:
	"""Get all Q&A pairs from Redis for a session."""
	redis = get_redis()

	answer_ids = await redis.lrange(f"session:{session_id}:answers", 0, -1)
	qa_pairs = []

	if answer_ids:
	for qid in answer_ids:
	q = await redis.hgetall(f"session:{session_id}:q:{qid}")
	a = await redis.hgetall(f"session:{session_id}:a:{qid}")
	if not a:
	continue

	question_text = (a.get("question") or q.get("question") or "").strip()
	answer_text = (a.get("answer") or "").strip()
	if not question_text or not answer_text:
	continue

	qa_pairs.append({
	"question_id": qid,
	"question": question_text,
	"answer": answer_text,
	"difficulty": a.get("difficulty") or q.get("difficulty", "medium"),
	"category": a.get("category") or q.get("category", "general"),
	})

	if qa_pairs:
	return qa_pairs

	question_ids = await redis.lrange(f"session:{session_id}:questions", 0, -1)
	for qid in question_ids:
	q = await redis.hgetall(f"session:{session_id}:q:{qid}")
	a = await redis.hgetall(f"session:{session_id}:a:{qid}")
	if q and a:
	qa_pairs.append({
	"question_id": qid,
	"question": q.get("question", ""),
	"answer": a.get("answer", ""),
	"difficulty": q.get("difficulty", "medium"),
	"category": q.get("category", "general"),
	})

	return qa_pairs


	def cleanup_interview_local_state(session_id: str) -> None:
	"""Cleanup process-local state for a completed session."""
	_LOCAL_SUMMARIES.pop(session_id, None)
	_PREGEN_IN_FLIGHT.discard(session_id)
	_POST_SUBMIT_LOCKS.pop(session_id, None)