Spaces:

lablab-ai-amd-developer-hackathon
/

MediAgent

Running

App Files Files Community

MediAgent / agents /critic.py

medi422

Upload 21 files

9a75c73 verified 4 days ago

raw

history blame contribute delete

9.62 kB

	# mediagent/agents/critic.py
	"""
	Critic Agent for MediAgent.
	Final quality control and peer-review layer. Validates report consistency,
	flags low-confidence observations, enforces regulatory disclaimers, assigns
	quality scores, and applies corrective refinements before final delivery.
	"""

	import logging
	from typing import Any, Dict, List, Optional

	from core.llm import LLMClient
	from core.models import AgentStatus, PipelineState, ReportSection, VisionOutput

	logger = logging.getLogger(__name__)


	class CriticAgent:
	"""
	Medical QA/QC engine. Cross-validates the synthesized report against
	upstream agent outputs, detects logical inconsistencies, enforces
	clinical safety thresholds, and produces a finalized, auditable report.
	"""

	STANDARD_DISCLAIMER = (
	"This analysis is AI-generated and must be reviewed by a licensed radiologist "
	"before any clinical decisions are made."
	)

	SYSTEM_PROMPT = """You are a senior radiology peer-reviewer. Evaluate the draft report against the vision findings and return ONLY valid JSON:
	{"clinical_history":"string","technique":"string","findings":"string","impression":"string","recommendations":"string","disclaimer":"string","quality_score":0-100,"review_issues":["string"],"uncertainty_warnings":["string"]}

	Review criteria:
	1. CONSISTENCY: Every vision anomaly must appear in the report. Flag contradictions.
	2. CONFIDENCE: Findings < 50% confidence or LOW → add uncertainty warning, recommend confirmatory imaging.
	3. DISCLAIMER: Must be exactly: "This analysis is AI-generated and must be reviewed by a licensed radiologist before any clinical decisions are made."
	4. TONE: Formal, objective radiological language. No speculative phrasing or definitive claims without imaging evidence.
	5. QUALITY SCORE: completeness 30% + accuracy/consistency 40% + clinical safety 20% + compliance 10%.
	6. Apply corrections directly. No placeholders or TODOs.
	No markdown. Never fabricate findings. Lower score for failed pipeline agents."""

	def __init__(self, llm_client: Optional[LLMClient] = None):
	self.llm = llm_client or LLMClient()
	self.last_quality_score: int = 100
	self.last_review_issues: List[str] = []
	self.last_uncertainty_warnings: List[str] = []

	def process(self, draft_report: ReportSection, pipeline_state: PipelineState) -> ReportSection:
	"""
	Execute final peer review and quality enforcement.

	Args:
	draft_report: Unreviewed ReportSection from Report Agent
	pipeline_state: Full execution context including vision findings and agent statuses

	Returns:
	ReportSection: Finalized, QA-reviewed clinical report
	"""
	logger.info("🛡️ Critic Agent initiated final quality review")

	user_prompt = self._build_review_prompt(draft_report, pipeline_state)

	result = self.llm.generate_text(
	prompt=user_prompt,
	system_prompt=self.SYSTEM_PROMPT,
	temperature=0.0,
	force_json=True
	)

	if not result.get("success"):
	logger.error(f"❌ Critic LLM call failed: {result.get('error')}")
	return self._apply_deterministic_qa(draft_report, pipeline_state)

	raw_content = result.get("content", "")
	parsed = LLMClient.extract_json_from_response(raw_content)
	if not parsed:
	logger.warning("⚠️ Failed to parse critic JSON response. Applying deterministic QA.")
	return self._apply_deterministic_qa(draft_report, pipeline_state)

	try:
	return self._parse_qa_response(parsed, pipeline_state)
	except Exception as e:
	logger.error(f"💥 Critic mapping failed: {e}")
	return self._apply_deterministic_qa(draft_report, pipeline_state)

	def _build_review_prompt(self, draft: ReportSection, state: PipelineState) -> str:
	"""Format pipeline context and draft report for LLM critique."""
	# Extract vision findings for cross-reference
	vision_text = "No vision findings available."
	if state.vision_output:
	findings_list = []
	for f in state.vision_output.findings:
	findings_list.append(
	f"- Region: {f.anatomical_region} \| Desc: {f.description} \| "
	f"Severity: {f.severity.value} \| Confidence: {f.confidence.value} ({f.confidence_score}%) \| "
	f"Anomaly: {f.is_anomaly}"
	)
	vision_text = "\n".join(findings_list) if findings_list else "No specific findings."

	# Agent execution status
	agent_status = ", ".join([f"{k}: {v.value}" for k, v in state.agent_statuses.items()])

	return f"""[PIPELINE EXECUTION STATUS]
	{agent_status}

	[VISION AGENT FINDINGS FOR CROSS-REFERENCE]
	{vision_text}

	[DRAFT REPORT FOR REVIEW]
	Clinical History: {draft.clinical_history}
	Technique: {draft.technique}
	Findings: {draft.findings}
	Impression: {draft.impression}
	Recommendations: {draft.recommendations}
	Disclaimer: {draft.disclaimer}

	Critique the draft against the vision findings and pipeline status. Apply corrections, flag uncertainties, verify compliance, and output the refined JSON report."""

	def _parse_qa_response(self, data: Dict[str, Any], state: PipelineState) -> ReportSection:
	"""Validate, extract, and enforce QA metadata on the report."""
	# Extract core report fields
	draft = ReportSection(
	clinical_history=str(data.get("clinical_history", "Not provided.")),
	technique=str(data.get("technique", "Imaging technique not specified.")),
	findings=str(data.get("findings", "No abnormalities detected.")),
	impression=str(data.get("impression", "Within normal limits.")),
	recommendations=str(data.get("recommendations", "Routine follow-up as clinically indicated.")),
	disclaimer=str(data.get("disclaimer", self.STANDARD_DISCLAIMER))
	)

	# Extract QA metadata
	self.last_quality_score = int(data.get("quality_score", 85))
	self.last_review_issues = data.get("review_issues", [])
	self.last_uncertainty_warnings = data.get("uncertainty_warnings", [])

	# Append QA summary to recommendations for frontend visibility
	qa_summary = "\n\n[QUALITY ASSESSMENT]\nScore: {score}/100\nIssues: {issues}\nUncertainties: {warnings}".format(
	score=self.last_quality_score,
	issues=" \| ".join(self.last_review_issues) if self.last_review_issues else "None",
	warnings=" \| ".join(self.last_uncertainty_warnings) if self.last_uncertainty_warnings else "None"
	)
	draft.recommendations += qa_summary

	return self._apply_deterministic_qa(draft, state)

	def _apply_deterministic_qa(self, draft: ReportSection, state: PipelineState) -> ReportSection:
	"""Hard-rule safety checks that cannot be overridden by LLM output."""
	# 1. Enforce exact disclaimer
	if draft.disclaimer != self.STANDARD_DISCLAIMER:
	draft.disclaimer = self.STANDARD_DISCLAIMER
	if self.last_review_issues:
	self.last_review_issues.append("Disclaimer corrected to regulatory standard.")
	else:
	self.last_review_issues = ["Disclaimer corrected to regulatory standard."]

	# 2. Cap quality score if critical pipeline failures occurred
	critical_failures = [
	k for k, v in state.agent_statuses.items()
	if v == AgentStatus.ERROR and k in ["VISION", "REPORT"]
	]
	if critical_failures:
	self.last_quality_score = min(self.last_quality_score, 40)
	self.last_review_issues.append(f"Pipeline degraded: {', '.join(critical_failures)} agents failed.")

	# 3. Flag low-confidence vision findings if not already warned
	if state.vision_output:
	low_conf_findings = [
	f.anatomical_region for f in state.vision_output.findings
	if f.confidence.value == "LOW" or f.confidence_score < 50.0
	]
	if low_conf_findings:
	warning = f"Low confidence observations in: {', '.join(low_conf_findings)}. Confirmatory imaging recommended."
	if warning not in self.last_uncertainty_warnings:
	self.last_uncertainty_warnings.append(warning)

	# 4. Re-append updated QA summary if modified
	qa_summary = "\n\n[QUALITY ASSESSMENT]\nScore: {score}/100\nIssues: {issues}\nUncertainties: {warnings}".format(
	score=self.last_quality_score,
	issues=" \| ".join(self.last_review_issues) if self.last_review_issues else "None",
	warnings=" \| ".join(self.last_uncertainty_warnings) if self.last_uncertainty_warnings else "None"
	)
	if qa_summary not in draft.recommendations:
	draft.recommendations += qa_summary

	logger.info(f"✅ Critic Agent completed \| QA Score: {self.last_quality_score}/100")
	return draft

	def _get_fallback_report(self, draft: ReportSection) -> ReportSection:
	"""Safe fallback when critic review cannot be completed."""
	draft.disclaimer = self.STANDARD_DISCLAIMER
	self.last_quality_score = 50
	self.last_review_issues = ["Critic agent unavailable. Report delivered unreviewed."]
	self.last_uncertainty_warnings = ["Peer review skipped. Manual radiologist verification mandatory."]
	return self._apply_deterministic_qa(draft, PipelineState())