Spaces:

sajith-0701
/

SentinelAI

Sleeping

App Files Files Community

SentinelAI / app /pipeline /deep_analyzer.py

sajith-0701

initial deployment for HF Spaces

71c1ad2 12 days ago

raw

history blame contribute delete

5.31 kB

	# app/pipeline/deep_analyzer.py
	# Deep analysis layer: CLIP + Gemini reasoning (HIGH risk only)

	from dataclasses import dataclass, field
	from PIL import Image
	from app.models.model_registry import model_registry
	from app.services.gemini_service import gemini_service
	from app.pipeline.fast_filter import FilterResult
	from app.utils.image_utils import image_to_base64
	from app.observability.logging import get_logger

	logger = get_logger(__name__)


	@dataclass
	class DeepAnalysisResult:
	"""Output from the deep analysis stage."""
	is_confirmed: bool # Does deep analysis confirm the threat?
	severity: str # low, medium, high, critical
	reasoning: str # Explanation from Gemini
	categories: list[str] = field(default_factory=list)
	recommended_action: str = "warn" # allow, warn, block, escalate
	confidence: float = 0.0
	clip_scores: dict = field(default_factory=dict)
	gemini_raw: dict = field(default_factory=dict)


	class DeepAnalyzer:
	"""
	Deep analysis layer invoked only for HIGH-risk content.

	Pipeline:
	1. CLIP multimodal alignment (if image present)
	2. Gemini reasoning via LangChain
	3. Combine signals into final assessment

	This layer trades speed for accuracy — expected latency: 1-3 seconds.
	"""

	async def analyze_text(
	self,
	text: str,
	filter_result: FilterResult,
	) -> DeepAnalysisResult:
	"""
	Deep analysis for flagged text content.

	Args:
	text: Original text content.
	filter_result: Results from the fast filter stage.

	Returns:
	DeepAnalysisResult with Gemini reasoning.
	"""
	logger.info("deep_analysis_text_started")

	# Prepare context from fast filter
	context = {
	"flagged_categories": filter_result.categories,
	"max_score": filter_result.max_score,
	"max_label": filter_result.max_label,
	"all_scores": filter_result.scores,
	}

	# Invoke Gemini for contextual reasoning
	gemini_result = await gemini_service.analyze_text(text, context)

	result = self._build_result(gemini_result)

	logger.info(
	"deep_analysis_text_complete",
	confirmed=result.is_confirmed,
	severity=result.severity,
	action=result.recommended_action,
	)
	return result

	async def analyze_image(
	self,
	image: Image.Image,
	filter_result: FilterResult,
	context_text: str \| None = None,
	) -> DeepAnalysisResult:
	"""
	Deep analysis for flagged image content.

	Args:
	image: PIL Image.
	filter_result: Results from the fast filter.
	context_text: Optional text accompanying the image.

	Returns:
	DeepAnalysisResult with CLIP alignment + Gemini reasoning.
	"""
	logger.info("deep_analysis_image_started")

	# Step 1: CLIP multimodal alignment
	clip_scores = {}
	if model_registry.clip_available:
	try:
	clip_result = model_registry.clip_model.align_content(image, context_text)
	clip_scores = clip_result
	logger.info("clip_alignment_complete", most_aligned=clip_result.get("most_aligned"))
	except Exception as e:
	logger.warning("clip_alignment_failed", error=str(e))

	# Step 2: Gemini image reasoning
	context = {
	"flagged_categories": filter_result.categories,
	"max_score": filter_result.max_score,
	"clip_alignment": clip_scores.get("most_aligned", "unknown"),
	}

	image_b64 = image_to_base64(image)
	gemini_result = await gemini_service.analyze_image(image_b64, context)

	result = self._build_result(gemini_result, clip_scores)

	logger.info(
	"deep_analysis_image_complete",
	confirmed=result.is_confirmed,
	severity=result.severity,
	)
	return result

	def _build_result(
	self,
	gemini_result: dict,
	clip_scores: dict \| None = None,
	) -> DeepAnalysisResult:
	"""Build DeepAnalysisResult from Gemini response."""
	if "error" in gemini_result:
	# Gemini failed — err on the side of caution
	return DeepAnalysisResult(
	is_confirmed=True, # Assume harmful if we can't verify
	severity="medium",
	reasoning=f"Deep analysis unavailable: {gemini_result['error']}. Defaulting to caution.",
	recommended_action="warn",
	confidence=0.3,
	clip_scores=clip_scores or {},
	gemini_raw=gemini_result,
	)

	return DeepAnalysisResult(
	is_confirmed=gemini_result.get("is_confirmed", False),
	severity=gemini_result.get("severity", "medium"),
	reasoning=gemini_result.get("reasoning", "No reasoning provided"),
	categories=gemini_result.get("categories", []),
	recommended_action=gemini_result.get("recommended_action", "warn"),
	confidence=gemini_result.get("confidence", 0.5),
	clip_scores=clip_scores or {},
	gemini_raw=gemini_result,
	)