Spaces:

ztothez
/

aegisops-ai

Running

App Files Files Community

ztothez commited on about 11 hours ago

Commit

4ab37ac

1 Parent(s): ed2a586

feat: add Qwen validator sidecar metadata

Browse files

Files changed (5) hide show

agents/verifier_agent.py +5 -0
demo_output.py +2 -0
frontend/src/app/page.tsx +18 -2
frontend/src/types/aegis.ts +2 -0
server.py +31 -8

agents/verifier_agent.py CHANGED Viewed

@@ -18,7 +18,12 @@ Verify whether high-fidelity red-team artifacts are covered by detection and res
 """),
     ]
     content, metric = invoke_with_metrics(chat, messages, "verifier_agent")
     return {
         "verifier_output": content,
         "metrics": merge_metrics(state, metric),
     }

 """),
     ]
     content, metric = invoke_with_metrics(chat, messages, "verifier_agent")
+    verifier_model = metric.get("model") or "Unknown verifier model"
+    verifier_model_role = metric.get("model_role") or metric.get("requested_role") or "unknown"
     return {
         "verifier_output": content,
+        "verifier_model": verifier_model,
+        "verifier_model_role": verifier_model_role,
         "metrics": merge_metrics(state, metric),
     }

demo_output.py CHANGED Viewed

@@ -688,5 +688,7 @@ DEMO_INVOKE_RESULT = {
     "blue_output": DEMO_BLUE_OUTPUT,
     "response_output": DEMO_RESPONSE_OUTPUT,
     "verifier_output": DEMO_VERIFIER_OUTPUT,
     "metrics": DEMO_METRICS,
 }

     "blue_output": DEMO_BLUE_OUTPUT,
     "response_output": DEMO_RESPONSE_OUTPUT,
     "verifier_output": DEMO_VERIFIER_OUTPUT,
+    "verifier_model": "Qwen Validator Demo",
+    "verifier_model_role": "qwen",
     "metrics": DEMO_METRICS,
 }

frontend/src/app/page.tsx CHANGED Viewed

@@ -120,6 +120,12 @@ export default function SOCCommandCenter() {
   const heroPillDot = endpointOk ? "bg-aegis-green shadow-[0_0_6px_#22C55E]" : "bg-aegis-amber shadow-[0_0_6px_#F59E0B]";
   const heroPillText = endpointOk ? `LIVE · VLLM ON ROCM · MI300X · ${modelName}` : "OFFLINE · DEMO FALLBACK ACTIVE";
   // ── Sub-Component: Artifact Grid (Canonical Naming) ────────────────────────
   const ArtifactGridComponent = ({ run }: { run: RunResult }) => {
     // Generate canonical file prefix
@@ -449,7 +455,17 @@ export default function SOCCommandCenter() {
         {/* LATEST REPORT HERO CARD */}
         <div className="bg-gradient-to-br from-aegis-panel-3 to-aegis-panel border border-aegis-border-purple rounded-xl p-6 mb-6 shadow-aegis-card relative overflow-hidden">
           <div className="absolute top-0 right-0 p-4 opacity-10 font-mono font-bold text-8xl text-aegis-purple">RPT</div>
-          <div className="font-sans font-bold text-[10px] leading-none text-aegis-purple-soft tracking-[0.14em] uppercase mb-4">▸ Latest Generated Report</div>
           <div className="flex justify-between items-start">
             <div>
@@ -673,7 +689,7 @@ export default function SOCCommandCenter() {
           { id: "red", label: "Threat Agent", model: "Llama 3.3 70B", top: "border-t-aegis-purple", text: "text-aegis-purple-soft", route: "primary" },
           { id: "blue", label: "Detection Agent", model: "Llama 3.3 70B", top: "border-t-aegis-blue", text: "text-aegis-blue-soft", route: "primary" },
           { id: "response", label: "Response Agent", model: "Llama 3.3 70B", top: "border-t-aegis-amber", text: "text-aegis-amber-soft", route: "primary" },
-          { id: "verifier", label: "Validation Agent", model: "Qwen / QwQ", top: "border-t-aegis-purple", text: "text-aegis-purple-soft", route: "qwen_validator" },
         ].map((agent, i) => {
           const isRunning = activeAgent === agent.id;
           const elapsed = agentTimes[agent.id];

   const heroPillDot = endpointOk ? "bg-aegis-green shadow-[0_0_6px_#22C55E]" : "bg-aegis-amber shadow-[0_0_6px_#F59E0B]";
   const heroPillText = endpointOk ? `LIVE · VLLM ON ROCM · MI300X · ${modelName}` : "OFFLINE · DEMO FALLBACK ACTIVE";
+  const verifierModel = results?.verifier_model ?? "";
+  const verifierRole = results?.verifier_model_role ?? "";
+  const qwenAudited =
+    verifierModel.toLowerCase().includes("qwen") ||
+    verifierRole.toLowerCase().includes("qwen");
   // ── Sub-Component: Artifact Grid (Canonical Naming) ────────────────────────
   const ArtifactGridComponent = ({ run }: { run: RunResult }) => {
     // Generate canonical file prefix
         {/* LATEST REPORT HERO CARD */}
         <div className="bg-gradient-to-br from-aegis-panel-3 to-aegis-panel border border-aegis-border-purple rounded-xl p-6 mb-6 shadow-aegis-card relative overflow-hidden">
           <div className="absolute top-0 right-0 p-4 opacity-10 font-mono font-bold text-8xl text-aegis-purple">RPT</div>
+                    <div className="flex items-center gap-2 mb-4">
+            <div className="font-sans font-bold text-[10px] leading-none text-aegis-purple-soft tracking-[0.14em] uppercase">
+              ▸ Latest Generated Report
+            </div>
+            {qwenAudited && (
+              <div className="inline-flex items-center rounded border border-aegis-border-purple bg-aegis-tint-purple px-2 py-1 font-mono text-[9px] font-bold uppercase tracking-[0.08em] text-aegis-purple-soft">
+                Audited by {verifierModel}
+              </div>
+            )}
+          </div>
           <div className="flex justify-between items-start">
             <div>
           { id: "red", label: "Threat Agent", model: "Llama 3.3 70B", top: "border-t-aegis-purple", text: "text-aegis-purple-soft", route: "primary" },
           { id: "blue", label: "Detection Agent", model: "Llama 3.3 70B", top: "border-t-aegis-blue", text: "text-aegis-blue-soft", route: "primary" },
           { id: "response", label: "Response Agent", model: "Llama 3.3 70B", top: "border-t-aegis-amber", text: "text-aegis-amber-soft", route: "primary" },
+          { id: "verifier", label: "Validation Agent", model: qwenAudited ? verifierModel : "Qwen-ready Validator", top: "border-t-aegis-purple", text: "text-aegis-purple-soft", route: qwenAudited ? "qwen_validator" : "validator_ready" },
         ].map((agent, i) => {
           const isRunning = activeAgent === agent.id;
           const elapsed = agentTimes[agent.id];

frontend/src/types/aegis.ts CHANGED Viewed

@@ -10,6 +10,8 @@ export interface Scores {
 export interface RunResult {
   technique_id: string; mode: string;
   scores: Scores;
   outputs: { red: string; blue: string; response: string; verifier: string };
   artifacts: { sigma: string; splunk: string; raw_red: string; raw_blue: string };

 export interface RunResult {
   technique_id: string; mode: string;
+  verifier_model?: string;
+  verifier_model_role?: string;
   scores: Scores;
   outputs: { red: string; blue: string; response: string; verifier: string };
   artifacts: { sigma: string; splunk: string; raw_red: string; raw_blue: string };

server.py CHANGED Viewed

@@ -104,6 +104,8 @@ def _build_response(result: dict, tid: str) -> dict:
     return {
         "status": "success",
         "technique_id": tid,
         "outputs": {
             "red": red,
             "blue": blue,
@@ -163,16 +165,31 @@ async def _stream_demo(technique_id: str) -> AsyncIterator[str]:
         ("response", "response_output", "Response Agent",   2.4),
         ("verifier", "verifier_output", "Validation Agent", 1.9),
     ]
-    yield _sse("start", {"demo": True, "technique_id": technique_id,
-                         "pipeline_version": "aegisops-production-hybrid-v1"})
     for key, field, label, delay in stages:
         yield _sse("agent_start", {"agent": key, "label": label})
         await asyncio.sleep(delay)
-        yield _sse("agent_done", {"agent": key, "label": label, "output": result.get(field, "")})
     full = _build_response(result, technique_id)
-    yield _sse("done", {"demo": True, "metrics": full["metrics"],
-                        "artifacts": full["artifacts"], "scores": full["scores"]})
 def _run_node(node_name: str, state: dict) -> dict:
     from agents.red_agent import run_red_agent
@@ -226,8 +243,14 @@ async def _stream_live(technique_id: str, mode: str) -> AsyncIterator[str]:
         all_results.append(state)
         # Yield a sub-completion for multi-technique chains
         full_sub = _build_response(state, tid)
-        yield _sse("done", {"demo": False, "metrics": full_sub["metrics"],
-                            "artifacts": full_sub["artifacts"], "scores": full_sub["scores"]})
 # ── Endpoints ─────────────────────────────────────────────────────────────────
 @api.post("/run")

     return {
         "status": "success",
         "technique_id": tid,
+        "verifier_model": result.get("verifier_model", "Unknown verifier model"),
+        "verifier_model_role": result.get("verifier_model_role", "unknown"),
         "outputs": {
             "red": red,
             "blue": blue,
         ("response", "response_output", "Response Agent",   2.4),
         ("verifier", "verifier_output", "Validation Agent", 1.9),
     ]
+    yield _sse("start", {
+        "demo": True,
+        "technique_id": technique_id,
+        "pipeline_version": "aegisops-production-hybrid-v1",
+    })
     for key, field, label, delay in stages:
         yield _sse("agent_start", {"agent": key, "label": label})
         await asyncio.sleep(delay)
+        yield _sse("agent_done", {
+            "agent": key,
+            "label": label,
+            "output": result.get(field, ""),
+        })
     full = _build_response(result, technique_id)
+    yield _sse("done", {
+        "demo": True,
+        "metrics": full["metrics"],
+        "artifacts": full["artifacts"],
+        "scores": full["scores"],
+        "verifier_model": full.get("verifier_model"),
+        "verifier_model_role": full.get("verifier_model_role"),
+    })
 def _run_node(node_name: str, state: dict) -> dict:
     from agents.red_agent import run_red_agent
         all_results.append(state)
         # Yield a sub-completion for multi-technique chains
         full_sub = _build_response(state, tid)
+        yield _sse("done", {
+            "demo": False,
+            "metrics": full_sub["metrics"],
+            "artifacts": full_sub["artifacts"],
+            "scores": full_sub["scores"],
+            "verifier_model": full_sub.get("verifier_model"),
+            "verifier_model_role": full_sub.get("verifier_model_role"),
+        })
 # ── Endpoints ─────────────────────────────────────────────────────────────────
 @api.post("/run")