Spaces:

lablab-ai-amd-developer-hackathon
/

Threat_Hunter

Running

App Files Files Community

Threat_Hunter / docs /AGENT_ESSENCE.md

EricChen2005

Deploy ThreatHunter - AMD MI300X + Qwen2.5-32B

c8d30bc 1 day ago

preview code

raw

history blame contribute delete

16.7 kB

ThreatHunter Agent 本質說明書

版本：v1.0 | 更新日期：2026-04-23
用途：給團隊成員理解每個 Agent 本質上在做什麼

總覽：Pipeline 資料流

使用者輸入（程式碼 / 套件 / 設定檔）
       │
       ▼
┌──────────────────┐
│   Orchestrator   │ ← 指揮官：決定走哪條路（A/B/C/D）、誰要上場
└──────┬───────────┘
       │ 並行 Layer 1
       ▼
┌──────────────┐  ┌───────────────┐  ┌──────────────────┐
│Security Guard│  │ Intel Fusion  │  │ L0/L1 Scanner    │
│（程式碼消毒） │  │（六維情報融合）│  │（正則預掃描）     │
└──────┬───────┘  └───────┬───────┘  └────────┬─────────┘
       │                  │                   │
       └──────────┬───────┘───────────────────┘
                  ▼
          ┌──────────────┐
          │    Scout     │ ← 偵察兵：組裝最終漏洞清單，重用 Intel Fusion 情報
          └──────┬───────┘
                 ▼
          ┌──────────────┐
          │   Analyst    │ ← 分析師：KEV 驗證 + 連鎖攻擊分析
          └──────┬───────┘
                 ▼
          ┌──────────────┐
          │ Debate Engine│ ← 辯論：Analyst vs Critic（最多 3 輪）
          │  + Critic    │
          │  + Judge     │
          └──────┬───────┘
                 ▼
          ┌──────────────┐
          │   Advisor    │ ← 顧問：產出可執行的行動報告
          └──────────────┘
                 │
                 ▼
              UI 顯示

1. Orchestrator（指揮官）

項目	說明
檔案	`agents/orchestrator.py` (518 行)
本質	不用 LLM 做推理的確定性路由器。根據輸入類型決定走哪條路、跳過哪些 Agent、走哪些捷徑
LLM 使用	幾乎不用。路由邏輯全是 if/else 確定性程式碼
核心函式	`classify_input()` → 決定 Path A/B/C/D
	`check_shortcuts()` → MacNet Small-World 捷徑
	`review_worker_output()` → 審閱各 Agent 輸出品質

四條掃描路徑

路徑	觸發條件	啟動的 Agent
A 套件掃描	輸入只有 `package==version`	Intel Fusion → Scout → Analyst → Debate → Judge
B 完整程式碼	有 `def`/`class` 等程式碼	Security Guard + Intel Fusion + L0 → Scout → Analyst → Debate → Judge
C 文件掃描	`.env`/`.yaml` 等設定檔	Doc Scanner + Intel Fusion → Scout → Judge
D 回饋迴路	Judge 信心不足時觸發	Intel Fusion → Analyst → Debate → Judge（最多 2 次）

Small-World 捷徑（省 Token 機制）

捷徑	觸發條件	效果
`kev_to_analyst_direct`	CISA KEV 命中	跳過 Scout 重新評分
`skip_l2_llm`	L0 正則零發現	跳過 L2 LLM 分析
`debate_phase2_skipped`	辯論第一輪就共識	省 6 次 LLM 呼叫
`skip_debate_all_low`	全部 CVSS < 4.0	跳過整個辯論

2. Security Guard（程式碼消毒員）

項目	說明
檔案	`agents/security_guard.py` (1174 行)
本質	完全確定性的靜態分析引擎。用正則 + AST 從使用者程式碼中提取函式、危險模式、硬編碼密碼。絕不使用 LLM 判斷
LLM 使用	零。這是唯一完全不依賴 LLM 的 Agent
設計依據	Dual LLM Pattern (Simon Willison 2024) + OWASP LLM01:2025

核心函式：`extract_code_surface(code: str)`

輸入：使用者提交的原始程式碼（任何語言）
輸出：結構化 JSON，包含：

{
  "functions": ["eval", "exec", "os.system"],    // AST 提取的函式呼叫
  "patterns": [                                   // 正則匹配的危險模式
    {"type": "CMD_INJECTION", "cwe": "CWE-78", "severity": "CRITICAL", "snippet": "os.system(cmd)"}
  ],
  "hardcoded": [                                  // 硬編碼密碼/金鑰
    {"type": "HARDCODED_SECRET", "snippet": "api_key = 'sk-xxx'"}
  ],
  "language": "python",                           // 偵測到的語言
  "stats": {"loc": 150, "function_count": 12}
}

三層偵測架構

層級	機制	覆蓋範圍
L0 通用正則	`_DANGER_UNIVERSAL`	SQL Injection、CMD Injection、Path Traversal、XXE、Hardcoded Secret、Log4Shell JNDI
L1 語言特化	`_DANGER_LANG[language]`	Python: Pickle/YAML/Eval/SSRF/SSTI；JS: Prototype Pollution/innerHTML；Java: Deserialization；C#: Process.Start/SqlCommand/BinaryFormatter 等
L2 AST 分析	Python `ast.parse()`	精確函式呼叫提取（不被字串/註解干擾）

支援語言（15 種）

Python、JavaScript、TypeScript、Java、C#、PHP、Ruby、Go、Rust、C/C++、Kotlin、Swift、Scala、Bash、SQL

關鍵設計決策

為何不用 LLM？ → 防 Prompt Injection。使用者程式碼可能包含 # Ignore all previous instructions，如果讓 LLM 分析程式碼，LLM 可能被注入。確定性正則不受此影響。
Word Boundary 修補 → (?<!\w) lookbehind 防止 ecosystem 誤觸 system\s*\( 模式。

3. Intel Fusion（六維情報融合師）

項目	說明
檔案	`agents/intel_fusion.py` (792 行)
本質	用 LLM 自主決策要查哪些情報源，然後用確定性公式計算複合風險分數
LLM 使用	用於決定查詢順序和解析 API 回傳；分數計算由程式碼執行
Tools	search_nvd、search_osv、check_cisa_kev、search_otx、fetch_epss_score、query_ghsa、read/write_memory

六維評分公式

composite_score = (cvss×0.20 + epss×0.30 + kev×0.25 + ghsa×0.10 + attck×0.10 + otx×0.05) × 10

維度	來源	權重	說明
CVSS	NVD API	20%	理論嚴重性（0-10）
EPSS	FIRST.org	30%	30 天內被利用的機率（0-1）
KEV	CISA	25%	已確認在野利用（二元）
GHSA	GitHub Advisory	10%	生態系專屬告警
ATT&CK	MITRE	10%	攻擊戰術分類
OTX	AlienVault	5%	IoC 威脅情報

動態加權規則（確定性程式碼）

條件	調整
`in_kev == True`	EPSS 降至 0（KEV 已是最高事實）→ 權重轉給 KEV
`cve_year < 2020`	EPSS 降至 0.10（舊漏洞 EPSS 不準）→ 權重轉給 CVSS
`otx_fail_rate > 0.5`	OTX 降至 0.01 → 權重轉給 CVSS
`in_kev && composite < 8.0`	強制拉到 8.0（KEV 品質紅線）

Harness 保障

Layer 2：_verify_and_recalculate() — LLM 算出的分數與程式碼計算差 >1.5 → 用程式碼的
Layer 2.5：CVE 年份過濾 — < 2005 的遠古 CVE 一律濾除

4. Scout（威脅情報偵察兵）

項目	說明
檔案	`agents/scout.py` (794 行)
本質	Pipeline 第一個 LLM Agent。彙整 OSV/NVD 與 Layer 1 情報，產出最終 `vulnerabilities[]` 與 scan-scoped 結果
LLM 使用	使用 LLM 決定查詢順序、解析 API 回傳、合併 Intel Fusion 證據並組裝 JSON 報告
Tools	search_osv（主力）、search_nvd（備用）、read/write_memory、history_search

工作流程（SOP 6 步）

read_memory("scout") — 讀取歷史掃描記錄
對每個套件呼叫 search_osv()（OSV.dev ecosystem-aware）→ 無結果則 fallback search_nvd()
若 Layer 1 已提供 intel_fusion_result，優先重用其 EPSS / OTX / KEV / GHSA 富化證據，不重複查詢
組裝 JSON 報告（CVE ID 必須來自 API，絕不可編造）
write_memory("scout") — 儲存本次結果
輸出 Final Answer（純 JSON）

Path-Aware Skill Map

Path	Skill 檔案	用途
A (pkg)	`threat_intel.md`	NVD CVE 掃描
B (code)	`source_code_audit.md`	OWASP Top10 + CWE
B (injection)	`ai_security_audit.md`	OWASP LLM Top10
C (config)	`config_audit.md`	CIS Benchmark

Harness 保障（5 層）

層	功能
0	OSV Batch 預熱：LLM 啟動前批量查所有套件，結果預存快取
1	強制 write_memory：LLM 沒寫 → 程式碼代寫
2	Schema 驗證：缺少必要欄位 → 自動補全
2.5	Cache 注入：LLM 輸出 0 CVE → 從 OSV/NVD 快取注入
3	CVE 驗證：幻覺偵測 — 每個 CVE ID 回 NVD 精確查詢，不存在 → 移除
3.5	年份過濾：`< 2005` 的 CVE 一律移除
4	Package 補全：CVE 沒有 package 欄位 → 從 description 推斷
5	is_new 校正：比對歷史記憶，修正 LLM 的 is_new 標記

5. Analyst（漏洞連鎖分析師）

項目	說明
檔案	`agents/analyst.py` (1045 行)
本質	深度分析 + 連鎖攻擊路徑推理。接收 Scout 的 CVE 清單，驗證 KEV/Exploit 狀態，分析漏洞間的連鎖關係
LLM 使用	重度使用。連鎖攻擊分析需要 LLM 推理
Tools	check_cisa_kev、search_exploits、read/write_memory、history_search

3-Task 拆分架構（降低弱模型認知負荷）

Sub-Agent	職責	擁有的 Tool
Collector	讀歷史記憶 + 解析 Scout JSON	`read_memory`
Verifier	KEV 驗證 + Exploit 搜尋 + Chain 分析	`check_cisa_kev`、`search_exploits`
Scorer	計算風險分數 + 寫記憶 + 輸出 JSON	`write_memory`

連鎖攻擊分析規則

條件	風險調整
in_kev + exploit + chain	→ CRITICAL
in_kev + exploit	→ CRITICAL
chain alone	→ 至少維持原始嚴重度
規則：風險只能升高，絕不能降低

風險分數計算

risk_score = min(100, Σ(cvss_score × weight))
weight: CRITICAL=3, HIGH=2, MEDIUM=1, LOW=0.5

Harness 保障

層	功能
1	強制 write_memory
2	Schema 驗證（scan_id/risk_score/analysis 必須存在）
3	chain_risk 邏輯驗證（is_chain=true → 必須有 chain_with + chain_description）
3.5	CVE 年份標記（`< 2005` → confidence=NEEDS_VERIFICATION）
Fallback	LLM 完全失敗 → 用 Scout 資料建最小可行報告

6. Critic（魔鬼代言人）

項目	說明
檔案	`agents/critic.py` (388 行)
本質	對抗性審查者。質疑 Analyst 的每個判斷，驗證假設，輸出 5 維記分卡
LLM 使用	用於生成質疑論點、驗證邏輯
Tools	check_cisa_kev、search_exploits、read_memory
可關閉	`ENABLE_CRITIC=false` → 完全跳過，輸出 SKIPPED

5 維記分卡

維度	權重	說明
evidence	30%	證據充分度
chain_completeness	25%	連鎖分析完整度
critique_quality	20%	質疑品質
defense_quality	15%	辯護品質
calibration	10%	校準準確度

裁決規則

加權分數	裁決
≥ 70	MAINTAIN（維持 Analyst 判斷）
50–69	MAINTAIN（附帶挑戰筆記）
< 50	DOWNGRADE（降級風險評估）

關鍵限制

禁止降級 KEV 命中的 CVE（in_cisa_kev=true → 不可 DOWNGRADE）
必須至少呼叫一個 Tool 才能下結論

7. Debate Engine（辯論引擎）

項目	說明
檔案	`agents/debate_engine.py` (478 行)
本質	多 Agent 辯論協調器。讓 Analyst 和 Critic 進行最多 3 輪辯論，無共識時由 Judge 仲裁
論文依據	Du et al. (2023) "Improving Factuality and Reasoning in LLMs through Multiagent Debate" (ICML 2023)

辯論流程

Round 1: Analyst 提出初始立場 → Critic 質疑
Round 2: Analyst 更新立場（含 Critic 反饋）→ Critic 再評
Round 3: Analyst 最終立場 → Critic 最終評判
         ↓ 若 3 輪後仍無共識
Final:   Judge sub-agent 仲裁（獨立第三方）

共識判定

Critic verdict = MAINTAIN → 直接共識
Critic verdict = DOWNGRADE 但 score ≥ 80 → 共識（Analyst 立場強）
其他 → 繼續辯論

Judge Sub-Agent

獨立第三方，不是 Analyst 也不是 Critic
閱讀完整辯論紀錄，選擇最有邏輯支持的立場
安全性偏保守原則：證據相當時，選更嚴重的評級

8. Advisor（資安顧問 / 最終裁決者）

項目	說明
檔案	`agents/advisor.py` (812 行)
本質	Pipeline 終點站。接收所有前序 Agent 的分析結果，產出面向管理者的可執行行動報告
LLM 使用	使用 LLM 生成修補建議和 executive summary
Tools	read_memory、write_memory、history_search

輸出格式（Advisor → UI 資料契約）

{
  "executive_summary": "一句話風險摘要",
  "actions": {
    "urgent": [{"cve_id": "...", "command": "pip install --upgrade xxx", ...}],
    "important": [{"cve_id": "...", "action": "...", ...}],
    "resolved": []
  },
  "risk_score": 85,
  "risk_trend": "+12",
  "code_patterns_summary": [...]
}

三級分類規則

級別	條件
URGENT	CVSS ≥ 9.0 或 in_cisa_kev=true 或有公開 PoC
IMPORTANT	CVSS ≥ 7.0 或有攻擊鏈風險
不列入	MEDIUM/LOW 且無利用跡象

Harness 保障（6.5 層）

層	功能
1	LLM 輸出無法解析 → Fallback 最小可行報告
2	Schema 驗證（executive_summary/actions/risk_score 必須存在）
3	risk_score 範圍驗證（強制 0-100）
4	URGENT 項目必須有 command（沒有 → 自動補 `pip install --upgrade`）
5	歷史比對：重複未修補 CVE → `[REPEATED — STILL NOT PATCHED]` 語氣升級
6	憲法守衛：CODE-pattern（無真實 CVE ID）從 URGENT/IMPORTANT 移至 `code_patterns_summary`
6.5	CWE 佐證注入：為每個 code pattern 加入 MITRE CWE 官方定義、CVSS、代表性 CVE

Agent 間的資料契約總表

上游	下游	傳遞的 JSON 欄位
Orchestrator	全部	`scan_path`, `agents_to_run`, `shortcuts`
Security Guard	Scout/Analyst	`functions[]`, `patterns[]`, `hardcoded[]`, `language`
Intel Fusion	Scout	`fusion_results[]`, `composite_score`, `kev_hits`
Scout	Analyst	`vulnerabilities[]`, `code_patterns[]`, `summary`
Analyst	Critic/Debate	`analysis[]`, `risk_score`, `risk_trend`
Critic	Debate Engine	`scorecard`, `weighted_score`, `verdict`, `challenges[]`
Debate Engine	Advisor	最終裁決 + `_debate_meta`
Advisor	UI	`executive_summary`, `actions{urgent/important/resolved}`, `risk_score`

共通機制

429 自動輪替（所有 LLM Agent 共用）

for attempt in range(MAX_LLM_RETRIES + 1):
    agent = create_xxx_agent(excluded_models)
    try:
        result = crew.kickoff()
        break
    except Exception as e:
        if "429" in str(e):
            mark_model_failed(current_model)
            excluded_models.append(current_model)
            rate_limiter.on_429(retry_after=...)
            continue
        raise

Graceful Degradation（所有 Agent 共用）

每個 Agent 都有 _build_fallback_output() — LLM 完全失敗時，用前序 Agent 的資料建最小可行報告，確保 Pipeline 不中斷。

CVE 年份過濾（三道防線）

位置	機制
Scout Harness 3.5	`< 2005` 的 CVE 從 vulnerabilities 移除
Intel Fusion Harness 2.5	`< 2005` 的 CVE 從 fusion_results 移除
Advisor Harness 6	`< 2005` 的 CVE 從 urgent/important 移除

本文件僅供團隊內部參考，不需上傳至 Git。

ThreatHunter Agent 本質說明書

總覽：Pipeline 資料流

1. Orchestrator（指揮官）

四條掃描路徑

Small-World 捷徑（省 Token 機制）

2. Security Guard（程式碼消毒員）

核心函式：extract_code_surface(code: str)

三層偵測架構

支援語言（15 種）

關鍵設計決策

3. Intel Fusion（六維情報融合師）

六維評分公式

動態加權規則（確定性程式碼）

Harness 保障

4. Scout（威脅情報偵察兵）

工作流程（SOP 6 步）

Path-Aware Skill Map

Harness 保障（5 層）

5. Analyst（漏洞連鎖分析師）

3-Task 拆分架構（降低弱模型認知負荷）

連鎖攻擊分析規則

風險分數計算

Harness 保障

6. Critic（魔鬼代言人）

5 維記分卡

裁決規則

關鍵限制

7. Debate Engine（辯論引擎）

辯論流程

共識判定

Judge Sub-Agent

8. Advisor（資安顧問 / 最終裁決者）

輸出格式（Advisor → UI 資料契約）

三級分類規則

Harness 保障（6.5 層）

Agent 間的資料契約總表

共通機制

429 自動輪替（所有 LLM Agent 共用）

Graceful Degradation（所有 Agent 共用）

CVE 年份過濾（三道防線）

核心函式：`extract_code_surface(code: str)`