Spaces:

YashashMathur
/

aegis_training

Runtime error

YashashMathur commited on 14 days ago

Commit

609a677

verified ·

1 Parent(s): aac0ab9

Add OpenEnv manifest

Files changed (1) hide show

openenv.yaml ADDED Viewed

+name: AEGIS-ENV
+version: 0.1.0
+description: "AI Fleet Oversight RL Training Environment - Train an LLM to detect policy violations in AI agent workflows"
+url: "https://github.com/mathuryashash/AEGIS-ENV"
+tags:
+  - reinforcement-learning
+  - safety
+  - llm-training
+  - openenv
+  - meta-hackathon
+author: "Hitanshu & Yashash"
+interface:
+  type: fastapi
+  port: 7860
+metrics:
+  track_suspicion: true
+  enable_episode_logs: true
+  log_rewards: true
+environment:
+  type: rl
+  observation:
+    - worker_cot_trace
+    - worker_output
+    - policies
+    - memory_context
+    - simulation_logs
+  actions:
+    - decision: ALLOW|BLOCK|ESCALATE
+    - violation_type: string
+    - policy_rule_cited: string
+    - explanation: string
+  rewards:
+    - decision_correctness
+    - violation_identification
+    - policy_citation
+    - explanation_quality
+    - format_compliance
+rubric:
+  decision_accuracy:
+    weight: 0.35
+    description: "Correct ALLOW/BLOCK/ESCALATE classification"
+  violation_detection:
+    weight: 0.25
+    description: "Accurate violation type identification"
+  policy_reasoning:
+    weight: 0.20
+    description: "Citing correct policy rules"
+  explanation_quality:
+    weight: 0.10
+    description: "Clear reasoning in explanation"
+  format_compliance:
+    weight: 0.10
+    description: "Valid JSON output format"