Rohan03
/

purpose-agent

Text Generation

Model card Files Files and versions

purpose-agent / benchmarks

30.3 kB

Ctrl+K

Ctrl+K

1 contributor

History: 4 commits

Rohan03's picture

fix: real-model robustness — benchmarks/validate_real.py

d7dc6c8 verified 14 days ago

results
Track 2: validation suite with improvement curves, cold/warm, transfer, adversarial 14 days ago
validate.py

15.5 kB
Track 2: validation suite with improvement curves, cold/warm, transfer, adversarial 14 days ago
validate_real.py

8.16 kB
fix: real-model robustness — benchmarks/validate_real.py 14 days ago