Ctrl+K
SaylorTwift HF Staff
Add evaluation results: HLE, GPQA Diamond, SWE-bench Verified, Terminal-Bench 2.0
b9fee63 verified - .eval_results
- assets
- train
- 1.77 kB
- 16.1 kB
- 11.7 kB
- 11.9 kB
- 8.7 kB
- 1.19 kB
- 204 Bytes
- 5.36 GB xet
- 5.36 GB xet
- 5.36 GB xet
- 5.36 GB xet
- 5.36 GB xet
- 5.36 GB xet
- 5.36 GB xet
- 5.36 GB xet
- 5.36 GB xet
- 5.36 GB xet
- 5.36 GB xet
- 5.36 GB xet
- 5.36 GB xet
- 5.36 GB xet
- 5.36 GB xet
- 5.36 GB xet
- 5.36 GB xet
- 5.36 GB xet
- 5.36 GB xet
- 5.36 GB xet
- 5.36 GB xet
- 5.36 GB xet
- 5.36 GB xet
- 5.36 GB xet
- 5.36 GB xet
- 5.36 GB xet
- 5.36 GB xet
- 5.37 GB xet
- 5.36 GB xet
- 5.36 GB xet
- 5.36 GB xet
- 5.36 GB xet
- 5.36 GB xet
- 5.36 GB xet
- 5.36 GB xet
- 5.36 GB xet
- 5.36 GB xet
- 5.36 GB xet
- 5.36 GB xet
- 5.36 GB xet