Add evaluation results from GPT-OSS paper

#183

by SaylorTwift HF Staff - opened Mar 2

←

Files changed (1) hide show

.eval_results/gpqa_diamond_medium_with_tools.yaml ADDED Viewed

+- dataset:
+    id: Idavidrein/gpqa
+    task_id: diamond
+  value: 73.5
+  date: '2025-08-05'
+  source:
+    url: https://arxiv.org/abs/2508.10925
+    name: GPT-OSS Model Card
+    user: SaylorTwift
+  notes: "Reasoning: medium, With tools"