Spaces:

qimma
/

leaderboard

Running on CPU Upgrade

Alyafeai commited on Feb 16

Commit

b828f6c

1 Parent(s): 0da0ffb

adding new benchmarks

Files changed (1) hide show

backend/config.py CHANGED Viewed

@@ -30,6 +30,12 @@ TASKS: List[Tuple[str, str, str]] = [
         "MedArabiQ",
     ),
     ("qimma-ArablegalEval-QA|0", "BERTScore-F", "ArabLegalQA"),
 ]
 # --- 3. Model Metadata ---

         "MedArabiQ",
     ),
     ("qimma-ArablegalEval-QA|0", "BERTScore-F", "ArabLegalQA"),
+    ("acc:logprob_normalization=LogProbCharNorm(name='norm', ignore_first_space=False)", "qimma-GAT:_average|0", "GAT"),
+    ("acc:logprob_normalization=LogProbCharNorm(name='norm', ignore_first_space=False)", "qimma-MedAraBench:_average|0", "MedAraBench"),
+    ("humaneval_scores", "humaneval_plus", "HumanEval+"),
+    ("mbpp_scores", "mbpp_plus", "MBPP+"),
+    ("fann", "fann", "FANN"),
+    ("flop", "flop", "FLOP"),
 ]
 # --- 3. Model Metadata ---