Spaces:

qimma
/

leaderboard

Running on CPU Upgrade

App Files Files Community

Alyafeai commited on Feb 6

Commit

fbb9d41

1 Parent(s): a587249

mcq tasks

Browse files

Files changed (8) hide show

__pycache__/app.cpython-313.pyc +0 -0
backend/__pycache__/__init__.cpython-313.pyc +0 -0
backend/__pycache__/config.cpython-313.pyc +0 -0
backend/__pycache__/data_loader.cpython-313.pyc +0 -0
backend/__pycache__/helpers.cpython-313.pyc +0 -0
backend/__pycache__/submission_handler.cpython-313.pyc +0 -0
backend/config.py +32 -21
frontend/leaderboard.html +1 -1

__pycache__/app.cpython-313.pyc ADDED Viewed

Binary file (8.07 kB). View file

backend/__pycache__/__init__.cpython-313.pyc ADDED Viewed

Binary file (172 Bytes). View file

backend/__pycache__/config.cpython-313.pyc ADDED Viewed

Binary file (1.79 kB). View file

backend/__pycache__/data_loader.cpython-313.pyc ADDED Viewed

Binary file (6.86 kB). View file

backend/__pycache__/helpers.cpython-313.pyc ADDED Viewed

Binary file (4.07 kB). View file

backend/__pycache__/submission_handler.cpython-313.pyc ADDED Viewed

Binary file (20.6 kB). View file

backend/config.py CHANGED Viewed

@@ -1,29 +1,40 @@
-# backend/config.py
 import os
 from huggingface_hub import HfApi
-# Hugging Face dataset repos (PUBLIC)
-REQUESTS_REPO_ID = "qimma/leaderboard-requests"
-RESULTS_REPO_ID  = "qimma/leaderboard-results"
-# Tasks definition (task_key, metric_key, display_name)
-TASKS = [
-    ("arc", "acc_norm", "ARC"),
-    ("mmlu", "acc", "MMLU"),
-    ("hellaswag", "acc_norm", "HellaSwag"),
-]
-MODEL_TYPE_TO_EMOJI = {
-    "base": "🧱",
-    "chat": "💬",
-    "instruct": "🧠",
-}
-# Optional token (read-only)
-hf_api_token = os.getenv("HF_TOKEN")
-# SAFE: API always exists
-API = HfApi(token=hf_api_token) if hf_api_token else HfApi()
-# SAFE: always defined
-SLACK_WEBHOOK_URL = None

 import os
+from typing import Dict, List, Tuple, Optional
 from huggingface_hub import HfApi
+# --- 1. Repository & API Configuration ---
+OWNER: str = "qimma"
+REPO_ID: str = f"{OWNER}/Qimma-Leaderboard"
+RESULTS_REPO_ID: str = f"{OWNER}/results_v3"
+REQUESTS_REPO_ID: str = f"{OWNER}/requests_v3"
+SLACK_WEBHOOK_URL = os.getenv("SLACK_WEBHOOK_URL", "")
+hf_api_token: Optional[str] = os.getenv("HF_API_TOKEN")
+API = HfApi(token=hf_api_token)
+# --- 2. Task Definitions ---
+# Format: (dataset_key, metric_field, display_name)
+TASKS: List[Tuple[str, str, str]] = [
+    ("qimma-AraDiCE-Culture:_average|0",    "acc:logprob_normalization=LogProbCharNorm(name='norm', ignore_first_space=False)",     "AraDiCE-Culture"),
+    ("qimma-ArabicMMLU:_average|0",         "acc:logprob_normalization=LogProbCharNorm(name='norm', ignore_first_space=False)",     "ArabicMMLU"),
+    ("qimma-MedArabiQ:_average|0",          "acc:logprob_normalization=LogProbCharNorm(name='norm', ignore_first_space=False)",     "MedArabiQ"),
+    ("qimma-ArabCulture:_average|0",        "acc:logprob_normalization=LogProbCharNorm(name='norm', ignore_first_space=False)",     "ArabCulture"),
+    ("qimma-SyntheticQA:_average|0",        "acc:logprob_normalization=LogProbCharNorm(name='norm', ignore_first_space=False)",     "SyntheticQA"),
+    ("qimma-PALMX-2025|0",                  "acc:logprob_normalization=LogProbCharNorm(name='norm', ignore_first_space=False)",     "PALMX"),
+    ("qimma-NativeQA|0",                    "acc:logprob_normalization=LogProbCharNorm(name='norm', ignore_first_space=False)",     "NativeQA"),
+    ("qimma-NativeQA-RDP|0",                "acc:logprob_normalization=LogProbCharNorm(name='norm', ignore_first_space=False)",     "NativeQA-RDP"),
+    ("qimma-AraTrust|0",                    "acc:logprob_normalization=LogProbCharNorm(name='norm', ignore_first_space=False)",     "AraTrust"),
+    ("qimma-MizanQA|0",                     "acc:logprob_normalization=LogProbCharNorm(name='norm', ignore_first_space=False)",     "MizanQA"),
+]
+# --- 3. Model Metadata ---
+MODEL_TYPE_TO_EMOJI: Dict[str, str] = {
+    "🟢 : pretrained": "🟢",
+    "🟩 : continuously pretrained": "🟩",
+    "💬 : chat models (RLHF, DPO, IFT, ...)": "💬",
+    "🔶 : fine-tuned on domain-specific datasets": "🔶",
+    "🤝 : base merges and merges": "🤝",
+    "Missing": "?",
+}

frontend/leaderboard.html CHANGED Viewed

@@ -746,7 +746,7 @@
                     $('#modalLinkHF').href = `https://huggingface.co/${model["Model Name"]}`;
                     const cleanName = model["Model Name"].replace(/\//g, '__');
-                    const datasetId = `OALL/details_${cleanName}_v2`;
                     $('#modalLinkDetails').href = `https://huggingface.co/datasets/${datasetId}`;
                     const chartContainer = $('#modalChart');

                     $('#modalLinkHF').href = `https://huggingface.co/${model["Model Name"]}`;
                     const cleanName = model["Model Name"].replace(/\//g, '__');
+                    const datasetId = `OALL/details_${cleanName}`;
                     $('#modalLinkDetails').href = `https://huggingface.co/datasets/${datasetId}`;
                     const chartContainer = $('#modalChart');