Spaces:

tanmmayyy
/

mcq_generator

Sleeping

App Files Files Community

tanmmayyy commited on 27 days ago

Commit

6576362

1 Parent(s): dad0ef3

final

Browse files

Files changed (1) hide show

src/question_generator.py +40 -37

src/question_generator.py CHANGED Viewed

@@ -1,46 +1,35 @@
 # ─────────────────────────────────────────────
-#  src/question_generator.py  (v4)
-#  Key fix: validate that the generated question
-#  actually targets the intended answer.
-#  Also filters circular questions like
-#  "What is the name of X?" when answer IS X.
 # ─────────────────────────────────────────────
-from transformers import pipeline
 import re
 import sys, os
 from transformers import AutoTokenizer, T5ForConditionalGeneration
-import streamlit as st
-@st.cache_resource
-def load_model():
-    tokenizer = AutoTokenizer.from_pretrained("valhalla/t5-small-qg-hl", use_fast=False)
-    model     = T5ForConditionalGeneration.from_pretrained("valhalla/t5-small-qg-hl")
-    model.eval()
-    return tokenizer, model
-tokenizer, qg_model = load_model()
 sys.path.append(os.path.dirname(os.path.dirname(os.path.abspath(__file__))))
 from config import QG_MODEL_NAME, MAX_QUESTIONS
-print(f"[INFO] Loading QG model: {QG_MODEL_NAME} ...")
-import warnings
 warnings.filterwarnings("ignore")   # suppress HuggingFace FutureWarnings
-try:
-    qg_pipeline = pipeline(
-        "text2text-generation",
-        model     = QG_MODEL_NAME,
-        tokenizer = QG_MODEL_NAME,
-    )
-    print("[INFO] Model loaded.")
-except Exception as e:
-    print(f"[ERROR] {e}")
-    raise
 def highlight_answer(sentence: str, answer: str) -> str:
@@ -108,24 +97,38 @@ def generate_question(sentence: str, answer: str) -> str | None:
     """
     Generate a question for a (sentence, answer) pair.
     Returns the best valid question string, or None.
     """
     highlighted = highlight_answer(sentence, answer)
     input_text  = f"generate question: {highlighted}"
     try:
-        outputs = qg_pipeline(
             input_text,
-            max_new_tokens       = 64,
-            num_beams            = 5,
-            num_return_sequences = 3,
-            early_stopping       = True,
         )
     except Exception as e:
         print(f"  [QG] Generation error: {e}")
         return None
-    for output in outputs:
-        q = output["generated_text"].strip()
         if not q.endswith("?"):
             q += "?"
         if answer_is_addressable(q, answer):

 # ─────────────────────────────────────────────
+#  src/question_generator.py  (v5)
+#  Fix: replaced removed pipeline("text2text-generation")
+#  with direct AutoTokenizer + T5ForConditionalGeneration
+#  inference, compatible with transformers >= 4.46.
 # ─────────────────────────────────────────────
 import re
 import sys, os
+import warnings
+import torch
 from transformers import AutoTokenizer, T5ForConditionalGeneration
 sys.path.append(os.path.dirname(os.path.dirname(os.path.abspath(__file__))))
 from config import QG_MODEL_NAME, MAX_QUESTIONS
 warnings.filterwarnings("ignore")   # suppress HuggingFace FutureWarnings
+# ── Lazy model cache (avoids re-loading on every Streamlit rerun) ──
+_tokenizer = None
+_qg_model  = None
+def _get_model():
+    """Load model once and cache in module-level globals."""
+    global _tokenizer, _qg_model
+    if _tokenizer is None or _qg_model is None:
+        print(f"[INFO] Loading QG model: {QG_MODEL_NAME} ...")
+        _tokenizer = AutoTokenizer.from_pretrained(QG_MODEL_NAME, use_fast=False)
+        _qg_model  = T5ForConditionalGeneration.from_pretrained(QG_MODEL_NAME)
+        _qg_model.eval()
+        print("[INFO] Model loaded.")
+    return _tokenizer, _qg_model
 def highlight_answer(sentence: str, answer: str) -> str:
     """
     Generate a question for a (sentence, answer) pair.
     Returns the best valid question string, or None.
+    Uses direct tokenizer + model inference (no pipeline()).
     """
+    tokenizer, qg_model = _get_model()
     highlighted = highlight_answer(sentence, answer)
     input_text  = f"generate question: {highlighted}"
     try:
+        inputs = tokenizer(
             input_text,
+            return_tensors = "pt",
+            max_length     = 512,
+            truncation     = True,
         )
+        with torch.no_grad():
+            output_ids = qg_model.generate(
+                inputs["input_ids"],
+                max_new_tokens       = 64,
+                num_beams            = 5,
+                num_return_sequences = 3,
+                early_stopping       = True,
+            )
+        outputs = [
+            tokenizer.decode(ids, skip_special_tokens=True)
+            for ids in output_ids
+        ]
     except Exception as e:
         print(f"  [QG] Generation error: {e}")
         return None
+    for q in outputs:
+        q = q.strip()
         if not q.endswith("?"):
             q += "?"
         if answer_is_addressable(q, answer):