Spaces:

saadkhi
/

SQL_chatbot_API

Running

App Files Files Community

saadkhi commited on 15 days ago

Commit

5d261f7

verified ·

1 Parent(s): ac4a697

Update app.py

Browse files

Files changed (1) hide show

app.py +31 -21

app.py CHANGED Viewed

@@ -6,12 +6,14 @@ from fastapi import FastAPI
 from pydantic import BaseModel
 from transformers import AutoTokenizer, AutoModelForCausalLM
-# Optimize CPU
 torch.set_num_threads(1)
-app = FastAPI(title="SQL Generator API")
-BASE_MODEL = "distilgpt2"
 print("Loading model...")
@@ -22,12 +24,6 @@ model.eval()
 print("Model ready")
-# ─────────────────────────
-# Request Schema
-# ─────────────────────────
-class Query(BaseModel):
-    text: str
 # ─────────────────────────
 # SQL FILTER
 # ─────────────────────────
@@ -40,9 +36,6 @@ SQL_KEYWORDS = [
 def is_sql_related(text):
     return any(k in text.lower() for k in SQL_KEYWORDS)
-# ─────────────────────────
-# Generator
-# ─────────────────────────
 SYSTEM_PROMPT = """
 You are an expert SQL generator.
 Only output SQL query.
@@ -50,10 +43,10 @@ Only output SQL query.
 def generate_sql(user_input: str):
     if not user_input.strip():
-        return "Empty input."
     if not is_sql_related(user_input):
-        return "Only SQL-related queries allowed."
     prompt = f"{SYSTEM_PROMPT}\nUser: {user_input}\nSQL:"
@@ -62,9 +55,9 @@ def generate_sql(user_input: str):
     with torch.no_grad():
         output = model.generate(
             **inputs,
-            max_new_tokens=80,
-            temperature=0.2,
-            do_sample=True,
             pad_token_id=tokenizer.eos_token_id,
         )
@@ -74,13 +67,30 @@ def generate_sql(user_input: str):
     return result
 # ─────────────────────────
-# Routes
 # ─────────────────────────
 @app.get("/")
 def root():
-    return {"status": "API is running"}
 @app.post("/generate")
 def generate(query: Query):
-    result = generate_sql(query.text)
-    return {"result": result}

 from pydantic import BaseModel
 from transformers import AutoTokenizer, AutoModelForCausalLM
+import gradio as gr
+import threading
 torch.set_num_threads(1)
+app = FastAPI()
+BASE_MODEL = "TinyLlama/TinyLlama-1.1B-Chat-v1.0"
 print("Loading model...")
 print("Model ready")
 # ─────────────────────────
 # SQL FILTER
 # ─────────────────────────
 def is_sql_related(text):
     return any(k in text.lower() for k in SQL_KEYWORDS)
 SYSTEM_PROMPT = """
 You are an expert SQL generator.
 Only output SQL query.
 def generate_sql(user_input: str):
     if not user_input.strip():
+        return "Enter SQL question."
     if not is_sql_related(user_input):
+        return "Only SQL/database questions allowed."
     prompt = f"{SYSTEM_PROMPT}\nUser: {user_input}\nSQL:"
     with torch.no_grad():
         output = model.generate(
             **inputs,
+            max_new_tokens=120,
+            temperature=0.1,
+            do_sample=False,
             pad_token_id=tokenizer.eos_token_id,
         )
     return result
 # ─────────────────────────
+# FastAPI Routes
 # ─────────────────────────
+class Query(BaseModel):
+    text: str
 @app.get("/")
 def root():
+    return {"status": "API running"}
 @app.post("/generate")
 def generate(query: Query):
+    return {"result": generate_sql(query.text)}
+# ─────────────────────────
+# Gradio UI (for testing)
+# ─────────────────────────
+def launch_gradio():
+    demo = gr.Interface(
+        fn=generate_sql,
+        inputs=gr.Textbox(lines=3, label="SQL Question"),
+        outputs=gr.Textbox(lines=6, label="Generated SQL"),
+        title="SQL Generator Test UI"
+    )
+    demo.launch(server_name="0.0.0.0", server_port=7861)
+# Run Gradio in parallel thread
+threading.Thread(target=launch_gradio).start()