Spaces:

AnwinMJ
/

rag

Sleeping

App Files Files Community

rag / app.py

AnwinMJ

Update app.py

893a06e verified 10 months ago

raw

history blame contribute delete

3.52 kB

	import os
	import gradio as gr
	import tempfile
	from typing import List, Optional
	import shutil
	from langchain_community.embeddings import HuggingFaceEmbeddings
	from langchain_community.vectorstores import Chroma
	from langchain.text_splitter import RecursiveCharacterTextSplitter
	from langchain.document_loaders import PyPDFLoader
	from langchain.chains import RetrievalQA
	from langchain.llms.base import LLM
	from groq import Groq

	# ---- Custom GroqLLM class using LangChain LLM base ----
	class GroqLLM(LLM):
	model: str = "llama3-8b-8192"
	api_key: str = os.environ.get("GROQ_API_KEY") # Load from HF secrets
	temperature: float = 0.7

	def _call(self, prompt: str, stop: Optional[List[str]] = None) -> str:
	client = Groq(api_key=self.api_key)
	messages = [
	{"role": "system", "content": "You are a helpful assistant."},
	{"role": "user", "content": prompt}
	]
	response = client.chat.completions.create(
	model=self.model,
	messages=messages,
	temperature=self.temperature,
	)
	return response.choices[0].message.content

	@property
	def _llm_type(self) -> str:
	return "groq-llm"

	# Global cache for vectorstore
	rag_context = {"retriever": None}

	# ---- Step 1: Upload & Embed PDF ----
	def process_pdf(file):
	if file is None:
	return "❌ Please upload a PDF."

	# Save uploaded file to a real file path
	with tempfile.TemporaryDirectory() as temp_dir:
	# Gradio provides file path directly via file.name
	temp_pdf_path = os.path.join(temp_dir, "uploaded.pdf")
	shutil.copy(file.name, temp_pdf_path)

	# Load and split PDF
	try:
	loader = PyPDFLoader(temp_pdf_path)
	documents = loader.load()

	text_splitter = RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=50)
	chunks = text_splitter.split_documents(documents)

	# Create embeddings
	embedding = HuggingFaceEmbeddings(model_name="all-MiniLM-L6-v2")
	vectorstore = Chroma.from_documents(chunks, embedding, persist_directory=temp_dir)
	vectorstore.persist()

	rag_context["retriever"] = vectorstore.as_retriever()
	return "✅ PDF processed and ready. Ask your questions!"

	except Exception as e:
	return f"❌ Failed to load PDF: {e}"

	# ---- Step 2: Ask questions to the RAG chain ----
	def ask_question(query):
	retriever = rag_context.get("retriever")
	if retriever is None:
	return "❌ Please upload and process a PDF first."

	llm = GroqLLM()
	qa_chain = RetrievalQA.from_chain_type(
	llm=llm,
	retriever=retriever,
	return_source_documents=True
	)

	result = qa_chain({"query": query})
	answer = result["result"]
	return f"### Answer:\n{answer}"

	# ---- Gradio UI ----
	with gr.Blocks() as demo:
	gr.Markdown("# 📚 RAG Chatbot with Groq & LangChain\nUpload a PDF, then ask questions about it!")

	with gr.Row():
	pdf_input = gr.File(label="Upload PDF", file_types=[".pdf"])
	upload_btn = gr.Button("Process PDF")
	upload_status = gr.Textbox(label="Status", interactive=False)

	upload_btn.click(process_pdf, inputs=pdf_input, outputs=upload_status)

	query_input = gr.Textbox(label="Ask a question")
	ask_btn = gr.Button("Get Answer")
	answer_output = gr.Markdown()

	ask_btn.click(ask_question, inputs=query_input, outputs=answer_output)

	demo.launch()