Spaces:

makhtar7186
/

telecom_api

Sleeping

App Files Files Community

makhtar7186 commited on May 29, 2025

Commit

2585ab6

verified ·

1 Parent(s): 84dcb63

Upload 4 files

Browse files

Files changed (4) hide show

.env +4 -0
app.py +17 -0
rag_core.py +76 -0
requirements.txt +19 -0

.env ADDED Viewed

	@@ -0,0 +1,4 @@

+groqapi_key = "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"
+TELEGRAM_BOT_TOKEN="7553452749:AAEnZDN2-ksgc1k2BWiVeuhPPu4oZLsjFhw"
+RAG_API_URL=http://localhost:8000/ask

app.py ADDED Viewed

	@@ -0,0 +1,17 @@

+from fastapi import FastAPI, HTTPException
+from pydantic import BaseModel
+import asyncio
+from rag_core import rag_chain
+app = FastAPI(title="RAG API")
+class QuestionRequest(BaseModel):
+    question: str
+@app.post("/ask")
+async def ask_question(payload: QuestionRequest):
+    try:
+        result = await asyncio.to_thread(rag_chain.invoke, payload.question)
+        return {"answer": result}
+    except Exception as e:
+        raise HTTPException(status_code=500, detail=str(e))

rag_core.py ADDED Viewed

	@@ -0,0 +1,76 @@

+# rag_core.py
+from langchain_community.embeddings.fastembed import FastEmbedEmbeddings
+from langchain_chroma import Chroma
+from langchain_core.prompts import ChatPromptTemplate
+from langchain_core.runnables import RunnablePassthrough
+from langchain_core.output_parsers import StrOutputParser
+from langchain_groq import ChatGroq
+from sentence_transformers import SentenceTransformer
+from sklearn.metrics.pairwise import cosine_similarity
+from dotenv import load_dotenv
+import os
+load_dotenv()
+# Configuration
+persist_directory = "./chroma_storage"
+embedding_model = FastEmbedEmbeddings(model_name="BAAI/bge-base-en-v1.5")
+vectorstore = Chroma(
+    embedding_function=embedding_model,
+    persist_directory=persist_directory
+)
+retriever = vectorstore.as_retriever(search_kwargs={"k": 2})
+chat_model = ChatGroq(
+    temperature=0.3,
+    model_name="llama-3.1-8b-instant",
+    api_key=os.getenv("groqapi_key"),
+)
+# Prompt RAG
+rag_template = """\
+Use the following context to answer the user's query. If you cannot answer, please respond with 'I don't know'.
+User's Query:
+{question}
+Context:
+{context}
+"""
+rag_prompt = ChatPromptTemplate.from_template(rag_template)
+# SentenceTransformer pour la similarité (si besoin)
+similarity_model = SentenceTransformer("all-MiniLM-L6-v2")
+def calculate_similarity(question, document):
+    q_emb = similarity_model.encode(question, convert_to_tensor=True).cpu().detach().numpy()
+    d_emb = similarity_model.encode(document, convert_to_tensor=True).cpu().detach().numpy()
+    return cosine_similarity([q_emb], [d_emb])[0][0]
+# Génération de sous-requêtes
+def generate_queries(query: str, llm, num_queries: int = 4):
+    query_gen_str = """\
+You are a helpful assistant that generates multiple search queries based on a \
+single input query. Generate {num_queries} search queries, one on each line, \
+related to the following input query:
+Query: {query}
+Queries:
+"""
+    query_prompt = ChatPromptTemplate.from_template(query_gen_str)
+    formatted_prompt = query_prompt.format(num_queries=num_queries, query=query)
+    response = llm.predict(formatted_prompt)
+    return response.strip().splitlines()
+# Récupération de contexte enrichi
+def get_context(query):
+    sub_queries = generate_queries(query, chat_model)
+    chunks = [retriever.invoke(q) for q in sub_queries]
+    return "\n".join(map(str, chunks))
+# La chaîne complète
+rag_chain = (
+    {"context": get_context, "question": RunnablePassthrough()}
+    | rag_prompt
+    | chat_model
+    | StrOutputParser()
+)

requirements.txt ADDED Viewed

	@@ -0,0 +1,19 @@

+torch
+langchain
+chromadb
+transformers
+groq
+sentence_transformers
+langchain-community
+langchain-core
+transformers
+faiss-cpu
+sentence-transformers
+fastembed
+langchain_experimental
+langchain_openai
+requests
+langchain_groq
+langchain_chroma
+fastapi
+pydantic