Spaces:

MISSAOUI
/

Shopvite-Fastapi

Sleeping

App Files Files Community

msi commited on 21 days ago

Commit

b4470c3

1 Parent(s): 6324c96

Add application file

Browse files

Files changed (7) hide show

.gitignore +1 -0
Dockerfile +31 -0
faiss_index/index.faiss +0 -0
faiss_index/index.pkl +3 -0
main.py +169 -0
prompt_engineering.py +111 -0
requirements.txt +21 -0

.gitignore ADDED Viewed

	@@ -0,0 +1 @@


1	+ .env

Dockerfile ADDED Viewed

	@@ -0,0 +1,31 @@

+FROM python:3.10-slim
+# ── Variables d'environnement ─────────────────────────────
+ENV PYTHONDONTWRITEBYTECODE=1
+ENV PYTHONUNBUFFERED=1
+# ── Dépendances système (FAISS + torch + build) ───────────
+RUN apt-get update && apt-get install -y \
+    build-essential \
+    git \
+    curl \
+    libgomp1 \
+    && rm -rf /var/lib/apt/lists/*
+# ── Dossier de travail ─────────────────────────────────────
+WORKDIR /app
+# ── Copier les fichiers du projet ──────────────────────────
+COPY . /app
+# ── Installer pip + dépendances Python ─────────────────────
+RUN pip install --upgrade pip
+# Si tu as requirements.txt
+RUN pip install --no-cache-dir -r requirements.txt
+# ── Port utilisé par Hugging Face Spaces ───────────────────
+EXPOSE 7860
+# ── Lancer l’API FastAPI ───────────────────────────────────
+CMD ["uvicorn", "main:app", "--host", "0.0.0.0", "--port", "7860"]

faiss_index/index.faiss ADDED Viewed

Binary file (26.2 kB). View file

faiss_index/index.pkl ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:66a46a836820cb60788f167a000dde60b3eea93addc8ba94c56bd5c5c0163f9a
+size 12061

main.py ADDED Viewed

	@@ -0,0 +1,169 @@

+import os
+from fastapi import FastAPI, HTTPException
+from pydantic import BaseModel
+from contextlib import asynccontextmanager
+from langchain_community.vectorstores import FAISS
+from langchain_huggingface import HuggingFaceEmbeddings
+from langchain_openai import ChatOpenAI
+from langchain_core.runnables import RunnablePassthrough, RunnableLambda
+from langchain_core.output_parsers import StrOutputParser
+import os
+from dotenv import load_dotenv
+from prompt_engineering import build_prompt
+# ── État global ───────────────────────────────────────────────────────────────
+rag_chain = None
+retriever = None
+load_dotenv()  # ← charge le fichier .env
+# ── Helper format docs ────────────────────────────────────────────────────────
+def format_docs(docs) -> str:
+    """Convertit les documents récupérés en texte pour le prompt."""
+    return "\n\n".join(
+        f"[Source: {os.path.basename(doc.metadata.get('source', 'Inconnue'))}]\n{doc.page_content}"
+        for doc in docs
+    )
+def extract_sources(docs) -> list[str]:
+    """Formate les sources depuis les métadonnées des documents."""
+    sources = []
+    seen = set()
+    for doc in docs:
+        source = doc.metadata.get("source", "Inconnue")
+        page   = doc.metadata.get("page")
+        label  = (
+            f"{os.path.basename(source)}, page {page + 1}"
+            if page is not None
+            else os.path.basename(source)
+        )
+        if label not in seen:
+            sources.append(label)
+            seen.add(label)
+    return sources
+def get_confidence(docs_with_scores: list) -> str:
+    """Calcule le niveau de confiance selon les scores FAISS (distance L2)."""
+    if not docs_with_scores:
+        return "low"
+    avg_score = sum(s for _, s in docs_with_scores) / len(docs_with_scores)
+    if avg_score < 0.4:
+        return "high"
+    elif avg_score < 0.8:
+        return "medium"
+    return "low"
+# ── Chargement au démarrage ───────────────────────────────────────────────────
+@asynccontextmanager
+async def lifespan(app: FastAPI):
+    global rag_chain, retriever
+    embedding = HuggingFaceEmbeddings(
+        model_name="sentence-transformers/all-MiniLM-L6-v2",
+        model_kwargs={"device": "cpu"},
+        encode_kwargs={"normalize_embeddings": True}
+    )
+    vectorstore = FAISS.load_local(
+        "faiss_index",
+        embeddings=embedding,
+        allow_dangerous_deserialization=True
+    )
+    llm = ChatOpenAI(
+    base_url="https://api.mistral.ai/v1",
+    api_key=os.getenv("MISTRAL_API_KEY"),
+    model_name="mistral-medium"
+)
+    retriever = vectorstore.as_retriever(search_kwargs={"k": 3})
+    # ✅ FIX : retriever | format_docs (via RunnableLambda) pour convertir les
+    #          documents en texte avant de les injecter dans le prompt
+    rag_chain = (
+        {
+            "context": retriever | RunnableLambda(format_docs),
+            "question": RunnablePassthrough()
+        }
+        | build_prompt()
+        | llm
+        | StrOutputParser()
+    )
+    print("✅ RAG chain chargée et prête.")
+    yield
+    print("🛑 Arrêt de l'API.")
+# ── Application FastAPI ───────────────────────────────────────────────────────
+app = FastAPI(
+    title="ShopVite RAG API",
+    version="1.0.0",
+    lifespan=lifespan
+)
+# ── Schémas ───────────────────────────────────────────────────────────────────
+class AskRequest(BaseModel):
+    question: str
+class AskResponse(BaseModel):
+    answer: str
+    sources: list[str]
+    confidence: str  # "high" | "medium" | "low" | "out_of_context"
+# ── Routes ────────────────────────────────────────────────────────────────────
+@app.get("/health")
+def health():
+    if rag_chain is None:
+        raise HTTPException(status_code=503, detail="RAG chain non initialisée.")
+    return {
+        "status": "ok",
+        "model": "mistral-medium",
+        "vectorstore": "faiss_index"
+    }
+@app.post("/ask", response_model=AskResponse)
+def ask(body: AskRequest):
+    question = body.question.strip()
+    if not question:
+        raise HTTPException(status_code=400, detail="La question ne peut pas être vide.")
+    if len(question) > 500:
+        raise HTTPException(status_code=400, detail="Question trop longue (max 500 caractères).")
+    # Récupérer les docs et leurs scores FAISS
+    docs_with_scores = retriever.vectorstore.similarity_search_with_score(question, k=3)
+    docs    = [doc for doc, _ in docs_with_scores]
+    sources = extract_sources(docs)
+    # Générer la réponse via la chaîne RAG
+    try:
+        answer = rag_chain.invoke(question)
+    except Exception as e:
+        raise HTTPException(status_code=500, detail=f"Erreur LLM : {str(e)}")
+    # Détecter question hors contexte
+    if "HORS_CONTEXTE" in answer:
+        return AskResponse(
+            answer=(
+                "Je suis désolé, cette information ne figure pas dans mes documents. "
+                "Pour toute question spécifique, contactez notre support : "
+                "support@shopvite.fr | 01 23 45 67 89 (lun-ven, 9h-18h)."
+            ),
+            sources=[],
+            confidence="out_of_context"
+        )
+    confidence = get_confidence(docs_with_scores)
+    return AskResponse(
+        answer=answer,
+        sources=sources,
+        confidence=confidence
+    )

prompt_engineering.py ADDED Viewed

	@@ -0,0 +1,111 @@

+from langchain_core.prompts import PromptTemplate
+template = """
+################################################################################
+# IDENTITÉ
+################################################################################
+Tu es ShopBot, l'assistant virtuel officiel de ShopVite — spécialiste en
+électronique grand public comme les smartphones, ordinateurs portables et accessoires. Tu incarnes la voix professionnelle et bienveillante
+de ShopVite : précis, concis, toujours utile, jamais inventif.
+Langue : français uniquement.
+Ton    : professionnel, chaleureux, direct. Jamais familier, jamais condescendant.
+Taille : 3 à 6 phrases maximum par réponse.
+################################################################################
+# RÈGLES ABSOLUES
+################################################################################
+R1. Tu réponds UNIQUEMENT à partir du CONTEXTE fourni ci-dessous.
+R2. Si l'information n'est pas dans le contexte applique le REFUS POLI.
+R3. Chaque réponse doit citer la source entre crochets : [Source : nom_fichier].
+R4. Tu n'inventes jamais de chiffre, de délai, de politique ou de procédure.
+################################################################################
+# MÉTHODE DE RAISONNEMENT (Chain-of-Thought — interne, non affiché)
+################################################################################
+Avant de rédiger ta réponse, raisonne silencieusement en 3 étapes :
+  ETAPE 1 — PERTINENCE
+    La question porte-t-elle sur les produits, commandes, livraisons,
+    retours, garanties ou données personnelles de ShopVite ?
+    Si NON, passe directement au REFUS POLI.
+  ETAPE 2 — EXTRACTION
+    Quels passages du contexte répondent précisément à la question ?
+    Identifie la source (nom de fichier) de chaque passage retenu.
+  ETAPE 3 — RÉDACTION
+    Formule une réponse courte, claire, en français.
+    Termine par la citation de source : [Source : nom_fichier].
+Ce raisonnement est INTERNE : n'affiche pas les étapes dans ta réponse.
+################################################################################
+# FEW-SHOT EXAMPLES
+################################################################################
+--- EXEMPLE 1 : question dans le scope ---
+Question : Quel est le délai de rétractation ?
+Réponse  : Conformément à nos conditions générales, vous disposez de 30 jours
+           à compter de la réception de votre commande pour exercer votre droit
+           de rétractation, sans justification requise.
+           [Source : conditions_generales.txt]
+--- EXEMPLE 2 : question dans le scope avec plusieurs sources ---
+Question : Comment retourner un produit défectueux ?
+Réponse  : Pour retourner un produit défectueux, contactez notre service client
+           sous 48 h avec votre numéro de commande et une photo du défaut.
+           Un bon de retour prépayé vous sera envoyé par e-mail sous 24 h.
+           Les remboursements sont effectués sous 5 à 7 jours ouvrés.
+           [Source : politique_retours.pdf, section 3] [Source : faq_sav.txt]
+--- EXEMPLE 3 : question hors scope ---
+Question : Pouvez-vous me recommander une recette de cuisine ?
+Réponse  : Je suis spécialisé dans l'assistance aux clients ShopVite et je ne
+           suis pas en mesure de répondre à cette question.
+           Pour toute question relative à vos commandes, produits ou livraisons,
+           je reste à votre disposition.
+           Pour d'autres besoins, contactez notre support : support@shopvite.fr.
+--- EXEMPLE 4 : information absente du contexte ---
+Question : Livrez-vous en Martinique ?
+Réponse  : Je n'ai pas trouvé d'information sur les livraisons en Martinique
+           dans mes documents actuels.
+           Contactez notre service client a support@shopvite.fr pour une
+           réponse précise.
+################################################################################
+# REFUS POLI
+################################################################################
+Si la question est hors scope ou absente du contexte, répondre exactement :
+Je suis ShopBot, assistant dédié aux questions ShopVite (commandes, produits,
+livraisons, retours, garanties). Je ne suis pas en mesure de répondre a cette
+question.
+Pour toute assistance, notre équipe est disponible :
+- Email : support@shopvite.fr
+- Horaires : Lun-Ven, 9h-18h
+HORS_CONTEXTE
+################################################################################
+# CONTEXTE (documents récupérés)
+################################################################################
+{context}
+################################################################################
+# QUESTION CLIENT
+################################################################################
+{question}
+################################################################################
+# RÉPONSE DE SHOPBOT
+################################################################################
+"""
+def build_prompt() -> PromptTemplate:
+    return PromptTemplate(
+        template=template,
+        input_variables=["context", "question"]
+    )

requirements.txt ADDED Viewed

	@@ -0,0 +1,21 @@

+fastapi==0.115.0
+uvicorn[standard]==0.30.6
+pydantic==2.8.2
+python-dotenv==1.0.1
+langchain==0.2.14
+langchain-core==0.2.35
+langchain-community==0.2.12
+langchain-huggingface==0.0.3
+langchain-openai==0.1.23
+faiss-cpu==1.8.0.post1
+sentence-transformers==3.0.1
+huggingface-hub==0.24.6
+transformers==4.44.2
+torch==2.3.1
+openai==1.40.6
+tiktoken==0.7.0