Spaces:
Sleeping
Sleeping
Izmene u kodu
Problem koji je rešen
Originalni problem: Space je vraćao samo kratke fragmente teksta umesto kompletnih članaka zakona.
Uzrok: Metoda search_semantic u doc_searcher_v2.py je vraćala samo skorove iz reranker-a, bez kompletnog payload-a iz Qdrant baze.
Izmene
1. doc_searcher_v2.py - Metoda search_semantic
Pre:
- Vraćala je samo
scores(lista skorova) - Gubili su se svi podaci iz payload-a
Posle:
- Vraća listu dict-ova sa kompletnim podacima:
{ "score": float, # Rerank skor "id": str, # ID iz Qdrant-a "text": str, # Tekst dokumenta "payload": dict # Kompletan payload sa svim podacima } - Mapira rerank skorove sa originalnim hit-ovima iz Qdrant-a
- Vraća top 10 rezultata sa kompletnim informacijama
2. reranker.py - Model
Pre:
- Koristio
Qwen/Qwen3-Reranker-4B(zahteva ~16GB RAM)
Posle:
- Koristi
Qwen/Qwen3-Reranker-0.6B(zahteva ~2GB RAM) - Manje memorije, brže učitavanje
Kako testirati lokalno
Instalirajte zavisnosti:
pip install -r requirements.txtKreirajte .env fajl:
cp .env.example .env # Popunite sa vašim vrednostimaPokrenite test:
python test_local.py
Kako deploy-ovati na Space
Commit-ujte izmene:
git add . git commit -m "Ispravka: vraćanje kompletnih podataka umesto samo skorova"Push na Hugging Face:
git pushSpace će se automatski rebuild-ovati
Rezultat
Sada API vraća:
- ✅ Kompletan tekst članka zakona
- ✅ Svi podaci iz payload-a (broj člana, naziv zakona, itd.)
- ✅ Rerank skor za relevantnost
- ✅ ID dokumenta iz Qdrant-a