senatus-dev / CHANGES.md
senatus123's picture
Upload CHANGES.md with huggingface_hub
0c52d37 verified
|
raw
history blame
1.8 kB

Izmene u kodu

Problem koji je rešen

Originalni problem: Space je vraćao samo kratke fragmente teksta umesto kompletnih članaka zakona.

Uzrok: Metoda search_semantic u doc_searcher_v2.py je vraćala samo skorove iz reranker-a, bez kompletnog payload-a iz Qdrant baze.

Izmene

1. doc_searcher_v2.py - Metoda search_semantic

Pre:

  • Vraćala je samo scores (lista skorova)
  • Gubili su se svi podaci iz payload-a

Posle:

  • Vraća listu dict-ova sa kompletnim podacima:
    {
        "score": float,      # Rerank skor
        "id": str,           # ID iz Qdrant-a
        "text": str,         # Tekst dokumenta
        "payload": dict      # Kompletan payload sa svim podacima
    }
    
  • Mapira rerank skorove sa originalnim hit-ovima iz Qdrant-a
  • Vraća top 10 rezultata sa kompletnim informacijama

2. reranker.py - Model

Pre:

  • Koristio Qwen/Qwen3-Reranker-4B (zahteva ~16GB RAM)

Posle:

  • Koristi Qwen/Qwen3-Reranker-0.6B (zahteva ~2GB RAM)
  • Manje memorije, brže učitavanje

Kako testirati lokalno

  1. Instalirajte zavisnosti:

    pip install -r requirements.txt
    
  2. Kreirajte .env fajl:

    cp .env.example .env
    # Popunite sa vašim vrednostima
    
  3. Pokrenite test:

    python test_local.py
    

Kako deploy-ovati na Space

  1. Commit-ujte izmene:

    git add .
    git commit -m "Ispravka: vraćanje kompletnih podataka umesto samo skorova"
    
  2. Push na Hugging Face:

    git push
    
  3. Space će se automatski rebuild-ovati

Rezultat

Sada API vraća:

  • ✅ Kompletan tekst članka zakona
  • ✅ Svi podaci iz payload-a (broj člana, naziv zakona, itd.)
  • ✅ Rerank skor za relevantnost
  • ✅ ID dokumenta iz Qdrant-a