Spaces:

Elysiadev11
/

proxyollma

Sleeping

aaxaxax commited on 24 days ago

Commit

19e969a

1 Parent(s): cf504ff

Revert - use best keys by success count

Files changed (1) hide show

app.py CHANGED Viewed

@@ -3,7 +3,6 @@ import httpx
 from fastapi import FastAPI, Request
 from fastapi.responses import JSONResponse, Response
 import time
-import random
 app = FastAPI()
@@ -29,8 +28,10 @@ def root():
     return {"status": "ok", "keys_loaded": len(OLLAMA_KEYS), "healthy": len(healthy),
             "keys_status": {v["prefix"]: {"s": v["success"], "h": v["healthy"]} for v in key_status.values()}}
-def get_healthy_keys():
-    return [k for k, v in key_status.items() if v["healthy"]]
 @app.post("/v1/chat/completions")
 async def chat(req: Request):
@@ -41,13 +42,11 @@ async def chat(req: Request):
     body = await req.json()
     model = body.get("model", "?")
-    healthy = get_healthy_keys()
-    if not healthy:
         for v in key_status.values(): v["healthy"] = True
-        healthy = OLLAMA_KEYS[:2]
-    # RANDOMLY pick 2 keys
-    selected = random.sample(healthy, min(2, len(healthy)))
     log(f"REQ: {model} -> {[key_status[k]['prefix'] for k in selected]}")
     for key in selected:
@@ -75,7 +74,7 @@ def models(req: Request):
     auth_key = req.headers.get("Authorization", "").replace("Bearer ", "")
     if auth_key != MASTER_API_KEY:
         return JSONResponse({"error": "Unauthorized"}, status_code=401)
-    for key in get_healthy_keys()[:2]:
         try:
             resp = httpx.get(f"{BASE_URL}/v1/models", headers={"Authorization": f"Bearer {key}"}, timeout=10)
             if resp.status_code == 200:

 from fastapi import FastAPI, Request
 from fastapi.responses import JSONResponse, Response
 import time
 app = FastAPI()
     return {"status": "ok", "keys_loaded": len(OLLAMA_KEYS), "healthy": len(healthy),
             "keys_status": {v["prefix"]: {"s": v["success"], "h": v["healthy"]} for v in key_status.values()}}
+def get_best_keys(max_failures=2, limit=2):
+    """Get best healthy keys sorted by fewest failures"""
+    healthy = sorted([(k, v) for k, v in key_status.items() if v["healthy"]], key=lambda x: x[1]["success"])
+    return [k for k, v in healthy[:limit]]
 @app.post("/v1/chat/completions")
 async def chat(req: Request):
     body = await req.json()
     model = body.get("model", "?")
+    selected = get_best_keys(max_failures=2, limit=2)
+    if not selected:
         for v in key_status.values(): v["healthy"] = True
+        selected = OLLAMA_KEYS[:2]
     log(f"REQ: {model} -> {[key_status[k]['prefix'] for k in selected]}")
     for key in selected:
     auth_key = req.headers.get("Authorization", "").replace("Bearer ", "")
     if auth_key != MASTER_API_KEY:
         return JSONResponse({"error": "Unauthorized"}, status_code=401)
+    for key in get_best_keys(limit=2):
         try:
             resp = httpx.get(f"{BASE_URL}/v1/models", headers={"Authorization": f"Bearer {key}"}, timeout=10)
             if resp.status_code == 200: