Spaces:

bahi-bh
/

Gf4test

Sleeping

App Files Files Community

bahi-bh commited on 9 days ago

Commit

0f4cc05

verified ·

1 Parent(s): 01b4702

Update main.py

Browse files

Files changed (1) hide show

main.py +192 -222

main.py CHANGED Viewed

@@ -1,9 +1,12 @@
 import os
 import json
 import time
 import asyncio
 import logging
-import inspect
 from fastapi import FastAPI, HTTPException, Header
 from fastapi.responses import StreamingResponse
@@ -11,25 +14,10 @@ from fastapi.middleware.cors import CORSMiddleware
 from pydantic import BaseModel
 from typing import List, Optional
-import g4f
-import g4f.Provider as Provider
-import litellm
-# ----------------------------
-# Logging
-# ----------------------------
 logging.basicConfig(level=logging.INFO)
 logger=logging.getLogger(__name__)
-# ----------------------------
-# App
-# ----------------------------
-app=FastAPI(
-    title="AI Gateway",
-    version="2.0"
-)
 app.add_middleware(
     CORSMiddleware,
@@ -40,48 +28,36 @@ app.add_middleware(
 API_KEY=os.getenv(
     "API_KEY",
-    "your_secret"
 )
-DEFAULT_MODEL=os.getenv(
-    "DEFAULT_MODEL",
-    "groq/llama-3.3-70b-versatile"
-)
-# ----------------------------
 # Models
-# ----------------------------
-class Message(BaseModel):
     role:str
     content:str
 class ChatRequest(BaseModel):
-    model:str=DEFAULT_MODEL
-    messages:List[Message]
     stream:bool=False
     provider:Optional[str]=None
-# ----------------------------
-# Auth
-# ----------------------------
 def verify(auth):
-    if not auth:
-        raise HTTPException(
-            status_code=401,
-            detail="Missing token"
-        )
-    if auth != f"Bearer {API_KEY}":
         raise HTTPException(
             status_code=401,
@@ -89,30 +65,41 @@ def verify(auth):
         )
-# ----------------------------
-# g4f provider discovery
-# ----------------------------
 SKIP={
 "BaseProvider",
 "RetryProvider",
-"AsyncProvider"
 }
 def collect_models(cls):
-    result=[]
-    for attr in [
         "default_model",
         "models",
-        "model"
-    ]:
         v=getattr(
             cls,
@@ -125,137 +112,151 @@ def collect_models(cls):
         if isinstance(v,str):
-            result.append(v)
-        elif isinstance(
-            v,
-            (list,tuple)
-        ):
-            result.extend(
                 [str(x) for x in v]
             )
-    return list(
-        set(result)
-    )
-# ----------------------------
-# health
-# ----------------------------
-@app.get("/")
-async def root():
-    return {
-        "status":"online",
-        "default":DEFAULT_MODEL
-    }
-# ----------------------------
-# models
-# ----------------------------
-@app.get("/v1/models")
-async def models(
-authorization:str=Header(None)
-):
-    verify(authorization)
-    data=[]
-    try:
-        # LiteLLM models
-        ll_models=[
-            "groq/llama-3.3-70b-versatile",
-            "groq/llama-3.1-8b-instant",
-            "openrouter/qwen/qwen-2.5-72b-instruct",
-            "huggingface/Qwen/Qwen2.5-72B-Instruct",
-            "openrouter/deepseek/deepseek-chat",
-            "openai/gpt-4o",
-            "openai/gpt-4o-mini"
-        ]
-        for m in ll_models:
-            data.append({
-                "id":m,
-                "object":"model",
-                "owned_by":"litellm"
-            })
-        # g4f dynamic providers
-        for name in dir(Provider):
-            if name.startswith("_"):
-                continue
-            if name in SKIP:
-                continue
-            cls=getattr(
-                Provider,
-                name
-            )
-            if not inspect.isclass(cls):
-                continue
-            models=collect_models(
-                cls
-            )
-            for m in models:
-                data.append({
-                    "id":m,
-                    "object":"model",
-                    "owned_by":name
-                })
-    except Exception as e:
-        logger.error(e)
-    return {
-        "object":"list",
-        "data":data
     }
-# ----------------------------
-# Chat
-# ----------------------------
 @app.post("/v1/chat/completions")
@@ -284,23 +285,42 @@ authorization:str=Header(None)
         for m in body.messages
     ]
-    # =====================
-    # Streaming
-    # =====================
     if body.stream:
-        async def generate():
             try:
-                # LiteLLM first
-                response=litellm.completion(
                     model=body.model,
                     messages=messages,
                     stream=True
@@ -309,132 +329,75 @@ authorization:str=Header(None)
                 for chunk in response:
-                    content=""
-                    try:
-                        content=chunk.choices[0].delta.content
-                    except:
-                        pass
-                    if content:
-                        payload={
-                            "id":"chatcmpl",
-                            "object":"chat.completion.chunk",
-                            "created":int(time.time()),
-                            "model":body.model,
-                            "choices":[{
-                                "delta":{
-                                    "content":content
-                                },
-                                "index":0
-                            }]
-                        }
-                        yield f"data:{json.dumps(payload)}\n\n"
-            except:
-                logger.info(
-                    "Fallback g4f"
-                )
-                response=g4f.ChatCompletion.create(
-                    model=body.model,
-                    messages=messages,
-                    stream=True
-                )
-                for chunk in response:
-                    payload={
                         "choices":[{
                             "delta":{
-                                "content":str(chunk)
                             }
                         }]
                     }
                     yield f"data:{json.dumps(payload)}\n\n"
-            yield "data:[DONE]\n\n"
-        return StreamingResponse(
-            generate(),
-            media_type="text/event-stream"
-        )
-    # =====================
-    # Normal
-    # =====================
-    try:
-        response=await asyncio.to_thread(
-            litellm.completion,
-            model=body.model,
-            messages=messages
         )
-        content=response.choices[0].message.content
-    except Exception:
-        logger.info(
-            "Using g4f fallback"
-        )
-        content=await asyncio.to_thread(
             g4f.ChatCompletion.create,
             model=body.model,
-            messages=messages
-        )
-    return {
-        "id":"chatcmpl",
-        "object":"chat.completion",
-        "created":int(time.time()),
-        "model":body.model,
-        "choices":[
-            {
                 "index":0,
@@ -442,14 +405,21 @@ authorization:str=Header(None)
                     "role":"assistant",
-                    "content":str(content)
-                },
-                "finish_reason":"stop"
-            }
-        ]
-    }

 import os
 import json
 import time
+import inspect
 import asyncio
 import logging
+import g4f
+import g4f.Provider as Provider
 from fastapi import FastAPI, HTTPException, Header
 from fastapi.responses import StreamingResponse
 from pydantic import BaseModel
 from typing import List, Optional
 logging.basicConfig(level=logging.INFO)
 logger=logging.getLogger(__name__)
+app=FastAPI(title="G4F Dynamic API")
 app.add_middleware(
     CORSMiddleware,
 API_KEY=os.getenv(
     "API_KEY",
+    "secret"
 )
+# ======================
 # Models
+# ======================
+class ChatMessage(BaseModel):
     role:str
     content:str
 class ChatRequest(BaseModel):
+    model:str="gpt-4o"
+    messages:List[ChatMessage]
     stream:bool=False
     provider:Optional[str]=None
+# ======================
+# auth
+# ======================
 def verify(auth):
+    if auth!=f"Bearer {API_KEY}":
         raise HTTPException(
             status_code=401,
         )
+# ======================
+# provider discovery
+# ======================
 SKIP={
 "BaseProvider",
 "RetryProvider",
+"AsyncProvider",
+"IterListProvider",
+"ProviderType",
+"CreateResult"
 }
+PROVIDERS={}
+MODEL_MAP={}
 def collect_models(cls):
+    found=[]
+    attrs=[
         "default_model",
+        "model",
         "models",
+        "text_models",
+        "vision_models"
+    ]
+    for attr in attrs:
         v=getattr(
             cls,
         if isinstance(v,str):
+            found.append(v)
+        elif isinstance(v,(list,tuple,set)):
+            found.extend(
                 [str(x) for x in v]
             )
+        elif isinstance(v,dict):
+            found.extend(
+                list(v.keys())
+            )
+    return list(
+        set(found)
+    )
+def build():
+    global PROVIDERS
+    global MODEL_MAP
+    PROVIDERS={}
+    MODEL_MAP={}
+    for name in dir(Provider):
+        if name.startswith("_"):
+            continue
+        if name in SKIP:
+            continue
+        try:
+            cls=getattr(
+                Provider,
+                name
+            )
+            if not inspect.isclass(cls):
+                continue
+            if not bool(
+                getattr(
+                    cls,
+                    "working",
+                    False
+                )
+            ):
+                continue
+            if bool(
+                getattr(
+                    cls,
+                    "needs_auth",
+                    False
+                )
+            ):
+                continue
+            models=collect_models(
+                cls
+            )
+            if not models:
+                continue
+            PROVIDERS[name]=models
+            for m in models:
+                if m not in MODEL_MAP:
+                    MODEL_MAP[m]=name
+        except:
+            pass
+build()
+# ======================
+# health
+# ======================
+@app.get("/")
+async def health():
+    return{
+        "status":"online",
+        "providers":len(PROVIDERS),
+        "models":len(MODEL_MAP)
+    }
+# ======================
+# models
+# ======================
+@app.get("/v1/models")
+async def models(
+authorization:str=Header(None)
+):
+    verify(
+        authorization
+    )
+    return{
+        "object":"list",
+        "data":[
+            {
+                "id":m,
+                "object":"model",
+                "owned_by":MODEL_MAP[m]
+            }
+            for m in sorted(
+                MODEL_MAP.keys()
+            )
+        ]
     }
+# ======================
+# chat
+# ======================
 @app.post("/v1/chat/completions")
         for m in body.messages
     ]
+    provider=None
+    if body.provider:
+        provider=getattr(
+            Provider,
+            body.provider,
+            None
+        )
+    elif body.model in MODEL_MAP:
+        provider=getattr(
+            Provider,
+            MODEL_MAP[
+                body.model
+            ],
+            None
+        )
+    # ==================
+    # stream
+    # ==================
     if body.stream:
+        def generate():
             try:
+                response=g4f.ChatCompletion.create(
                     model=body.model,
+                    provider=provider,
                     messages=messages,
                     stream=True
                 for chunk in response:
+                    payload={
+                        "id":"chatcmpl",
+                        "object":"chat.completion.chunk",
+                        "created":int(
+                            time.time()
+                        ),
+                        "model":body.model,
                         "choices":[{
                             "delta":{
+                                "content":str(
+                                    chunk
+                                )
                             }
                         }]
                     }
                     yield f"data:{json.dumps(payload)}\n\n"
+                yield "data:[DONE]\n\n"
+            except Exception as e:
+                logger.error(e)
+                yield f"data:{json.dumps({'error':str(e)})}\n\n"
+        return StreamingResponse(
+            generate(),
+            media_type="text/event-stream"
         )
+    try:
+        response=await asyncio.to_thread(
             g4f.ChatCompletion.create,
             model=body.model,
+            provider=provider,
+            messages=messages
+        )
+        return{
+            "id":"chatcmpl",
+            "object":"chat.completion",
+            "created":int(time.time()),
+            "model":body.model,
+            "choices":[{
                 "index":0,
                     "role":"assistant",
+                    "content":str(
+                        response
+                    )
+                }
+            }]
+        }
+    except Exception as e:
+        logger.exception(e)
+        raise HTTPException(
+            status_code=500,
+            detail=str(e)
+        )