Spaces:

knighter75
/

llm-proxy

Sleeping

App Files Files Community

knighter75 commited on Mar 3

Commit

111fd8c

1 Parent(s): 3208e8a

Debug

Browse files

Files changed (2) hide show

Dockerfile +14 -3
app/main.py +26 -11

Dockerfile CHANGED Viewed

@@ -1,10 +1,21 @@
 FROM python:3.11-slim
 WORKDIR /app
-COPY requirements.txt .
-RUN pip install --no-cache-dir -r requirements.txt
-COPY ./app ./app
 CMD ["uvicorn", "app.main:app", "--host", "0.0.0.0", "--port", "7860"]

 FROM python:3.11-slim
+# Отключаем буферизацию Python вывода
+ENV PYTHONUNBUFFERED=1
+# Создаем пользователя с UID 1000
+RUN useradd -m -u 1000 user
+USER user
+ENV PATH="/home/user/.local/bin:$PATH"
 WORKDIR /app
+# Копируем и устанавливаем зависимости
+COPY --chown=user ./requirements.txt requirements.txt
+RUN pip install --no-cache-dir --upgrade -r requirements.txt
+# Копируем остальные файлы
+COPY --chown=user . /app
+# Запускаем приложение
 CMD ["uvicorn", "app.main:app", "--host", "0.0.0.0", "--port", "7860"]

app/main.py CHANGED Viewed

@@ -1,27 +1,31 @@
 import os
-from fastapi import FastAPI, Depends, HTTPException, Header
-from pydantic import BaseModel
 from typing import List, Optional, Dict, Any
 from .auth import verify_api_key
 from .factory import ProviderFactory
 from .models import ChatRequest, ChatResponse
 app = FastAPI(title="LLM API Proxy", version="1.0.0")
 @app.get("/")
 async def root():
     return {"message": "LLM API Proxy is running", "version": "1.0.1"}
 @app.get("/v1/models")
 async def list_models(api_key: str = Depends(verify_api_key)):
     """Возвращает список доступных моделей/провайдеров."""
-    # Это можно вынести в конфиг
     return {
         "models": [
             {"id": "zhipu-flash", "name": "GLM-4.7-Flash", "provider": "zhipu", "type": "free"},
-            # В будущем:
-            # {"id": "openai-gpt3", "name": "GPT-3.5 Turbo", "provider": "openai", "type": "paid"},
         ]
     }
@@ -31,30 +35,41 @@ async def chat_completion(
     api_key: str = Depends(verify_api_key)
 ):
     """Основной эндпоинт для генерации текста."""
     try:
         # 1. Получаем провайдера по имени модели из запроса
         provider = ProviderFactory.get_provider(request.model)
         # 2. Генерируем ответ
         result = await provider.generate(
             messages=[m.dict() for m in request.messages],
             max_tokens=request.max_tokens,
             temperature=request.temperature,
-            model=request.model  # передаем, если провайдер поддерживает несколько моделей
         )
         # 3. Возвращаем в стандартном формате
-        return ChatResponse(
             id=f"chat-{hash(str(request.messages))}",
             choices=[{"message": {"content": result["content"]}}],
             usage={"total_tokens": result.get("total_tokens", 0)},
             model=request.model
         )
     except ValueError as e:
-        # Неизвестная модель
         raise HTTPException(status_code=400, detail=str(e))
     except Exception as e:
-        # Ошибка провайдера
         raise HTTPException(status_code=502, detail=f"Provider error: {str(e)}")
-print(f"App started", flush=True)

 import os
+import sys
+from fastapi import FastAPI, Depends, HTTPException
 from typing import List, Optional, Dict, Any
+# Отключаем буферизацию вывода сразу при старте
+sys.stdout.reconfigure(line_buffering=True)
+print("🚀 Starting application initialization...", flush=True)
 from .auth import verify_api_key
 from .factory import ProviderFactory
 from .models import ChatRequest, ChatResponse
 app = FastAPI(title="LLM API Proxy", version="1.0.0")
+print("✅ FastAPI app created", flush=True)
 @app.get("/")
 async def root():
+    print("🌐 Root endpoint accessed", flush=True)
     return {"message": "LLM API Proxy is running", "version": "1.0.1"}
 @app.get("/v1/models")
 async def list_models(api_key: str = Depends(verify_api_key)):
     """Возвращает список доступных моделей/провайдеров."""
+    print("📋 Models endpoint accessed", flush=True)
     return {
         "models": [
             {"id": "zhipu-flash", "name": "GLM-4.7-Flash", "provider": "zhipu", "type": "free"},
         ]
     }
     api_key: str = Depends(verify_api_key)
 ):
     """Основной эндпоинт для генерации текста."""
+    print(f"💬 Chat completion requested with model: {request.model}", flush=True)
     try:
         # 1. Получаем провайдера по имени модели из запроса
+        print(f"🔍 Getting provider for model: {request.model}", flush=True)
         provider = ProviderFactory.get_provider(request.model)
+        print(f"✅ Provider obtained: {type(provider).__name__}", flush=True)
         # 2. Генерируем ответ
+        print("🔄 Calling provider.generate()...", flush=True)
         result = await provider.generate(
             messages=[m.dict() for m in request.messages],
             max_tokens=request.max_tokens,
             temperature=request.temperature,
+            model=request.model
         )
+        print(f"✅ Generation complete, tokens: {result.get('total_tokens', 0)}", flush=True)
         # 3. Возвращаем в стандартном формате
+        response = ChatResponse(
             id=f"chat-{hash(str(request.messages))}",
             choices=[{"message": {"content": result["content"]}}],
             usage={"total_tokens": result.get("total_tokens", 0)},
             model=request.model
         )
+        print("✅ Response prepared, sending...", flush=True)
+        return response
     except ValueError as e:
+        print(f"❌ ValueError: {e}", flush=True)
         raise HTTPException(status_code=400, detail=str(e))
     except Exception as e:
+        print(f"❌ Exception: {type(e).__name__}: {e}", flush=True)
+        import traceback
+        traceback.print_exc()
         raise HTTPException(status_code=502, detail=f"Provider error: {str(e)}")
+print("🎉 App started successfully!", flush=True)