Spaces:

ResearchEngineering
/

AGI

Sleeping

App Files Files Community

AGI

Commit History

fix exceptions

dc32982

Dmitry Beresnev commited on 23 days ago

fix error format wrapping now applies to /v1/chat/completions and generation stats

470e737

Dmitry Beresnev commited on 28 days ago

change timeouts

2c31416

Dmitry Beresnev commited on 28 days ago

add token generation speed to ui

e8080f5

Dmitry Beresnev commited on 28 days ago

fix request parsing

3634ca6

Dmitry Beresnev commited on 28 days ago

Log detailed error bodies for UI failures

7caa6ba

Dmitry Beresnev commited on 28 days ago

Fix 400 for llama.cpp web UI completion requests

677456b

Dmitry Beresnev commited on 28 days ago

Fix web UI chat by adding buffered SSE fallback

6379bd0

Dmitry Beresnev commited on 28 days ago

Fix Docker build for modular llm-manager

58d70b1

Dmitry Beresnev commited on 28 days ago

fix description

952d357

Dmitry Beresnev commited on 28 days ago

fix build bugs

acdc6c1

Dmitry Beresnev commited on 28 days ago

fix readme file

fe156b2

Dmitry Beresnev commited on 29 days ago

add new architectural diagram to readme file

a51a89f

Dmitry Beresnev commited on 29 days ago

Refactor the C++ LLM manager into modular components, moves Python modules under python/, and keeps the current control-plane behavior intact. The C++ server now has clearer separation for config, model lifecycle, runtime services, request parsing, HTTP helpers, and server routing, while Docker build/runtime paths were updated to compile multiple C++ files and load Python code from the new package folder

332826f

Dmitry Beresnev commited on 29 days ago

add auth, token policy, queue scheduler, and cancel flow, etc

d9ce859

Dmitry Beresnev commited on 29 days ago

add new endpoint to cancel all processing prompts

8ef326a

Dmitry Beresnev commited on Mar 14

add new build profile

a97386f

Dmitry Beresnev commited on Mar 8

fix encoding

d211568

Dmitry Beresnev commited on Mar 8

fix model config

057edf0

Dmitry Beresnev commited on Mar 8

fix proxied response in llm manager

53e9f39

Dmitry Beresnev commited on Mar 7

fix routing in llm manager

a4ee76d

Dmitry Beresnev commited on Mar 7

add cpp server

fc0860f

Dmitry Beresnev commited on Mar 7

change llm model

f41621b

Dmitry Beresnev commited on Mar 6

change llm model

4f2dffc

Dmitry Beresnev commited on Mar 6

change model to Qwen2.5-Math-7B-Instruct-GGUF

cca3c7b

Dmitry Beresnev commited on Mar 6

change llm model to qwen2 math

fe7089d

Dmitry Beresnev commited on Mar 6

change llm model to mistral

97d9520

Dmitry Beresnev commited on Mar 6