Spaces:

nothex
/

morpheus-rag

Running

App Files Files Community

nothex commited on 26 days ago

Commit

723ce57

1 Parent(s): 67a6408

fix: deployment readiness — auth, naming, Dockerfile, render config

Browse files

Files changed (13) hide show

Dockerfile +2 -2
backend/api/admin.py +1 -1
backend/api/corpus.py +1 -1
backend/api/ingest.py +1 -1
backend/api/query.py +1 -1
backend/core/build_ml_assets.py +3 -3
backend/core/config.py +1 -1
backend/core/distill_reranker.py +1 -2
backend/core/intent_classifier.py +7 -3
backend/core/tasks.py +1 -5
backend/eval/run_eval.py +1 -1
docs/model_migration_roadmap.md +4 -4
vercel.json +1 -1

Dockerfile CHANGED Viewed

@@ -29,9 +29,9 @@ COPY --chown=user:user . .
 # 7. Pre-build ML assets (downloads models to cache, trains intent classifier)
 ARG PREBUILD_ML_ASSETS=1
-ARG NEXUS_BUILD_ASSETS_MODE=light
 RUN if [ "$PREBUILD_ML_ASSETS" = "1" ]; then \
-  NEXUS_BUILD_ASSETS_MODE=$NEXUS_BUILD_ASSETS_MODE python -m backend.core.build_ml_assets ; \
   else \
   echo "Skipping ML asset pre-build"; \
   fi

 # 7. Pre-build ML assets (downloads models to cache, trains intent classifier)
 ARG PREBUILD_ML_ASSETS=1
+ARG MORPHEUS_BUILD_ASSETS_MODE=light
 RUN if [ "$PREBUILD_ML_ASSETS" = "1" ]; then \
+  MORPHEUS_BUILD_ASSETS_MODE=$MORPHEUS_BUILD_ASSETS_MODE python -m backend.core.build_ml_assets ; \
   else \
   echo "Skipping ML asset pre-build"; \
   fi

backend/api/admin.py CHANGED Viewed

@@ -7,7 +7,7 @@ from backend.core.warmup_classifier import warmup, warmup_cross_encoder
 from datetime import datetime, timedelta, timezone
 from collections import Counter
-log = logging.getLogger("nexus.api.admin")
 router = APIRouter()

 from datetime import datetime, timedelta, timezone
 from collections import Counter
+log = logging.getLogger("morpheus.api.admin")
 router = APIRouter()

backend/api/corpus.py CHANGED Viewed

@@ -14,7 +14,7 @@ from shared.types import (
     CorpusFile, CorpusResponse, RenameRequest,
 )
-log    = logging.getLogger("nexus.api.corpus")
 router = APIRouter()

     CorpusFile, CorpusResponse, RenameRequest,
 )
+log = logging.getLogger("morpheus.api.corpus")
 router = APIRouter()

backend/api/ingest.py CHANGED Viewed

@@ -6,7 +6,7 @@ from backend.core.auth_utils import require_auth_token
 from backend.core.tasks import process_pdf_task
 from backend.core.tasks import celery_app
-log = logging.getLogger("nexus.api.ingest")
 router = APIRouter()

 from backend.core.tasks import process_pdf_task
 from backend.core.tasks import celery_app
+log = logging.getLogger("morpheus.api.ingest")
 router = APIRouter()

backend/api/query.py CHANGED Viewed

@@ -9,7 +9,7 @@ from backend.core.pipeline import retrieve_chunks, generate_answer_stream, analy
 from backend.core.auth_utils import require_auth_token
 from backend.main import limiter
-log    = logging.getLogger("nexus.api.query")
 router = APIRouter()

 from backend.core.auth_utils import require_auth_token
 from backend.main import limiter
+log = logging.getLogger("morpheus.api.query")
 router = APIRouter()

backend/core/build_ml_assets.py CHANGED Viewed

@@ -11,7 +11,7 @@ import os
 import logging
 logging.basicConfig(level=logging.INFO, format="%(asctime)s [%(levelname)s] %(message)s")
-log = logging.getLogger("nexus.build_assets")
 def build_assets():
     log.info("Starting ML asset pre-build...")
@@ -19,14 +19,14 @@ def build_assets():
     # Build-time safety:
     # Prevent intent_classifier singleton from starting background bootstrap
     # threads while we run deterministic synchronous training below.
-    os.environ["NEXUS_DISABLE_INTENT_BOOTSTRAP"] = "true"
     # In CI/build environments we may not have real Supabase credentials.
     # Keep train/upload logic local-only in that case.
     os.environ.setdefault("SUPABASE_URL", "")
     os.environ.setdefault("SUPABASE_SERVICE_KEY", "")
-    mode = os.getenv("NEXUS_BUILD_ASSETS_MODE", "light").strip().lower()
     log.info("Build asset mode: %s", mode)
     # 1. Optional pre-download sentence-transformers (used by Intent Classifier)

 import logging
 logging.basicConfig(level=logging.INFO, format="%(asctime)s [%(levelname)s] %(message)s")
+log = logging.getLogger("morpheus.build_assets")
 def build_assets():
     log.info("Starting ML asset pre-build...")
     # Build-time safety:
     # Prevent intent_classifier singleton from starting background bootstrap
     # threads while we run deterministic synchronous training below.
+    os.environ["MORPHEUS_DISABLE_INTENT_BOOTSTRAP"] = "true"
     # In CI/build environments we may not have real Supabase credentials.
     # Keep train/upload logic local-only in that case.
     os.environ.setdefault("SUPABASE_URL", "")
     os.environ.setdefault("SUPABASE_SERVICE_KEY", "")
+    mode = os.getenv("MORPHEUS_BUILD_ASSETS_MODE", "light").strip().lower()
     log.info("Build asset mode: %s", mode)
     # 1. Optional pre-download sentence-transformers (used by Intent Classifier)

backend/core/config.py CHANGED Viewed

@@ -29,7 +29,7 @@ COHERE_API_KEY = os.getenv("COHERE_API_KEY")
 MASTER_ADMIN_KEY = os.getenv("MASTER_ADMIN_KEY")
 # ==================== PROVIDER SELECTION ====================
-LLM_PROVIDER = os.getenv("NEXUS_LLM_PROVIDER", "openrouter").strip().lower()
 OLLAMA_BASE_URL = os.getenv("OLLAMA_BASE_URL", "http://localhost:11434")
 OLLAMA_MODELS = ["llama3.2", "mistral"]

 MASTER_ADMIN_KEY = os.getenv("MASTER_ADMIN_KEY")
 # ==================== PROVIDER SELECTION ====================
+LLM_PROVIDER = os.getenv("MORPHEUS_LLM_PROVIDER", "openrouter").strip().lower()
 OLLAMA_BASE_URL = os.getenv("OLLAMA_BASE_URL", "http://localhost:11434")
 OLLAMA_MODELS = ["llama3.2", "mistral"]

backend/core/distill_reranker.py CHANGED Viewed

@@ -23,11 +23,10 @@ you can optionally promote the local model to Path 1 and make Cohere the fallbac
 import os
 import logging
-import json
 from dotenv import load_dotenv
 load_dotenv()
-log = logging.getLogger("nexus.distill")
 logging.basicConfig(level=logging.INFO, format="%(asctime)s [%(levelname)s] %(message)s")
 DISTILLED_MODEL_PATH = "backend/core/local_reranker"

 import os
 import logging
 from dotenv import load_dotenv
 load_dotenv()
+log = logging.getLogger("morpheus.distill")
 logging.basicConfig(level=logging.INFO, format="%(asctime)s [%(levelname)s] %(message)s")
 DISTILLED_MODEL_PATH = "backend/core/local_reranker"

backend/core/intent_classifier.py CHANGED Viewed

@@ -31,12 +31,14 @@ from pathlib import Path
 from typing import Optional
 from supabase.client import create_client
-log = logging.getLogger("nexus.intent")
 def _bootstrap_disabled() -> bool:
     from backend.core import config
-    force_disabled = os.getenv("NEXUS_DISABLE_INTENT_BOOTSTRAP", "false").lower() in {"1", "true", "yes"}
     # Default production-safe posture: do not train on import unless explicitly enabled.
     return force_disabled or (not config.INTENT_BOOTSTRAP_ON_STARTUP)
@@ -326,7 +328,9 @@ class IntentClassifier:
                 log.info("No intent model found — will use fallback until trained.")
                 self._ready = False
                 if _bootstrap_disabled():
-                    log.info("Intent bootstrap disabled by NEXUS_DISABLE_INTENT_BOOTSTRAP.")
                 elif not getattr(self, "_bootstrap_started", False):
                     self._bootstrap_started = True
                     threading.Thread(target=train_initial_model, daemon=True).start()

 from typing import Optional
 from supabase.client import create_client
+log = logging.getLogger("morpheus.intent")
 def _bootstrap_disabled() -> bool:
     from backend.core import config
+    force_disabled = os.getenv(
+        "MORPHEUS_DISABLE_INTENT_BOOTSTRAP", "false"
+    ).lower() in {"1", "true", "yes"}
     # Default production-safe posture: do not train on import unless explicitly enabled.
     return force_disabled or (not config.INTENT_BOOTSTRAP_ON_STARTUP)
                 log.info("No intent model found — will use fallback until trained.")
                 self._ready = False
                 if _bootstrap_disabled():
+                    log.info(
+                        "Intent bootstrap disabled by MORPHEUS_DISABLE_INTENT_BOOTSTRAP."
+                    )
                 elif not getattr(self, "_bootstrap_started", False):
                     self._bootstrap_started = True
                     threading.Thread(target=train_initial_model, daemon=True).start()

backend/core/tasks.py CHANGED Viewed

@@ -5,11 +5,7 @@ from backend.core.pipeline import run_ingestion
 # Initialize Celery pointing to your Redis broker
 REDIS_URL = os.getenv("REDIS_URL", "redis://localhost:6379/0")
-celery_app = Celery(
-    "nexus_worker",
-    broker=REDIS_URL,
-    backend=REDIS_URL
-)
 @celery_app.task(bind=True)
 def process_pdf_task(self, tmp_path: str, original_filename: str, access_token: str):

 # Initialize Celery pointing to your Redis broker
 REDIS_URL = os.getenv("REDIS_URL", "redis://localhost:6379/0")
+celery_app = Celery("morpheus_worker", broker=REDIS_URL, backend=REDIS_URL)
 @celery_app.task(bind=True)
 def process_pdf_task(self, tmp_path: str, original_filename: str, access_token: str):

backend/eval/run_eval.py CHANGED Viewed

@@ -36,7 +36,7 @@ from backend.core.pipeline import retrieve_chunks
 from backend.eval.metrics import score_example, _doc_text_for_scoring
 from backend.eval.openrouter_eval import ModelOrchestrator
-log = logging.getLogger("nexus.eval.run")
 logging.basicConfig(level=logging.INFO, format="%(levelname)s %(name)s — %(message)s")
 # Calibration: relevance_proxy must stay BELOW this for unanswerable questions

 from backend.eval.metrics import score_example, _doc_text_for_scoring
 from backend.eval.openrouter_eval import ModelOrchestrator
+log = logging.getLogger("morpheus.eval.run")
 logging.basicConfig(level=logging.INFO, format="%(levelname)s %(name)s — %(message)s")
 # Calibration: relevance_proxy must stay BELOW this for unanswerable questions

docs/model_migration_roadmap.md CHANGED Viewed

@@ -1,4 +1,4 @@
-# NEXUS Model Migration Roadmap (Prototype -> Enterprise)
 ## Step 0: Preserve vector schema compatibility
 - Do not change embedding dimensions in `public.documents.embedding` until you are ready for a full re-embed migration.
@@ -7,8 +7,8 @@
 ## Step 1: Switch generation to a local provider (Ollama)
 What’s implemented:
 - Generation calls in `backend/core/pipeline.py` now support a provider toggle:
-  - `NEXUS_LLM_PROVIDER=openrouter` (default)
-  - `NEXUS_LLM_PROVIDER=ollama`
 - Ollama models are configured via:
   - `OLLAMA_MODELS` (comma-separated) or `OLLAMA_MODEL` (single model)
   - `OLLAMA_BASE_URL` (defaults to `http://localhost:11434`)
@@ -16,7 +16,7 @@ What’s implemented:
 How to run:
 1. Ensure Ollama is running locally and can load your target model.
 2. Set environment variables:
-   - `NEXUS_LLM_PROVIDER=ollama`
    - `OLLAMA_MODELS=llama3`
 Notes:

+# MORPHEUS Model Migration Roadmap (Prototype -> Enterprise)
 ## Step 0: Preserve vector schema compatibility
 - Do not change embedding dimensions in `public.documents.embedding` until you are ready for a full re-embed migration.
 ## Step 1: Switch generation to a local provider (Ollama)
 What’s implemented:
 - Generation calls in `backend/core/pipeline.py` now support a provider toggle:
+  - `MORPHEUS_LLM_PROVIDER=openrouter` (default)
+  - `MORPHEUS_LLM_PROVIDER=ollama`
 - Ollama models are configured via:
   - `OLLAMA_MODELS` (comma-separated) or `OLLAMA_MODEL` (single model)
   - `OLLAMA_BASE_URL` (defaults to `http://localhost:11434`)
 How to run:
 1. Ensure Ollama is running locally and can load your target model.
 2. Set environment variables:
+   - `MORPHEUS_LLM_PROVIDER=ollama`
    - `OLLAMA_MODELS=llama3`
 Notes:

vercel.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "version": 2,
-  "name": "nexus-frontend",
   "builds": [{ "src": "frontend/**", "use": "@vercel/static" }],
   "routes": [{ "src": "/(.*)", "dest": "frontend/$1" }]
 }

 {
   "version": 2,
+  "name": "morpheus-frontend",
   "builds": [{ "src": "frontend/**", "use": "@vercel/static" }],
   "routes": [{ "src": "/(.*)", "dest": "frontend/$1" }]
 }