Spaces:

lablab-ai-amd-developer-hackathon
/

signbridge

Build error

LucasLooTan commited on about 23 hours ago

Commit

d20d5a9

1 Parent(s): 0fb3eb2

perf: cache OpenAI-compatible client per (provider, model) tuple

deep-check audit A.F9: _resolve_client was instantiating a fresh
OpenAI client (and therefore a fresh httpx connection pool) per
recognition / composition call. lru_cache(maxsize=4) keyed on
(provider, base_url, api_key, model) reuses the pool across same-
provider calls; switching providers (e.g. amd -> hf fallback) rebuilds
cleanly.

Same pattern applied to both signbridge/recognizer/vlm.py and
signbridge/composer/sentence.py. Existing test monkey-patches still
work because they replace _resolve_client directly, not _build_client.

Files changed (2) hide show

signbridge/composer/sentence.py +21 -21
signbridge/recognizer/vlm.py +27 -22

signbridge/composer/sentence.py CHANGED Viewed

@@ -15,6 +15,7 @@ from __future__ import annotations
 import logging
 import os
 import re
 from typing import Sequence
 logger = logging.getLogger(__name__)
@@ -32,52 +33,51 @@ Rules:
 6. End with appropriate punctuation."""
 def _resolve_client() -> tuple[object | None, str]:
-    """Return (client, model_id) based on SIGNBRIDGE_PROVIDER env var."""
     provider = os.getenv("SIGNBRIDGE_PROVIDER", "amd").lower()
     composer_model = os.getenv(
         "SIGNBRIDGE_COMPOSER_MODEL", "meta-llama/Llama-3.1-8B-Instruct"
     )
-    try:
-        from openai import OpenAI  # type: ignore[import-not-found]
-    except ImportError:
-        logger.warning("openai sdk not installed; composer returns naive joiner.")
-        return None, composer_model
     if provider == "amd":
         base_url = os.getenv("AMD_DEV_CLOUD_BASE_URL", "").rstrip("/")
         api_key = os.getenv("AMD_DEV_CLOUD_API_KEY", "")
         if not base_url or not api_key:
             logger.info("AMD Dev Cloud not configured; falling back to naive joiner.")
             return None, composer_model
-        return OpenAI(base_url=base_url, api_key=api_key), composer_model
     if provider == "openai":
         api_key = os.getenv("OPENAI_API_KEY", "")
         if not api_key:
             logger.info("OPENAI_API_KEY not set; falling back to naive joiner.")
             return None, composer_model
-        # For local-dev fallback, use a small fast model.
-        return OpenAI(api_key=api_key), os.getenv(
-            "SIGNBRIDGE_COMPOSER_MODEL_OPENAI", "gpt-4o-mini"
-        )
     if provider == "hf":
         api_key = os.getenv("HF_TOKEN", "")
         if not api_key:
             logger.info("HF_TOKEN not set; falling back to naive joiner.")
             return None, composer_model
-        return (
-            OpenAI(
-                base_url=os.getenv(
-                    "HF_INFERENCE_BASE_URL",
-                    "https://router.huggingface.co/v1",
-                ),
-                api_key=api_key,
-            ),
-            composer_model,
         )
     logger.warning("unknown SIGNBRIDGE_PROVIDER=%r; using naive joiner.", provider)
     return None, composer_model

 import logging
 import os
 import re
+from functools import lru_cache
 from typing import Sequence
 logger = logging.getLogger(__name__)
 6. End with appropriate punctuation."""
+@lru_cache(maxsize=4)
+def _build_client(provider: str, base_url: str, api_key: str, model: str) -> tuple[object | None, str]:
+    """Build (and cache) an OpenAI-compatible client for the given config."""
+    try:
+        from openai import OpenAI  # type: ignore[import-not-found]
+    except ImportError:
+        logger.warning("openai sdk not installed; composer returns naive joiner.")
+        return None, model
+    if base_url:
+        return OpenAI(base_url=base_url, api_key=api_key), model
+    return OpenAI(api_key=api_key), model
 def _resolve_client() -> tuple[object | None, str]:
+    """Return (cached client, model_id) based on SIGNBRIDGE_PROVIDER env var."""
     provider = os.getenv("SIGNBRIDGE_PROVIDER", "amd").lower()
     composer_model = os.getenv(
         "SIGNBRIDGE_COMPOSER_MODEL", "meta-llama/Llama-3.1-8B-Instruct"
     )
     if provider == "amd":
         base_url = os.getenv("AMD_DEV_CLOUD_BASE_URL", "").rstrip("/")
         api_key = os.getenv("AMD_DEV_CLOUD_API_KEY", "")
         if not base_url or not api_key:
             logger.info("AMD Dev Cloud not configured; falling back to naive joiner.")
             return None, composer_model
+        return _build_client(provider, base_url, api_key, composer_model)
     if provider == "openai":
         api_key = os.getenv("OPENAI_API_KEY", "")
         if not api_key:
             logger.info("OPENAI_API_KEY not set; falling back to naive joiner.")
             return None, composer_model
+        model = os.getenv("SIGNBRIDGE_COMPOSER_MODEL_OPENAI", "gpt-4o-mini")
+        return _build_client(provider, "", api_key, model)
     if provider == "hf":
         api_key = os.getenv("HF_TOKEN", "")
         if not api_key:
             logger.info("HF_TOKEN not set; falling back to naive joiner.")
             return None, composer_model
+        base_url = os.getenv(
+            "HF_INFERENCE_BASE_URL", "https://router.huggingface.co/v1"
         )
+        return _build_client(provider, base_url, api_key, composer_model)
     logger.warning("unknown SIGNBRIDGE_PROVIDER=%r; using naive joiner.", provider)
     return None, composer_model

signbridge/recognizer/vlm.py CHANGED Viewed

@@ -22,6 +22,7 @@ import io
 import logging
 import os
 import re
 import numpy as np
@@ -51,15 +52,28 @@ _PROMPT = (
 )
-def _resolve_client() -> tuple[object | None, str]:
-    """Return (openai-compat client, model_id) based on SIGNBRIDGE_PROVIDER."""
-    provider = os.getenv("SIGNBRIDGE_PROVIDER", "amd").lower()
     try:
         from openai import OpenAI  # type: ignore[import-not-found]
     except ImportError:
         logger.warning("openai sdk not installed; recognizer returns 'unknown'.")
-        return None, DEFAULT_VLM_MODEL
     if provider == "amd":
         base_url = os.getenv("AMD_DEV_CLOUD_BASE_URL", "").rstrip("/")
@@ -67,37 +81,28 @@ def _resolve_client() -> tuple[object | None, str]:
         if not base_url or not api_key:
             logger.info("AMD Dev Cloud not configured; recognizer in stub mode.")
             return None, DEFAULT_VLM_MODEL
-        return OpenAI(base_url=base_url, api_key=api_key), DEFAULT_VLM_MODEL
     if provider == "openai":
         api_key = os.getenv("OPENAI_API_KEY", "")
         if not api_key:
             logger.info("OPENAI_API_KEY not set; recognizer in stub mode.")
             return None, DEFAULT_VLM_MODEL
-        return OpenAI(api_key=api_key), os.getenv(
-            "SIGNBRIDGE_VLM_MODEL_OPENAI", "gpt-4o-mini"
-        )
     if provider == "hf":
         api_key = os.getenv("HF_TOKEN", "")
         if not api_key:
             logger.info("HF_TOKEN not set; recognizer in stub mode.")
             return None, DEFAULT_VLM_MODEL
-        # HF Inference Providers — OpenAI-compatible router serving Qwen2-VL,
-        # Llama-3.2-Vision, etc. via Together/Fireworks/Hyperbolic backends.
-        return (
-            OpenAI(
-                base_url=os.getenv(
-                    "HF_INFERENCE_BASE_URL",
-                    "https://router.huggingface.co/v1",
-                ),
-                api_key=api_key,
-            ),
-            os.getenv(
-                "SIGNBRIDGE_VLM_MODEL_HF",
-                "meta-llama/Llama-3.2-11B-Vision-Instruct",
-            ),
         )
     logger.warning("unknown SIGNBRIDGE_PROVIDER=%r; recognizer in stub mode.", provider)
     return None, DEFAULT_VLM_MODEL

 import logging
 import os
 import re
+from functools import lru_cache
 import numpy as np
 )
+@lru_cache(maxsize=4)
+def _build_client(provider: str, base_url: str, api_key: str, model: str) -> tuple[object | None, str]:
+    """Build (and cache) an OpenAI-compatible client for the given config.
+    Cache key includes the full provider tuple so switching providers
+    rebuilds; same provider re-uses the httpx connection pool. The
+    `(None, model)` return is cached too — once a missing-deps state is
+    detected we don't re-import on every frame.
+    """
     try:
         from openai import OpenAI  # type: ignore[import-not-found]
     except ImportError:
         logger.warning("openai sdk not installed; recognizer returns 'unknown'.")
+        return None, model
+    if base_url:
+        return OpenAI(base_url=base_url, api_key=api_key), model
+    return OpenAI(api_key=api_key), model
+def _resolve_client() -> tuple[object | None, str]:
+    """Return (cached client, model_id) based on SIGNBRIDGE_PROVIDER env var."""
+    provider = os.getenv("SIGNBRIDGE_PROVIDER", "amd").lower()
     if provider == "amd":
         base_url = os.getenv("AMD_DEV_CLOUD_BASE_URL", "").rstrip("/")
         if not base_url or not api_key:
             logger.info("AMD Dev Cloud not configured; recognizer in stub mode.")
             return None, DEFAULT_VLM_MODEL
+        return _build_client(provider, base_url, api_key, DEFAULT_VLM_MODEL)
     if provider == "openai":
         api_key = os.getenv("OPENAI_API_KEY", "")
         if not api_key:
             logger.info("OPENAI_API_KEY not set; recognizer in stub mode.")
             return None, DEFAULT_VLM_MODEL
+        model = os.getenv("SIGNBRIDGE_VLM_MODEL_OPENAI", "gpt-4o-mini")
+        return _build_client(provider, "", api_key, model)
     if provider == "hf":
         api_key = os.getenv("HF_TOKEN", "")
         if not api_key:
             logger.info("HF_TOKEN not set; recognizer in stub mode.")
             return None, DEFAULT_VLM_MODEL
+        base_url = os.getenv(
+            "HF_INFERENCE_BASE_URL", "https://router.huggingface.co/v1"
+        )
+        model = os.getenv(
+            "SIGNBRIDGE_VLM_MODEL_HF", "meta-llama/Llama-3.2-11B-Vision-Instruct"
         )
+        return _build_client(provider, base_url, api_key, model)
     logger.warning("unknown SIGNBRIDGE_PROVIDER=%r; recognizer in stub mode.", provider)
     return None, DEFAULT_VLM_MODEL