Spaces:

cesjavi
/

aubm

Build error

App Files Files Community

cesjavi commited on about 8 hours ago

Commit

f5bca71

1 Parent(s): 89a451f

Fix: Hardened AI project generation with stable model fallback and better logging (Phase 9)

Browse files

Files changed (2) hide show

backend/routers/generator.py +18 -3
backend/services/config.py +2 -8

backend/routers/generator.py CHANGED Viewed

@@ -74,23 +74,38 @@ async def generate_project(
         # 3. Call Groq
         provider_config = config_service.get_provider_config("groq")
         api_key = provider_config.get("api_key") or settings.GROQ_API_KEY
         client = groq.AsyncGroq(api_key=api_key)
         response = await client.chat.completions.create(
-            model="llama-3.3-70b-versatile",
             messages=[
                 {"role": "system", "content": system_prompt},
                 {"role": "user", "content": user_message}
             ],
             temperature=0.3,
             max_tokens=2048,
             response_format={"type": "json_object"}
         )
         response_text = response.choices[0].message.content
         data = _parse_json_output(response_text)
         return data
     except Exception as e:
-        logger.error("Project generation failed: %s", e)
-        raise HTTPException(status_code=500, detail=f"Generation failed: {str(e)}")

         # 3. Call Groq
         provider_config = config_service.get_provider_config("groq")
         api_key = provider_config.get("api_key") or settings.GROQ_API_KEY
+        if not api_key:
+            logger.error("GROQ_API_KEY is missing in settings and config")
+            raise HTTPException(status_code=500, detail="GROQ_API_KEY not configured")
         client = groq.AsyncGroq(api_key=api_key)
+        # Use llama3-70b-8192 as a more stable fallback/default
+        model_name = provider_config.get("default_model") or "llama3-70b-8192"
+        logger.info("Calling Groq with model: %s", model_name)
         response = await client.chat.completions.create(
+            model=model_name,
             messages=[
                 {"role": "system", "content": system_prompt},
                 {"role": "user", "content": user_message}
             ],
             temperature=0.3,
             max_tokens=2048,
+            # Note: Not all Groq models support json_object mode perfectly yet
             response_format={"type": "json_object"}
         )
         response_text = response.choices[0].message.content
+        logger.debug("Groq raw response: %s", response_text)
         data = _parse_json_output(response_text)
         return data
     except Exception as e:
+        logger.exception("Project generation failed")
+        error_msg = str(e)
+        # Handle specific Groq errors if possible
+        if "api_key" in error_msg.lower():
+            error_msg = "Invalid or missing API Key"
+        raise HTTPException(status_code=500, detail=f"AI Generation failed: {error_msg}")

backend/services/config.py CHANGED Viewed

@@ -56,7 +56,7 @@ class ConfigService:
     # Defaults used when DB has no config entry for a provider
     _DEFAULTS: Dict[str, Any] = {
-        "groq":        {"enabled": True,  "default_model": "llama-3.3-70b-versatile", "temperature": 0.7, "max_tokens": 4096},
         "openai":      {"enabled": True,  "default_model": "gpt-4o",                   "temperature": 0.7, "max_tokens": 4096},
         "openrouter":  {"enabled": True,  "default_model": "google/gemini-2.0-flash",  "temperature": 0.7, "max_tokens": 8192},
         "gemini":      {"enabled": True,  "default_model": "gemini-2.0-flash",         "temperature": 0.7, "max_tokens": 8192},
@@ -100,11 +100,5 @@ class ConfigService:
                     return cls._cache[cache_key]
             except Exception:
                 pass
         return default
-    @classmethod
-    def invalidate_cache(cls) -> None:
-        cls._cache.clear()
-config_service = ConfigService()

     # Defaults used when DB has no config entry for a provider
     _DEFAULTS: Dict[str, Any] = {
+        "groq":        {"enabled": True,  "default_model": "llama3-70b-8192", "temperature": 0.7, "max_tokens": 4096},
         "openai":      {"enabled": True,  "default_model": "gpt-4o",                   "temperature": 0.7, "max_tokens": 4096},
         "openrouter":  {"enabled": True,  "default_model": "google/gemini-2.0-flash",  "temperature": 0.7, "max_tokens": 8192},
         "gemini":      {"enabled": True,  "default_model": "gemini-2.0-flash",         "temperature": 0.7, "max_tokens": 8192},
                     return cls._cache[cache_key]
             except Exception:
                 pass
         return default