Spaces:

Fifthoply
/

AyudaAlan-0.1

Running

App Files Files

Fifthoply commited on 16 days ago

Commit

71ae54a

verified ·

1 Parent(s): deee2a9

Update app.py

Browse files

Files changed (1) hide show

app.py +19 -20

app.py CHANGED Viewed

@@ -3,11 +3,9 @@ import torch
 from transformers import pipeline
 # 1. Configuración del modelo
-# Reemplaza con tu ID real de Hugging Face
 model_id = "Fifthoply/AyudaAlan-0.1"
-print("Iniciando carga del modelo...")
-# Usamos el pipeline optimizado para CPU
 pipe = pipeline(
     "text-generation",
     model=model_id,
@@ -16,41 +14,42 @@ pipe = pipeline(
 )
 def chat_responder(message, history):
-    # Construcción manual del prompt ChatML
     prompt = "<|im_start|>system\nEres un asistente breve.<|im_end|>\n"
-    # Añadir historial previo
-    for user_msg, assistant_msg in history:
-        prompt += f"<|im_start|>user\n{user_msg}<|im_end|>\n<|im_start|>assistant\n{assistant_msg}<|im_end|>\n"
-    # Añadir pregunta actual
     prompt += f"<|im_start|>user\n{message}<|im_end|>\n<|im_start|>assistant\n"
-    # Generación con parámetros de seguridad
     outputs = pipe(
         prompt,
         max_new_tokens=25,
-        do_sample=False, # Determinista para respuestas literales
         pad_token_id=pipe.tokenizer.pad_token_id,
         eos_token_id=pipe.tokenizer.eos_token_id
     )
-    # Limpieza robusta del texto generado
     generated_text = outputs[0]['generated_text']
-    # Buscamos la última respuesta del asistente
-    parts = generated_text.split("<|im_start|>assistant\n")
-    final_response = parts[-1].split("<|im_end|>")[0].strip()
-    return final_response
-# 2. Interfaz minimalista y compatible
-# Eliminamos argumentos experimentales para asegurar que compile a la primera
 demo = gr.ChatInterface(
     fn=chat_responder,
     title="Ayuda Alan 🦥",
-    description="Asistente redundante basado en Qwen 2.5 0.5B.",
-    examples=["¿Cómo se toma agua?", "¿Cómo se salta?", "¿Cómo se escribe?"],
-    cache_examples=False # Evita procesamientos pesados en la compilación
 )
 if __name__ == "__main__":

 from transformers import pipeline
 # 1. Configuración del modelo
 model_id = "Fifthoply/AyudaAlan-0.1"
+print(f"Cargando {model_id} en CPU...")
 pipe = pipeline(
     "text-generation",
     model=model_id,
 )
 def chat_responder(message, history):
+    # Construcción del prompt ChatML
     prompt = "<|im_start|>system\nEres un asistente breve.<|im_end|>\n"
+    # Procesar historial según el formato de Gradio 5.x (lista de dicts)
+    for msg in history:
+        role = msg["role"]
+        content = msg["content"]
+        # Solo mapeamos user y assistant
+        if role in ["user", "assistant"]:
+            prompt += f"<|im_start|>{role}\n{content}<|im_end|>\n"
+    # Pregunta actual
     prompt += f"<|im_start|>user\n{message}<|im_end|>\n<|im_start|>assistant\n"
+    # Generación
     outputs = pipe(
         prompt,
         max_new_tokens=25,
+        do_sample=False,
         pad_token_id=pipe.tokenizer.pad_token_id,
         eos_token_id=pipe.tokenizer.eos_token_id
     )
+    # Extraer respuesta
     generated_text = outputs[0]['generated_text']
+    respuesta = generated_text.split("<|im_start|>assistant\n")[-1].split("<|im_end|>")[0].strip()
+    return respuesta
+# 2. Interfaz de Usuario
 demo = gr.ChatInterface(
     fn=chat_responder,
     title="Ayuda Alan 🦥",
+    description="Pregúntame cómo se hace algo.",
+    examples=["¿Cómo se batea una pelota?", "¿Cómo se escala una montaña?"],
+    type="messages" # Forzamos el formato de mensajes para evitar ambigüedad
 )
 if __name__ == "__main__":