Matzan commited on
Commit
3b79d2e
·
verified ·
1 Parent(s): be8bbb0

Upload README.md with huggingface_hub

Browse files
Files changed (1) hide show
  1. README.md +71 -0
README.md ADDED
@@ -0,0 +1,71 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ # 🤖 Desktop Agent Autónomo (Sin Censura)
2
+
3
+ Agente de escritorio autónomo con VLM multimodal sin censura.
4
+
5
+ ## Arquitectura
6
+
7
+ ```
8
+ 👁️ OJOS → pyautogui.screenshot() → Captura pantalla
9
+ 🧠 CEREBRO → Qwen3.5-35B-A3B-abliterated → Piensa y decide
10
+ 🖐️ MANOS → pyautogui → Ejecuta acciones
11
+ 📚 MEMORIA → DPO online → Aprende de interacciones
12
+ ```
13
+
14
+ ## Modelos Soportados (Sin Censura)
15
+
16
+ | Modelo | Tamaño | VRAM (4-bit) | Tipo | Link |
17
+ |--------|--------|--------------|------|------|
18
+ | **Qwen3.5-35B-A3B-abliterated** ⭐ | 35B/3B activos | ~16GB | MoE | [HF](https://hf.co/huihui-ai/Huihui-Qwen3.5-35B-A3B-abliterated) |
19
+ | Qwen3.6-27B-abliterated | 27B | ~27GB | Dense | [HF](https://hf.co/wangzhang/Qwen3.6-27B-abliterated) |
20
+ | Gemma-4-26B-A4B-abliterated | 26B/4B activos | ~14GB | MoE | [HF](https://hf.co/jenerallee78/gemma-4-26B-A4B-it-ara-abliterated) |
21
+
22
+ ## Instalación
23
+
24
+ ```bash
25
+ pip install -r requirements.txt
26
+ ```
27
+
28
+ ## Uso
29
+
30
+ ### 1. Ejecutar agente
31
+
32
+ ```bash
33
+ python agent.py --task "Open Chrome and search for AI news" --steps 20
34
+ ```
35
+
36
+ ### 2. Entrenar con DPO (aprendizaje)
37
+
38
+ Primero el agente interactúa y guarda logs. Luego:
39
+
40
+ ```bash
41
+ python train_dpo.py --epochs 3 --lr 5e-7
42
+ ```
43
+
44
+ ### 3. Usar modelo entrenado
45
+
46
+ ```bash
47
+ python agent.py --model "Matzan/desktop-agent-dpo" --task "New task"
48
+ ```
49
+
50
+ ## Acciones Soportadas
51
+
52
+ - `click(x, y)` — Click en coordenadas normalizadas (0-1)
53
+ - `type("text")` — Escribe texto
54
+ - `key("enter")` — Presiona tecla
55
+ - `scroll(x, y, "down")` — Scroll en posición
56
+ - `done("reason")` — Termina tarea
57
+ - `fail("reason")` — No puede completar
58
+
59
+ ## ⚠️ Seguridad
60
+
61
+ - `pyautogui.FAILSAFE = True` — Mueve mouse a esquina superior izquierda para abortar
62
+ - El agente puede interactuar con tu desktop real. Úsalo con precaución.
63
+
64
+ ## Pipeline de Aprendizaje
65
+
66
+ ```
67
+ 1. Agente interactúa → Guarda (screenshot, acción, reward)
68
+ 2. DPO: compara acciones exitosas vs fallidas
69
+ 3. Reentrena modelo
70
+ 4. Repite
71
+ ```