Spaces:

sh4shv4t
/

Parlay

Paused

App Files Files Community

Parlay / agent

Commit History

feat: training results page + SFT Colab notebook

108bc34

sh4shv4t commited on 12 days ago

Add pre-training audit scripts, OpenEnv manifest, and tune Parlay training/env (GRPO 1.5B default, min-reward filters, weighted data gen, hiring ZOPA+drift, veteran/opponent prompts, Docker/docs)

df724f2

sh4shv4t commited on 13 days ago

feat: flash-lite for data-gen and flash for UI; remove training page; card tests; --quiet data gen; data/ inspect path; random baseline; GRPO env wrapper; reward fixes (buyer ZOPA, ToM signals); drift + Brier metrics; Bayesian ToM module

15976d0

sh4shv4t commited on 13 days ago

fix: move global declarations before first use (grpo_train, call_gemini)

8ec5193

sh4shv4t commited on 13 days ago

feat: backup existing data + per-episode progress tracking + gemini live-call verification

48756ef

sh4shv4t commited on 13 days ago

fix: upgrade gemini model string to 2.5-flash-lite + add tom diagnostic script

3f61551

sh4shv4t commited on 13 days ago

fix: gemini retry backoff + tom belief diagnostic logging

80b3b2e

sh4shv4t commited on 13 days ago

feat: streamline parlay for demo mode and add spectator negotiation mechanics

2568517

sh4shv4t commited on 13 days ago

feat: split Gemini 2.5 Flash (demo) and Flash-Lite (data), SFT threshold 0.3, favicon + check_gemini

9d82eed

sh4shv4t commited on 14 days ago

fix: fixed UI bugs, keyless testing initiated

14577ec

sh4shv4t commited on 15 days ago

refactor(agent): migrate Gemini client from google-generativeai to google-genai

dd46a0d

sh4shv4t commited on 16 days ago

feat: project setup

698f4d8

sh4shv4t commited on 16 days ago

Commit History

feat: training results page + SFT Colab notebook 108bc34

Add pre-training audit scripts, OpenEnv manifest, and tune Parlay training/env (GRPO 1.5B default, min-reward filters, weighted data gen, hiring ZOPA+drift, veteran/opponent prompts, Docker/docs) df724f2

feat: flash-lite for data-gen and flash for UI; remove training page; card tests; --quiet data gen; data/ inspect path; random baseline; GRPO env wrapper; reward fixes (buyer ZOPA, ToM signals); drift + Brier metrics; Bayesian ToM module 15976d0

fix: move global declarations before first use (grpo_train, call_gemini) 8ec5193

feat: backup existing data + per-episode progress tracking + gemini live-call verification 48756ef

fix: upgrade gemini model string to 2.5-flash-lite + add tom diagnostic script 3f61551

fix: gemini retry backoff + tom belief diagnostic logging 80b3b2e

feat: streamline parlay for demo mode and add spectator negotiation mechanics 2568517

feat: split Gemini 2.5 Flash (demo) and Flash-Lite (data), SFT threshold 0.3, favicon + check_gemini 9d82eed

fix: fixed UI bugs, keyless testing initiated 14577ec

refactor(agent): migrate Gemini client from google-generativeai to google-genai dd46a0d

feat: project setup 698f4d8

feat: training results page + SFT Colab notebook

108bc34

Add pre-training audit scripts, OpenEnv manifest, and tune Parlay training/env (GRPO 1.5B default, min-reward filters, weighted data gen, hiring ZOPA+drift, veteran/opponent prompts, Docker/docs)

df724f2

feat: flash-lite for data-gen and flash for UI; remove training page; card tests; --quiet data gen; data/ inspect path; random baseline; GRPO env wrapper; reward fixes (buyer ZOPA, ToM signals); drift + Brier metrics; Bayesian ToM module

15976d0

fix: move global declarations before first use (grpo_train, call_gemini)

8ec5193

feat: backup existing data + per-episode progress tracking + gemini live-call verification

48756ef

fix: upgrade gemini model string to 2.5-flash-lite + add tom diagnostic script

3f61551

fix: gemini retry backoff + tom belief diagnostic logging

80b3b2e

feat: streamline parlay for demo mode and add spectator negotiation mechanics

2568517

feat: split Gemini 2.5 Flash (demo) and Flash-Lite (data), SFT threshold 0.3, favicon + check_gemini

9d82eed

fix: fixed UI bugs, keyless testing initiated

14577ec

refactor(agent): migrate Gemini client from google-generativeai to google-genai

dd46a0d

feat: project setup

698f4d8