Spaces:

Humanlearning
/

Cyber_analyst-round1

Sleeping

Ctrl+K

1 contributor

feat: integrate Trackio for experiment tracking and add Modal training infrastructure with environment and test utilities.

4e663d8 13 days ago

__init__.py

44 Bytes
feat: implement core RL training infrastructure, including GRPO training, evaluation utilities, custom environments, and Modal-based execution scripts. 13 days ago
helpers.py

2.17 kB
feat: implement core RL training infrastructure, including GRPO training, evaluation utilities, custom environments, and Modal-based execution scripts. 13 days ago
test_anti_cheat.py

535 Bytes
feat: implement core RL training infrastructure, including GRPO training, evaluation utilities, custom environments, and Modal-based execution scripts. 13 days ago
test_invalid_actions.py

1.55 kB
feat: implement core RL training infrastructure, including GRPO training, evaluation utilities, custom environments, and Modal-based execution scripts. 13 days ago
test_models.py

498 Bytes
feat: implement core RL training infrastructure, including GRPO training, evaluation utilities, custom environments, and Modal-based execution scripts. 13 days ago
test_reset_step_state.py

782 Bytes
feat: implement core RL training infrastructure, including GRPO training, evaluation utilities, custom environments, and Modal-based execution scripts. 13 days ago
test_rewards.py

2.55 kB
feat: implement core RL training infrastructure, including GRPO training, evaluation utilities, custom environments, and Modal-based execution scripts. 13 days ago
test_rollouts.py

898 Bytes
feat: implement core RL training infrastructure, including GRPO training, evaluation utilities, custom environments, and Modal-based execution scripts. 13 days ago
test_seed_reproducibility.py

419 Bytes
feat: implement core RL training infrastructure, including GRPO training, evaluation utilities, custom environments, and Modal-based execution scripts. 13 days ago
test_web_interface.py

1.41 kB
feat: integrate Trackio for experiment tracking and add Modal training infrastructure with environment and test utilities. 13 days ago