il-pugin
/

hse-prog-task-transformer-reward-model

Reinforcement Learning

Model card Files Files and versions

README.md exists but content is empty.

Downloads last month: 11

Safetensors

Model size

8B params

Tensor type

F32

·

BF16

·

Video Preview

Reinforcement Learning

loading

Model tree for il-pugin/hse-prog-task-transformer-reward-model

Base model

sfairXC/FsfairX-LLaMA3-RM-v0.1

Finetuned

(2)

this model

Dataset used to train il-pugin/hse-prog-task-transformer-reward-model