OLMo-1B-as_fm3_tg_omi2 - a rosieyzh Collection

rosieyzh 's Collections

Synthetic Multimodal Datasets

Qwen2.5-1.5B SFT - Unstructured Code

Llama-3.2-1B Warmstart RLVR - Summarization

Llama-3.2-1B RLVR - Summarization

Llama-3.2-1B SFT - Summarization

Qwen2.5-1.5B Warmstart RLVR - GSM8K

Qwen2.5-1.5B RLVR - GSM8K

Llama-3.2-1B Warmstart RLVR - Translation

Llama-3.2-1B RLVR - Translation

Llama-3.2-1B SFT - Translation

Qwen2.5-1.5B Warmstart RLVR - Code

Qwen2.5-1.5B RLVR - Code

Qwen2.5-1.5B SFT - Code

OLMo-150M and OLMo-1B Pretrained Models

OLMo-1B-as_fm3_tg_omi1_omi2

OLMo-1B-as_fm3_tg_omi2

updated Jan 26

OLMo 1B model pretrained with Algebraic Stack, FineMath3, TinyGSM, and OpenMathInstruct2. Includes checkpoints from doing PPO using GSM8K train.

Upvote

rosieyzh/OLMo-1B-as_fm3_tg_omi2_ppo

Text Generation • 1B • Updated Jun 19, 2025 • 10
rosieyzh/OLMo-1B-as_fm3_tg_omi2_episode1

Text Generation • 1B • Updated Jun 18, 2025 • 3
rosieyzh/OLMo-1B-as_fm3_tg_omi2_episode2

Text Generation • 1B • Updated Jun 18, 2025 • 3
rosieyzh/OLMo-1B-as_fm3_tg_omi2_episode3

Text Generation • 1B • Updated Jun 18, 2025 • 2
rosieyzh/OLMo-1B-as_fm3_tg_omi2_episode4

Text Generation • 1B • Updated Jun 18, 2025 • 2
rosieyzh/OLMo-1B-as_fm3_tg_omi2_episode5

Text Generation • 1B • Updated Jun 18, 2025 • 5
rosieyzh/OLMo-1B-as_fm3_tg_omi2_episode6

Text Generation • 1B • Updated Jun 18, 2025 • 7
rosieyzh/OLMo-1B-as_fm3_tg_omi2_episode7

Text Generation • 1B • Updated Jun 18, 2025 • 2
rosieyzh/OLMo-1B-as_fm3_tg_omi2_episode8

Text Generation • 1B • Updated Jun 18, 2025 • 3
rosieyzh/OLMo-1B-as_fm3_tg_omi2_episode9

Text Generation • 1B • Updated Jun 19, 2025 • 3
rosieyzh/OLMo-1B-as_fm3_tg_omi2_base

Text Generation • 1B • Updated Jul 7, 2025 • 5
rosieyzh/OLMo-1B-as_fm3_tg_omi2_global_step9

Text Generation • 1B • Updated Jun 19, 2025 • 7
rosieyzh/OLMo-1B-as_fm3_tg_omi2_global_step13

Text Generation • 1B • Updated Jun 19, 2025 • 3
rosieyzh/OLMo-1B-as_fm3_tg_omi2_global_step18

Text Generation • 1B • Updated Jun 19, 2025 • 3
rosieyzh/OLMo-1B-as_fm3_tg_omi2_global_step25

Text Generation • 1B • Updated Jun 19, 2025 • 2
rosieyzh/OLMo-1B-as_fm3_tg_omi2_global_step36

Text Generation • 1B • Updated Jun 19, 2025 • 3
rosieyzh/OLMo-1B-as_fm3_tg_omi2_global_step51

Text Generation • 1B • Updated Jun 19, 2025 • 3
rosieyzh/OLMo-1B-as_fm3_tg_omi2_global_step73

Text Generation • 1B • Updated Jun 19, 2025 • 3
rosieyzh/OLMo-1B-as_fm3_tg_omi2_global_step103

Text Generation • 1B • Updated Jun 19, 2025 • 3
rosieyzh/OLMo-1B-as_fm3_tg_omi2_global_step146

Text Generation • 1B • Updated Jun 19, 2025 • 5
rosieyzh/OLMo-1B-as_fm3_tg_omi2_global_step206

Text Generation • 1B • Updated Jun 19, 2025 • 2
rosieyzh/OLMo-1B-as_fm3_tg_omi2_global_step291

Text Generation • 1B • Updated Jun 19, 2025 • 3
rosieyzh/OLMo-1B-as_fm3_tg_omi2_global_step411

Text Generation • 1B • Updated Jun 19, 2025 • 8
rosieyzh/OLMo-1B-as_fm3_tg_omi2_global_step581

Text Generation • 1B • Updated Jun 19, 2025 • 2
rosieyzh/OLMo-1B-as_fm3_tg_omi2_global_step821

Text Generation • 1B • Updated Jun 19, 2025 • 3

Upvote

Collection guide
Browse collections