sravanthi pulijala's picture

sravanthi pulijala

sravanthib

·

AI & ML interests

None yet

Organizations

sravanthib 's models 167

sravanthib/RLonRLcheckpoint1080fireworks

8B • Updated May 14, 2025

sravanthib/RLFireworks1611stepsnew

Updated May 12, 2025

sravanthib/RLFireworks1611steps

Updated May 12, 2025

sravanthib/fireworks1610checkpoints

8B • Updated May 12, 2025

sravanthib/RLFireworks270steps

8B • Updated May 9, 2025

sravanthib/RLFireworks_caluse_code_40steps

8B • Updated May 6, 2025

sravanthib/RLFireworks290steps

8B • Updated May 4, 2025

sravanthib/fireworks290steps

Updated May 4, 2025

sravanthib/RL_fireworks_290steps

8B • Updated May 4, 2025

sravanthib/RL_fireworks_300steps

8B • Updated May 4, 2025

sravanthib/RL_fireworks_310steps

8B • Updated Apr 30, 2025

sravanthib/longcontext_RL_GRPO

8B • Updated Apr 25, 2025

sravanthib/RL_on_longcontext_SFT_Qwen2.5_Simple-RL

Updated Apr 25, 2025

sravanthib/RL-glaive-steps

8B • Updated Apr 25, 2025

sravanthib/filetred-dataset-checkpoint10

8B • Updated Apr 23, 2025

sravanthib/function-calling-Finetuned-RL-llama-100-steps

8B • Updated Apr 23, 2025

sravanthib/Finetuned-qwen-2.5-7b-instruct-Nemo-10000steps

8B • Updated Apr 15, 2025 • 2

sravanthib/NeMo-qwen-7b-merged

8B • Updated Apr 13, 2025 • 2

sravanthib/OpenR1-Qwen2.5-7B-SFT

8B • Updated Apr 7, 2025

sravanthib/RL-10steps

8B • Updated Apr 6, 2025

sravanthib/new-OpenR1-llama3.1-8b-SFT

8B • Updated Apr 6, 2025

sravanthib/OpenR1-Qwen-2.5-Math-instruct-SFT

Updated Apr 6, 2025

sravanthib/OpenR1-llama3.1-8b-SFT

8B • Updated Apr 4, 2025

sravanthib/RL-tuned-toolcalls-100records

8B • Updated Apr 2, 2025 • 1

sravanthib/new-Qwen2.5-7B-Base-GRPO

Updated Apr 2, 2025

sravanthib/Qwen2.5-7B-Base-GRPO

Updated Apr 2, 2025

sravanthib/with_deepspeed_llama_RL_on_SFT

Updated Apr 1, 2025

sravanthib/Qwen-2.5-7B-Base-Only-RL-without-SFT

Updated Mar 29, 2025

sravanthib/function_calling_RL

Updated Mar 24, 2025

sravanthib/Base-2-Qwen-7B-GRPO

Updated Mar 23, 2025