sravanthi pulijala's picture

sravanthi pulijala

sravanthib

·

AI & ML interests

None yet

Organizations

sravanthib 's models 167

sravanthib/Base-Qwen-7B-GRPO

Updated Mar 23, 2025

sravanthib/llama-toolcall

Updated Mar 21, 2025

sravanthib/non-math-Simple-RL

8B • Updated Mar 20, 2025 • 1

sravanthib/qwen-base-RL

Updated Mar 20, 2025

sravanthib/Qwen-base-open-RL

Updated Mar 20, 2025

sravanthib/tool_llama_test

Updated Mar 20, 2025

sravanthib/qwen-72b-base

Updated Mar 19, 2025

sravanthib/with_accelarate_output_Qwen2-0.5B-GRPO-test

Updated Mar 19, 2025

sravanthib/Qwen-GRPO

Updated Mar 17, 2025

sravanthib/new-Qwen-2.5-7b-non-math-Simple-RL

Updated Mar 16, 2025

sravanthib/Qwen-2.5-7b-non-math-Simple-RL

8B • Updated Mar 16, 2025 • 1

sravanthib/Llama-Simple-RL

8B • Updated Mar 16, 2025 • 1

sravanthib/Last-Llama-Simple-RL

Updated Mar 15, 2025

sravanthib/llama3-8b-math-solver

Updated Mar 15, 2025

sravanthib/Last-Qwen-2.5-7B-Simple-RL

8B • Updated Mar 15, 2025 • 1

sravanthib/Qwen-2.5-7B-Simple-RL

Text Generation • 8B • Updated Mar 15, 2025 • 1

sravanthib/Qwen-math-open-RL

Updated Mar 14, 2025

sravanthib/Qwen-math-Simple-RL

Updated Mar 14, 2025

sravanthib/qwen-32b-multinode-try

Updated Mar 13, 2025

sravanthib/new-multinode-try

Updated Mar 13, 2025

sravanthib/multinode-try

Updated Mar 13, 2025

sravanthib/with_accelerate_output_Qwen2-0.5B-GRPO-test

Updated Mar 13, 2025

sravanthib/tokenizer-aded-Llama3.1-8b-instruct-RL

Updated Mar 13, 2025

sravanthib/single_node_llama_custom-code-test

Updated Mar 12, 2025

sravanthib/Final-try-Llama3.1-8b-instruct-RL

Text Generation • 8B • Updated Mar 11, 2025 • 3

sravanthib/grpo-output

Updated Mar 11, 2025

sravanthib/Simple-RL

Updated Mar 11, 2025

sravanthib/SFT_and_RL_final-Simple-RL

Updated Mar 10, 2025

sravanthib/llama-3b-Simple-RL

Updated Mar 10, 2025

sravanthib/RL_on_SFT

Updated Mar 10, 2025