sravanthi pulijala's picture

sravanthi pulijala

sravanthib

·

AI & ML interests

None yet

Organizations

sravanthib 's models 167

sravanthib/Monday_SFT_and_RLinstruct-Llama-3.1-8B-open-RL

Updated Mar 10, 2025

sravanthib/SFT_and_RLinstruct-Llama-3.1-8B-open-RL

Updated Mar 9, 2025

sravanthib/grpo_finetuned

Updated Mar 9, 2025

sravanthib/weights_sft_new_grpo-output

Updated Mar 9, 2025

sravanthib/Qwen2-0.5B-GRPO-test

Updated Mar 7, 2025

sravanthib/output_Qwen2-0.5B-GRPO-test

Updated Mar 7, 2025

sravanthib/instruct-Llama-3.1-8B-open-RL

Text Generation • 8B • Updated Mar 7, 2025 • 5

sravanthib/checkpoints-Llama3.1-8b-instruct-Final-Simple-RL

Updated Mar 6, 2025

sravanthib/Llama3.1-8b-instruct-Final-Simple-RL

Updated Mar 6, 2025

sravanthib/new_Llama-3.1-8B-open-RL

8B • Updated Mar 5, 2025 • 1

sravanthib/sft-Qwen-2.5-7B-Simple-RL

Updated Mar 4, 2025

sravanthib/new-Llama3.1-8b-instruct-RL

Text Generation • Updated Mar 4, 2025 • 2

sravanthib/final-steps-1Llama-3.1-8B-Instruct-Simple-RL

Updated Mar 2, 2025

sravanthib/Llama-3.1-8B-Instruct-Simple-RL

Updated Mar 2, 2025

sravanthib/Llama-3.1-8B-instruct-Simple-RL-checkpoints

Updated Mar 2, 2025

sravanthib/Llama-3.1-8B-Simple-RL-sravanthi

Updated Mar 2, 2025

sravanthib/Llama-3.1-8B-Instruct-Simple-RL-sravanthi

Updated Mar 2, 2025