zeeshaan-ai
/

solo-tune-test684

Text Generation

text-generation-inference

Model card Files Files and versions

Model Details


Base Model	Qwen/Qwen3-0.6B
Method	LoRA (PEFT)
Parameters	0.6B

Training Hyperparameters


Epochs	2
Max Steps	100
Batch Size	2
Gradient Accumulation	4
Learning Rate	0.0002
LoRA r	4
LoRA Alpha	4
Max Sequence Length	2048
Training Duration	3m

Dataset

_{Trained with Solo}

Downloads last month: 298

Safetensors

Model size

0.6B params

Tensor type

BF16

·

Model tree for zeeshaan-ai/solo-tune-test684

Base model

Qwen/Qwen3-0.6B-Base

Finetuned

Qwen/Qwen3-0.6B

Adapter

(361)

this model

Dataset used to train zeeshaan-ai/solo-tune-test684