Qwen3-4B SFT v9 Clean Direct
概要
- ベースモデル: Qwen/Qwen3-4B-Instruct-2507
- データセット: merged_dataset_final_clean.jsonl (1500 samples)
- 戦略: CoT除去済みクリーンデータ直接使用
設定
- LoRA r: 64
- LoRA alpha: 64
- Learning rate: 5e-05
- Epochs: 2
- Batch size: 8
- Max seq length: 1024
特徴
- Person Y のデータクリーニングパイプラインで処理
- CoT(Approach/Output)完全削除
- 構文検証済みデータのみ使用
- Empty Think Injection なし
フォーマット分布
- csv: 300
- json: 300
- toml: 300
- xml: 300
- yaml: 300
- Downloads last month
- 1
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support
Model tree for kmd2525/qwen3-4b-sft-v9-clean-direct-merged
Base model
Qwen/Qwen3-4B-Instruct-2507