kmd2525
/

qwen3-4b-sft-v9-clean-direct-merged

Model card Files Files and versions

Qwen3-4B SFT v9 Clean Direct

概要

ベースモデル: Qwen/Qwen3-4B-Instruct-2507
データセット: merged_dataset_final_clean.jsonl (1500 samples)
戦略: CoT除去済みクリーンデータ直接使用

設定

LoRA r: 64
LoRA alpha: 64
Learning rate: 5e-05
Epochs: 2
Batch size: 8
Max seq length: 1024

特徴

Person Y のデータクリーニングパイプラインで処理
CoT（Approach/Output）完全削除
構文検証済みデータのみ使用
Empty Think Injection なし

フォーマット分布

csv: 300
json: 300
toml: 300
xml: 300
yaml: 300

Downloads last month: 1

Safetensors

Model size

4B params

Tensor type

BF16

·

Inference Providers NEW

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for kmd2525/qwen3-4b-sft-v9-clean-direct-merged

Base model

Qwen/Qwen3-4B-Instruct-2507

Finetuned

(1541)

this model